Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > .NET Frameworks (точка нет фреймворки) > C# (си шарп)
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 16.03.2016, 03:23   #1
stu_dent
Пользователь
 
Регистрация: 10.03.2016
Сообщений: 43
По умолчанию Возможно ли реализовать? спарсить код с такой страницы ...

Всем доброго времени суток! Вопрос вот в чём: ...возможно ли спарсить код с такой страницы (view-source:https://*********.com/login) ? именно
(view-source:) ! Если да ,то как это реализовать? Заранее всем спасибо
stu_dent вне форума Ответить с цитированием
Старый 16.03.2016, 03:42   #2
Пепел Феникса
Старожил
 
Аватар для Пепел Феникса
 
Регистрация: 28.01.2009
Сообщений: 21,000
По умолчанию

view-source это просто отображение того что дает адрес после :
тоесть view-source:http://programmersforum.ru/showthread.php?p=1587198
даст исходный код страницы http://programmersforum.ru/showthread.php?p=1587198

вам нужно просто сделать GET запрос на нее.
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
Программа делает то что написал программист, а не то что он хотел.
Функции/утилиты ждут в параметрах то что им надо, а не то что вы хотите.
Пепел Феникса вне форума Ответить с цитированием
Старый 16.03.2016, 03:50   #3
stu_dent
Пользователь
 
Регистрация: 10.03.2016
Сообщений: 43
По умолчанию

Цитата:
Сообщение от Пепел Феникса Посмотреть сообщение
view-source это просто отображение того что дает адрес после :
тоесть view-source:http://programmersforum.ru/showthread.php?p=1587198
даст исходный код страницы http://programmersforum.ru/showthread.php?p=1587198

вам нужно просто сделать GET запрос на нее.
Спасибо, ...да ,я так и делаю ,но там есть скрытые поля и при парсинге они не попадают в результат ( Вообщем при открытии кода страницы - их видно ,включая их содержание ,а вот при парсинге их нет на результате =( Пожалуй лучше объяснить по другому ,вообщем на сайте есть есть скрытый текст - как его получить ,возможно ли спарсить ,есть какой-то способ ?

Последний раз редактировалось stu_dent; 16.03.2016 в 04:21.
stu_dent вне форума Ответить с цитированием
Старый 16.03.2016, 07:51   #4
p51x
Старожил
 
Регистрация: 15.02.2010
Сообщений: 15,709
По умолчанию

Значит не правильно парсите. При парсинге доступны все поля, возможно прийдется повозится если они создаются динамически javascript
p51x вне форума Ответить с цитированием
Старый 16.03.2016, 07:56   #5
Пепел Феникса
Старожил
 
Аватар для Пепел Феникса
 
Регистрация: 28.01.2009
Сообщений: 21,000
По умолчанию

если вы их видите в view-source должны и так.
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
Программа делает то что написал программист, а не то что он хотел.
Функции/утилиты ждут в параметрах то что им надо, а не то что вы хотите.
Пепел Феникса вне форума Ответить с цитированием
Старый 16.03.2016, 14:31   #6
stu_dent
Пользователь
 
Регистрация: 10.03.2016
Сообщений: 43
По умолчанию

Вообщем ,для входа на сайт используется спец. код ,расположен он в форме входа ,но скрыт. При открытии кода страницы - он виден ,но при парсинге страницы входа - его нет. Как - же его добыть? Не могу понять ,помогите плиз =( Вот страница входа : http://www.bkcapper.ru/node
А вот форма с кодом :
stu_dent вне форума Ответить с цитированием
Старый 16.03.2016, 14:48   #7
Alex11223
Старожил
 
Аватар для Alex11223
 
Регистрация: 12.01.2011
Сообщений: 19,500
По умолчанию

Чего нет? Код свой покажите.
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом.
Alex11223 вне форума Ответить с цитированием
Старый 16.03.2016, 14:55   #8
stu_dent
Пользователь
 
Регистрация: 10.03.2016
Сообщений: 43
По умолчанию

в спарсеном коде страницы - нет этого кода для входа на сайт.
Для парсинга использую код:
PHP код:
private void button1_Click(object senderEventArgs e)
        {
            
HttpWebRequest req;
            
HttpWebResponse resp;
            
StreamReader sr;
            
string content;

            
req = (HttpWebRequest)WebRequest.Create("http://www.bkcapper.ru/node");
            
resp = (HttpWebResponse)req.GetResponse();
            
sr = new StreamReader(resp.GetResponseStream(), Encoding.GetEncoding("windows-1251"));
            
content sr.ReadToEnd();
            
sr.Close();


            
textBox1.Text content;
        } 
stu_dent вне форума Ответить с цитированием
Старый 16.03.2016, 15:04   #9
stu_dent
Пользователь
 
Регистрация: 10.03.2016
Сообщений: 43
По умолчанию

сорри - код найден ,понимаю в чём дело =) Другой вопрос - если в адресной строке ,перечёркнут замок и https - что это значит? И опять же ,то что код найден ,не снимает вопроса ,как спарсить ? Дело в том ,что этот сайт ,лишь пример того ,что там в форме входа есть код для авторизации ,я использую другой сайт ,там в адресной строке ,как раз перечёркнуты замок и https красной чертой ,Возможно ли спарсить такую страницу всю целиком ,или из-за зачёркнутого замка и https - это не возможно? Думаю понятно всё объяснил ) Заранее Спасибо!

Последний раз редактировалось stu_dent; 16.03.2016 в 15:13.
stu_dent вне форума Ответить с цитированием
Старый 16.03.2016, 15:31   #10
Alex11223
Старожил
 
Аватар для Alex11223
 
Регистрация: 12.01.2011
Сообщений: 19,500
По умолчанию

Словом "парсинг" обычно называют процесс разбора данных (HTML кода страницы например) для получения оттуда нужной информации.

Для парсинга HTML есть много библиотек. Например HtmlAgilityPack (с помощью языка запросов XPath).


Ну HttpWebRequest вроде и с https умеет работать без проблем.

Только нет смысла показывать не тот сайт который вам нужен, мало ли что там на другом, может JavaScript'ом часть данных генерируется.

И еще вы куки не сохраняете/не отправляете, смотрите CookieContainer.

Цитата:
перечёркнуты замок
Видимо что-то не так с https сертификатом сайта.
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом.
Alex11223 вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Как можно реализовать такой Scroll bar linkoln_7 HTML и CSS 1 18.06.2015 14:26
Вывести HTML код страницы (включая код фрэйм страницы) Lorden PHP 0 04.09.2014 18:21
Как реализовать такой поиск? pеps PHP 3 22.01.2012 18:57
Не могу спарсить код из html Arsenx777 Работа с сетью в Delphi 4 14.10.2011 19:47
Возможно ли создать такой пользовательский формат? motorway Microsoft Office Excel 16 21.05.2010 00:45