|
|
Регистрация Восстановить пароль |
Повторная активизация e-mail |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
|
Опции темы | Поиск в этой теме |
13.10.2013, 12:32 | #1 |
Пользователь
Регистрация: 13.10.2013
Сообщений: 15
|
Как спарсить информацию в спойлере?
Здравствуйте, у меня такая проблема:
1) Нужно спарсить информацию в спойлере, но пока не откроешь спойлер, то не спарсишь. (причем нужно спарсить все спойлеры на странице) - Как я понимаю, чтобы спарсить, нужно открывать программно все спойлеры на странице, и парсить, но как открыть я беспонятия Пример вот тут, оттуда нужно спарсить содержимое всех спойлеров. вид содержимого спойлера что-то вроде: Код HTML:
<embed src="http://video.rutube.ru/321c98ea1b9d8604c9d2cc108414d0d7" type="application/x-shockwave-flash" wmode="window" allowfullscreen="true" height="450" width="600">
Код HTML:
[spoiler=Тут название спойлера][center]Тут содержимое спойлера[/center][/spoiler] |
13.10.2013, 15:00 | #2 |
Форумчанин
Регистрация: 16.03.2013
Сообщений: 599
|
Если информация грузится динамически по мере нажатия джава-скриптами - надо использовать TWebBrowser и оттуда брать текст уже после перехода на конкретную страницу и перещелкав все что надо.
Сам 2 недели назад бот один писал для сайта, иначе никак. TIdHttp не умеет работать с скриптами. А как парсить - уже дело твое. В интернете куча способов, я же писал алгоритм на основе pos'ов. Про сумму строк в дельфях и как к отпарсеной инфе пару слов добавить - промолчу.
alextrof94$gmail.com
|
13.10.2013, 17:58 | #3 | |
Пользователь
Регистрация: 13.10.2013
Сообщений: 15
|
Цитата:
|
|
13.10.2013, 18:16 | #4 |
Далеко не
Участник клуба
Регистрация: 11.08.2011
Сообщений: 1,512
|
alextrof94, отличный метод, для новичка самое то.
Берешь Thttpsend грузишь страницу, Tregexpr'ом парсишь все, что тебе угодно и откуда подгружается и куда, и зачем. |
13.10.2013, 20:36 | #5 |
Форумчанин
Регистрация: 16.03.2013
Сообщений: 599
|
Я где то тут про js обновляемые страницы спрашивал и про то как с этим работать. BDA ответил, что tidhttp с js не работает, а вот через wb это осуществить легко и просто.
alextrof94$gmail.com
|
13.10.2013, 21:12 | #6 | |
Старожил
Регистрация: 30.12.2009
Сообщений: 11,426
|
Цитата:
|
|
14.10.2013, 03:07 | #7 | |
Форумчанин
Регистрация: 16.03.2013
Сообщений: 599
|
Цитата:
"Если информация грузится динамически по мере нажатия джава-скриптами - надо использовать TWebBrowser и оттуда брать текст уже после перехода на конкретную страницу и перещелкав все что надо." Я имел ввиду программно выполнить щелчки по нужным "спойлерам". UPD: Ой, сори, Человек_Борща, я увидел мое имя в начале и подумал мне адресовано =)
alextrof94$gmail.com
|
|
14.10.2013, 05:11 | #8 |
Далеко не
Участник клуба
Регистрация: 11.08.2011
Сообщений: 1,512
|
Человек_Борща, почему же не прокатит? если url подгрузки можно спарсить, то можно.
|
14.10.2013, 11:08 | #9 | ||
Старожил
Регистрация: 30.12.2009
Сообщений: 11,426
|
Цитата:
Цитата:
Последний раз редактировалось Человек_Борща; 14.10.2013 в 11:11. |
||
14.10.2013, 16:56 | #10 |
Форумчанин
Регистрация: 22.12.2010
Сообщений: 175
|
А можно просто разобрать все скрипты, подумать, и сообразить с idhttp
Здравствуйте
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Скрипт конвертера валют или как корректно спарсить xml | miscwrk | JavaScript, Ajax | 1 | 22.04.2012 06:11 |
[Вопрос] Как спарсить ссылки которые выдаёт поисковик | O'NeiLL | Общие вопросы Delphi | 8 | 15.03.2012 19:45 |
Как получить информацию о БД? | Belarus | SQL, базы данных | 1 | 14.07.2010 19:09 |
Как считать информацию с CD\DVD? | Bullterrier | Общие вопросы Delphi | 3 | 12.01.2010 00:13 |
как загружать информацию с сайта | lg12 | Работа с сетью в Delphi | 2 | 05.08.2009 15:24 |