![]() |
|
|
Регистрация Восстановить пароль |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
![]() |
|
Опции темы
![]() |
Поиск в этой теме
![]() |
![]() |
#1 |
Регистрация: 05.05.2010
Сообщений: 3
|
![]()
Доброго времени!
В переменной string хранится html код страницы http://www.illuzion.ru/program/russia/ Нужно распарсить таблицу с дальнейшим занесением в бд. Я начинающий, поэтому сильно не пинайте, а лучше помогите конструктивно решить проблему. |
![]() |
![]() |
![]() |
#2 |
Старожил
Регистрация: 28.01.2009
Сообщений: 21,000
|
![]()
примеров парсинга очень много, я лично писал их не мало.
вот если бы вы выложили ваши попытки то это иное дело. Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
Программа делает то что написал программист, а не то что он хотел. Функции/утилиты ждут в параметрах то что им надо, а не то что вы хотите. |
![]() |
![]() |
![]() |
#3 |
Регистрация: 05.05.2010
Сообщений: 3
|
![]()
Я пока новичок и особо не обладаю... Пару дней назад я знал чего хочу и совсем не знал с чего начать, по-сему все что я сделал пока, это научился добывать необходимый мне html код разными способами (idhttp, twebbrowser), а вот парсить его, для меня это кажется пока непосильной задачей... по приведенной выше ссыли мне нужно выдернуть данные из таблицы (время сеанса, название фильма, стоимость билетов и т.д) и вписать результаты в БД через адо, хотя с последним разберусь сам. Сейчас изучаю регулярные выражения, думаю на правильном пути... еще установил JVCL, но мне пока еще не ясно как работать с jvHTMLParser (только начал разбираться), а самое главное надеюсь на вашу помощь, желательно в примерах.
|
![]() |
![]() |
![]() |
#4 |
Форумчанин
Регистрация: 18.10.2010
Сообщений: 419
|
![]()
итак, план таков:
данные, которые вам нужны, поскольку это html-таблица, они полюбому заключены между какими-то тегами html, как минимум <td></td>, но теги могут быть по-разному написаны, например <td border=1></td>, тот же <td></td>, но строка уже другая. как правило - рутинная информация каждый раз будет между одними и теми-же тегами. вообще, между какими тегами будет ваша информация, и насколько они будут постоянны (не будут меняться) - зависит от креативности програмиста, который создавал страницу. самый простой способ для вас - выяснить между какими тегами сидит нужная вам информация. по-идее для этого нужно хорошо знать html, но если проявить смекалку, то можно обойтись минимальными знаниями. как это сделать: html-текст, который вы получили сохраняете в *.htm, открываете его в браузере и в блокноте. в браузере копируете нужный вам текст, например название фильма "Превед-Медвед!" и ищете это сочетание в html-тексте, который вы открыли в блокноте. и в том тексте, среди прочего хлама вы найдете например такую строку: <tr><td><style=movie>Превед-Медвед!</style></td><td><style=price>500р</style></td></tr> то что вы искали будет выделено. напомню что то, что что вы найдете в тексте зависит от креативности создателей сайта. в моем случае нужная вам информация заключена между тегами название фильма - <style=movie> и </style> цена - <style=price> и </style> в вашем случае будут другие теги, но смысл такой же. а дальше забудьте что перед вами html, вооружитесь функциями по работе со строками и дерзайте! =) будет сложнее, если создатели сайта черезчур креативные и теги постоянно меняются - тогда вам остается либо подстраиваться каждый раз под новые теги, либо писать что-то более универсальное. что-то мне подсказывает, что вам будет проще подстраиваться... |
![]() |
![]() |
![]() |
#5 |
я получил эту роль
Старожил
Регистрация: 25.05.2007
Сообщений: 3,694
|
![]()
В Советской России таблицы верстают блоками
![]() Код:
пыщь
|
![]() |
![]() |
![]() |
![]() |
||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Парсинг статистики | Shouldercannon | Работа с сетью в Delphi | 1 | 31.01.2010 11:53 |
MDIChild снова и снова... | Siber_Dec | Общие вопросы Delphi | 2 | 13.12.2009 03:24 |
снова про парсинг | spl1nter | Работа с сетью в Delphi | 4 | 02.12.2009 22:45 |
Парсинг сайта | AnToHa-KiLL | Общие вопросы Delphi | 3 | 30.06.2009 08:22 |
HTML Парсинг | BaikalLord | Помощь студентам | 5 | 15.12.2008 08:20 |