|
|
Регистрация Восстановить пароль |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
Опции темы | Поиск в этой теме |
15.07.2011, 18:50 | #1 |
Форумчанин
Регистрация: 25.02.2009
Сообщений: 113
|
Парсер ссылок HTML
Вот выпиливаю из страниц ссылочки. И встал вопрос в плане алгоритма. Как наиболее лучше из тега <a> достать ссылки, а также как это сделать в нескольких потоках для ускорения процесса?
|
15.07.2011, 18:52 | #2 | |
Старожил
Регистрация: 09.01.2008
Сообщений: 26,229
|
ссылки можно доставать через регулярные выражения.
Цитата:
|
|
15.07.2011, 18:53 | #3 |
Старожил
Регистрация: 28.01.2009
Сообщений: 21,000
|
1)довольно хорошо подходят регулярки, пример есть в MSDN.
2)ну значит несколько страниц и соответственно каждой странице по потоку(ну или не каждой странице, решение ваше) Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
Программа делает то что написал программист, а не то что он хотел. Функции/утилиты ждут в параметрах то что им надо, а не то что вы хотите. |
15.07.2011, 20:30 | #4 |
Участник клуба
Регистрация: 03.05.2007
Сообщений: 1,189
|
Код:
|
14.09.2015, 21:15 | #5 |
Регистрация: 14.12.2012
Сообщений: 4
|
Посмотрите в сторону Html Agility Pack
я собрал все что мне помогло по теме здесь PS профессионалы не рекомендуют использовать для этих задач регулярные выражения (Внеклассное чтение) |
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Парсер HTML страницы | kardinal94 | Работа с сетью в Delphi | 1 | 21.08.2010 13:06 |
Мне бы прогу (парсер html) | CEBEPok | Фриланс | 11 | 30.07.2010 22:14 |
Парсер из HTML в CSV. | OJI | HTML и CSS | 5 | 09.09.2009 19:59 |
xpath html парсер | volok-aleksej | Qt и кроссплатформенное программирование С/С++ | 0 | 19.05.2009 16:17 |
парсер (сбор ссылок с сайта) | AlexMenco | Фриланс | 9 | 24.02.2009 19:39 |