Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Java программирование > Общие вопросы по Java, Java SE, Kotlin
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 06.11.2011, 15:48   #1
dmitry_dp
Новичок
Джуниор
 
Регистрация: 06.11.2011
Сообщений: 1
Лампочка Программа для парсинга HTML страницы

Моя задача состоит в том чтобы я написал программу в которой вводишь URL и она заходит на эту страницу и ищет там ссылки <a href и вытягивает http://google.com потом записывает ссылку эту в файл и в конца у нас в файле есть все ссылки с страницы потом она берет эти ссылки,заходит по ним и ищет в них уже новые ссылки и так в 5 слоев... Выходит некое дерево! Я уже реализовал коннект к сайту и запись всего содержимого в файл контента... моя задача теперь распарсить либо файл, либо сразу входной поток! препод говорил юзать регулярки! Но я не пойму ведь регулярные проверяют на валидность имя пользователя или мыло или адресс а не целый HTML документ, или можно делать поиск по регулярным ? хотя можно с таким успехом подстроку в строке где начало <a href

Кто подскажет как решить проблему ?
dmitry_dp вне форума Ответить с цитированием
Старый 08.11.2011, 11:47   #2
ddima
Пользователь
 
Регистрация: 15.12.2009
Сообщений: 11
По умолчанию

Цитата:
Сообщение от dmitry_dp Посмотреть сообщение
хотя можно с таким успехом подстроку в строке где начало <a href
а если у тебя встретится такое начало ссылки <a class="cl1" href ?
Скачай книжку называется "Регулярные выражения". Там все доступно описано.
ddima вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Регулярка для парсинга ссылки MyXa PHP 1 03.11.2011 15:11
Нужен скрипт для парсинга 111Alex111 Фриланс 2 19.09.2011 22:57
Программа для подсчета количества посещения моей страницы кем-то из друзей. Kasper1 Свободное общение 8 03.09.2011 22:29
Компоненты для парсинга страниц!!! $T@LKER Работа с сетью в Delphi 14 20.02.2011 17:17
Программа для парсинга описаний chilinik Общие вопросы Delphi 2 07.10.2009 10:17