Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > C/C++ программирование > Общие вопросы C/C++
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 27.04.2010, 11:38   #1
mar4elo
Форумчанин
 
Регистрация: 17.04.2008
Сообщений: 146
Хорошо Парсинг WEB ресурса

Добрый день требуется написать программу для сканирования сайтов.
В программе хранятся адреса ресурсов, требуется каждый из них просканировать на предмет совпадения с ключевым словом. Далее вывести адреса страниц которые подходят критериям поиска.
Вопрос: если сайт реализовани на PHP, то вссе данные хранятся в БД, как мне просканировать все страницы ресурса.
Помогите кто чем может. В C++ неселен.... переквалификация с Delphi на C++
mar4elo вне форума Ответить с цитированием
Старый 27.04.2010, 20:58   #2
Виталий Желтяков
Старожил
 
Аватар для Виталий Желтяков
 
Регистрация: 19.04.2010
Сообщений: 2,702
По умолчанию

Есть такая хорошая программа - Offline Explorer.
Виталий Желтяков вне форума Ответить с цитированием
Старый 28.04.2010, 00:09   #3
mar4elo
Форумчанин
 
Регистрация: 17.04.2008
Сообщений: 146
По умолчанию

пишу программу для себя... для изучения.... так что нужна теория!
mar4elo вне форума Ответить с цитированием
Старый 28.04.2010, 07:14   #4
p51x
Старожил
 
Регистрация: 15.02.2010
Сообщений: 15,709
По умолчанию

Цитата:
если сайт реализовани на PHP, то вссе данные хранятся в БД
Ой, не совсем верное представление у вас о PHP...

Цитата:
как мне просканировать все страницы ресурса
Искать ссылки. Запрашивать их у сервера и сохранять.
p51x вне форума Ответить с цитированием
Старый 28.04.2010, 09:01   #5
ozo
Форумчанин
 
Аватар для ozo
 
Регистрация: 26.04.2010
Сообщений: 328
По умолчанию

Могу посоветовать библиотеку curl для C
Используй гугль, будь счастлив
hackme@yandex.ru
Блог об archlinux
ozo вне форума Ответить с цитированием
Старый 28.04.2010, 12:49   #6
mar4elo
Форумчанин
 
Регистрация: 17.04.2008
Сообщений: 146
По умолчанию

суть такая поьзователь вводит сайт programmersforum.ru и ключевое слово для поиска, программа автомотом сканирует все страницы сайта и выводит результат ссылки на страницы где есть совподение.....
mar4elo вне форума Ответить с цитированием
Старый 28.04.2010, 15:57   #7
ozo
Форумчанин
 
Аватар для ozo
 
Регистрация: 26.04.2010
Сообщений: 328
По умолчанию

оу, ну так рекурсивно следуешь по всем ссылкам( указывающим на site.name ) которые можешь найти на site.name и ищешь совпадение в тексте

Но я чувствую, что будет это не быстро )

UPD: посещенные страницы, тоже было бы неплохо запоминать =)
Используй гугль, будь счастлив
hackme@yandex.ru
Блог об archlinux

Последний раз редактировалось ozo; 28.04.2010 в 17:41.
ozo вне форума Ответить с цитированием
Старый 28.04.2010, 17:42   #8
mar4elo
Форумчанин
 
Регистрация: 17.04.2008
Сообщений: 146
По умолчанию

вот вот..... но есть пару задумок... пользователь указал сайт.. программа составило дерево ссылок с названиями категорий... а далее искать только в тех категориях которые надо
mar4elo вне форума Ответить с цитированием
Старый 28.04.2010, 17:43   #9
mar4elo
Форумчанин
 
Регистрация: 17.04.2008
Сообщений: 146
По умолчанию

а ссылки уже хранить в БД
mar4elo вне форума Ответить с цитированием
Старый 28.04.2010, 17:44   #10
mar4elo
Форумчанин
 
Регистрация: 17.04.2008
Сообщений: 146
По умолчанию

Цитата:
ну так рекурсивно следуешь по всем ссылкам( указывающим на site.name ) которые можешь найти на site.name
Пожалуйста поподробней
mar4elo вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Загрузка ресурса в RichEdit Volkogriz Общие вопросы Delphi 3 05.06.2014 08:57
Запись файла на ПК с веб ресурса PVD Общие вопросы Delphi 11 27.04.2010 16:23
Замена ресурса (\ов) forusing Общие вопросы C/C++ 4 30.03.2010 20:07
Как открыть файл из ресурса VladimirVB Общие вопросы Delphi 5 20.08.2009 21:18
Извлечение ресурса в файл JivotiK Общие вопросы Delphi 1 26.04.2007 11:48