|
|
Регистрация Восстановить пароль |
Повторная активизация e-mail |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
Опции темы | Поиск в этой теме |
05.09.2010, 20:55 | #1 |
Пользователь
Регистрация: 19.01.2008
Сообщений: 92
|
Автопарсер гугла, пофиксить баги
Здраствуйте. Нужно разобраться с багами, прога ведет себя странно. Суть такая - ложим список запросов, жмем и в большое поле парсяца линки по этим запросам. Берется 1й запрос, парсит 10 линков, листает страницу, еще 10 и так до 100 или пока не окнчатся страницы, после этого берем 2й кеи и повторяется то что выше. Ну и на ходу удаляет дубли по домену. Проблемы такие - парсилось, напарсено более 1к линков, 3й кеи по счету, потом все линки удаляются и парсит дальше, 5й кеи - напарсено линков 30-40..куда пропали хз. Бывает останавливается посреди списка и ничего не делает. Ну и результаты когда спарсено не пишет "готово" почемуто. Бывает парсит и тоже в середине списка останавливается, в дебагере пишет поток остановлен. Бан тоже непонятно когда бывает. Таймаур перед перелистыванием страницы рандом от 10 до 30 сек, и куки чистит постоянно. Седня спарсило много потом бан был..1 раз всего. При 5 секундном таймауте бан моментальный. ВОбщем, подскажите, изза чего криво работает, код простейший не могу найти что криво.
процедура удаления дублей Код:
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Не могу отключить блок от гугла | sma777 | HTML и CSS | 1 | 06.07.2010 14:32 |
Не могу отключить блок от гугла | sma777 | JavaScript, Ajax | 2 | 04.07.2010 14:27 |
Киньте пример граббера линков опред. запросов с гугла на делфи | zotox | Помощь студентам | 0 | 03.09.2009 15:19 |