|
|
Регистрация Восстановить пароль |
Повторная активизация e-mail |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
|
Опции темы | Поиск в этой теме |
13.09.2016, 08:39 | #1 |
Пользователь
Регистрация: 07.03.2016
Сообщений: 16
|
Обработка капчи
Под свои нужды, написал простенький парсер выдачи гугла.
Всё гуд, пока не доходит очередь до капчи, не могу её обработать никак. Надо с начало как-то, 504 ошибку обработать, а потом ещё и саму кпчу. У меня на 504 ошибке софт сам останавливается и вырубается. Кто уже с этим работал, поделитесь, плз, инфой или куском кода. ПЛЫ-Ы-Ы-З |
13.09.2016, 08:51 | #2 |
Старожил
Регистрация: 12.01.2011
Сообщений: 19,500
|
Ну видимо вы так написали свой софт.
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом. |
13.09.2016, 09:40 | #3 |
Пользователь
Регистрация: 07.03.2016
Сообщений: 16
|
извиняюсь, ошибся. Не 504, а 503 ошибка.
Перед тем, как выдать страницу с капчей, гугл отправляет 503 ошибку. |
13.09.2016, 10:11 | #4 |
Старожил
Регистрация: 09.01.2008
Сообщений: 26,229
|
точно. Гугл не любит, когда к нему идёт много запросов в единицу времени.
Он сразу подозревает, что работает какое-то зловредное ПО и блокирует запросы до того, как будет корректно введена капча. Вы уверены, что Вам остро необходимо "дёргать" поисковик гугла из своей программы? p.s. по сути вопроса: как обойти капчу я не знаю... |
13.09.2016, 10:19 | #5 |
Старожил
Регистрация: 12.01.2011
Сообщений: 19,500
|
Так автор же "обработать" хотел, а не обойти.
Это делается либо отправкой капчи на сервис типа антикапчи, либо для простых капч OCR (Tesseract, Finereader, что-то свое, ...)
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом. |
13.09.2016, 10:36 | #6 |
Старожил
Регистрация: 09.01.2008
Сообщений: 26,229
|
ну да. я это ( в том числе ) и имел в виду под "обойти"...
А ещё я хотел сказать, что, вполне возможно, что это не даст требуемого результата. Очень вероятно (не проверял, но допускаю), что если поток запросов не будет уменьшаться, то, после нескольких вводов капчи, гугл вполне может предпринять следующие шаги - вплоть до полной блокировки на время запросов с данного IP... Последний раз редактировалось Serge_Bliznykov; 13.09.2016 в 10:38. |
13.09.2016, 10:54 | #7 |
Пользователь
Регистрация: 07.03.2016
Сообщений: 16
|
|
13.09.2016, 10:57 | #8 |
Старожил
Регистрация: 28.01.2009
Сообщений: 21,000
|
те кому надо распознавать сильные капчи часто пользуются антигейтом.
про чтение капчи, читайте про разбор текста с картинки, инфы про это много. Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
Программа делает то что написал программист, а не то что он хотел. Функции/утилиты ждут в параметрах то что им надо, а не то что вы хотите. |
13.09.2016, 11:15 | #9 |
Старожил
Регистрация: 12.01.2011
Сообщений: 19,500
|
Вы хотите чтобы за вас написали код? Тогда во Фриланс за вознаграждение.
Что делать с капчей вам уже сказали. Если "на 504 ошибке софт сам останавливается и вырубается", то значит вы так сделали в своем софте, само ничего не бывает. Читайте документацию по вашему HTTP клиенту, обрабатывайте ошибку (обычно с помощью try catch).
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом. |
13.09.2016, 11:30 | #10 |
Старожил
Регистрация: 09.01.2008
Сообщений: 26,229
|
да так капча не очень "сильная".
вот такая: captha.png а страничка выглядит при этом примерно так: google_page_captcha.png |
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Распознавание капчи | JustForLife | Фриланс | 1 | 10.09.2016 19:23 |
Распознавание капчи | bilibian | Общие вопросы Delphi | 3 | 16.07.2014 23:46 |
Распознание капчи | Arsenx777 | Общие вопросы Delphi | 36 | 26.01.2014 21:20 |
КОПИРОВАНИЕ КАПЧИ!!!! | daitedeneg | Софт | 0 | 30.11.2009 04:30 |