Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > .NET Frameworks (точка нет фреймворки) > C# (си шарп)
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 13.09.2016, 08:39   #1
nomerasd
Пользователь
 
Регистрация: 07.03.2016
Сообщений: 16
По умолчанию Обработка капчи

Под свои нужды, написал простенький парсер выдачи гугла.
Всё гуд, пока не доходит очередь до капчи, не могу её обработать никак.
Надо с начало как-то, 504 ошибку обработать, а потом ещё и саму кпчу.
У меня на 504 ошибке софт сам останавливается и вырубается.
Кто уже с этим работал, поделитесь, плз, инфой или куском кода.
ПЛЫ-Ы-Ы-З
nomerasd вне форума Ответить с цитированием
Старый 13.09.2016, 08:51   #2
Alex11223
Старожил
 
Аватар для Alex11223
 
Регистрация: 12.01.2011
Сообщений: 19,500
По умолчанию

Цитата:
Сообщение от nomerasd Посмотреть сообщение
У меня на 504 ошибке софт сам останавливается и вырубается.
Ну видимо вы так написали свой софт.
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом.
Alex11223 вне форума Ответить с цитированием
Старый 13.09.2016, 09:40   #3
nomerasd
Пользователь
 
Регистрация: 07.03.2016
Сообщений: 16
По умолчанию

извиняюсь, ошибся. Не 504, а 503 ошибка.
Перед тем, как выдать страницу с капчей, гугл отправляет 503 ошибку.
nomerasd вне форума Ответить с цитированием
Старый 13.09.2016, 10:11   #4
Serge_Bliznykov
Старожил
 
Регистрация: 09.01.2008
Сообщений: 26,229
По умолчанию

точно. Гугл не любит, когда к нему идёт много запросов в единицу времени.
Он сразу подозревает, что работает какое-то зловредное ПО и блокирует запросы до того, как будет корректно введена капча.

Вы уверены, что Вам остро необходимо "дёргать" поисковик гугла из своей программы?

p.s. по сути вопроса: как обойти капчу я не знаю...
Serge_Bliznykov вне форума Ответить с цитированием
Старый 13.09.2016, 10:19   #5
Alex11223
Старожил
 
Аватар для Alex11223
 
Регистрация: 12.01.2011
Сообщений: 19,500
По умолчанию

Цитата:
Сообщение от Serge_Bliznykov Посмотреть сообщение
как обойти капчу я не знаю...
Так автор же "обработать" хотел, а не обойти.
Это делается либо отправкой капчи на сервис типа антикапчи, либо для простых капч OCR (Tesseract, Finereader, что-то свое, ...)
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом.
Alex11223 вне форума Ответить с цитированием
Старый 13.09.2016, 10:36   #6
Serge_Bliznykov
Старожил
 
Регистрация: 09.01.2008
Сообщений: 26,229
По умолчанию

Цитата:
Сообщение от Alex11223 Посмотреть сообщение
Так автор же "обработать" хотел, а не обойти.
ну да. я это ( в том числе ) и имел в виду под "обойти"...

А ещё я хотел сказать, что, вполне возможно, что это не даст требуемого результата. Очень вероятно (не проверял, но допускаю), что если поток запросов не будет уменьшаться, то, после нескольких вводов капчи, гугл вполне может предпринять следующие шаги - вплоть до полной блокировки на время запросов с данного IP...

Последний раз редактировалось Serge_Bliznykov; 13.09.2016 в 10:38.
Serge_Bliznykov вне форума Ответить с цитированием
Старый 13.09.2016, 10:54   #7
nomerasd
Пользователь
 
Регистрация: 07.03.2016
Сообщений: 16
По умолчанию

Цитата:
Сообщение от Serge_Bliznykov Посмотреть сообщение
то, после нескольких вводов капчи, гугл вполне может предпринять следующие шаги - вплоть до полной блокировки на время запросов с данного IP...
это уже совсем другой вопрос.
сейчас надо решить с начало с капчей.
что, никто не писал ничего под выдачу гугла?!
nomerasd вне форума Ответить с цитированием
Старый 13.09.2016, 10:57   #8
Пепел Феникса
Старожил
 
Аватар для Пепел Феникса
 
Регистрация: 28.01.2009
Сообщений: 21,000
По умолчанию

те кому надо распознавать сильные капчи часто пользуются антигейтом.

про чтение капчи, читайте про разбор текста с картинки, инфы про это много.
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
Программа делает то что написал программист, а не то что он хотел.
Функции/утилиты ждут в параметрах то что им надо, а не то что вы хотите.
Пепел Феникса вне форума Ответить с цитированием
Старый 13.09.2016, 11:15   #9
Alex11223
Старожил
 
Аватар для Alex11223
 
Регистрация: 12.01.2011
Сообщений: 19,500
По умолчанию

Цитата:
Сообщение от nomerasd Посмотреть сообщение
что, никто не писал ничего под выдачу гугла?!
Вы хотите чтобы за вас написали код? Тогда во Фриланс за вознаграждение.

Что делать с капчей вам уже сказали.
Если "на 504 ошибке софт сам останавливается и вырубается", то значит вы так сделали в своем софте, само ничего не бывает. Читайте документацию по вашему HTTP клиенту, обрабатывайте ошибку (обычно с помощью try catch).
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом.
Alex11223 вне форума Ответить с цитированием
Старый 13.09.2016, 11:30   #10
Serge_Bliznykov
Старожил
 
Регистрация: 09.01.2008
Сообщений: 26,229
По умолчанию

да так капча не очень "сильная".

вот такая:
captha.png

а страничка выглядит при этом примерно так:
google_page_captcha.png
Serge_Bliznykov вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Распознавание капчи JustForLife Фриланс 1 10.09.2016 19:23
Распознавание капчи bilibian Общие вопросы Delphi 3 16.07.2014 23:46
Распознание капчи Arsenx777 Общие вопросы Delphi 36 26.01.2014 21:20
КОПИРОВАНИЕ КАПЧИ!!!! daitedeneg Софт 0 30.11.2009 04:30