Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > .NET Frameworks (точка нет фреймворки) > Общие вопросы .NET
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 24.02.2009, 07:59   #1
Лубышев
Участник клуба
 
Аватар для Лубышев
 
Регистрация: 23.07.2007
Сообщений: 1,054
Вопрос Запрос поисковой системе

Мне поставили очень сложную, н мой взгляд, задачу, и я не знаю даже с чего начать.
Мне нужно как то программно научиться обращается к интерфейсу поисковых систем интернета (типа google, yandex и т.д.) причем это сделать параметрические (то есть с каким то параметром).
То есть программа, реализованная на C# должна задавать запросы поисковой системе.
Писано по д'Эльфийски
Лубышев вне форума Ответить с цитированием
Старый 24.02.2009, 11:58   #2
rpy3uH
добрый няша
Старожил
 
Аватар для rpy3uH
 
Регистрация: 29.10.2006
Сообщений: 4,804
По умолчанию

а чего тут сложного для google так
__http://www.google.ru/search?q=program
поиск по слову program, если слово не английское, то надо через коды символов (Unicode, если не ошибаюсь)
__http://www.google.ru/search?q=%D0%BF%D1%80%D0%BE%D0%B3%D 1%80%D0%B0%D0%BC%D0%BC%D0%B0
запрос по слову "программа"

если яндекс, то так
__http://yandex.ru/yandsearch?text=program
__http://yandex.ru/yandsearch?text=%D0%BF%D1%80%D0%BE% D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

Все остальные параметры опционально. Делаешь несколько запросов и не трудно понять, какой параметр за что отвечает.
rpy3uH вне форума Ответить с цитированием
Старый 24.02.2009, 12:07   #3
Лубышев
Участник клуба
 
Аватар для Лубышев
 
Регистрация: 23.07.2007
Сообщений: 1,054
По умолчанию

Мне просто нужно получить программно список ссылок, которые найдены поисковой системой по данному запросу.
Писано по д'Эльфийски
Лубышев вне форума Ответить с цитированием
Старый 24.02.2009, 12:13   #4
OrdJONY
.NET-чик
Форумчанин
 
Аватар для OrdJONY
 
Регистрация: 24.03.2007
Сообщений: 569
По умолчанию

а потом нужно парсить страничку=) Как вариант еще можно выделять кусок страницы где ссылки и загонять в XDocument а там уже использовать LINQ для поиска
"Разработка под веб - как работа с пылесосом: нихрена не прикольно, но засасывает"
Мо маленький городок
OrdJONY вне форума Ответить с цитированием
Старый 24.02.2009, 15:11   #5
Hollander
Участник клуба
 
Аватар для Hollander
 
Регистрация: 03.05.2007
Сообщений: 1,189
По умолчанию

Только учти, что на странице результатов есть ссылки на другие ресурсы(типа помощь, реклама и т.д.). Тут нужно смотреть саму специфику страницы результатов.
Hollander вне форума Ответить с цитированием
Старый 27.02.2009, 00:34   #6
Viteef
stopfake.org
Участник клуба
 
Регистрация: 03.05.2007
Сообщений: 1,927
По умолчанию

Цитата:
Сообщение от Hollander Посмотреть сообщение
Только учти, что на странице результатов есть ссылки на другие ресурсы(типа помощь, реклама и т.д.). Тут нужно смотреть саму специфику страницы результатов.
По стилям можно легко определить. Для гугла - <h3 class=r>.

Может быть такая проблема, если глубоко парсить, можно словить такое
Цитата:
Приносим свои извинения...

... но ваш запрос похож на запросы, автоматически рассылаемые компьютерным вирусом или вредоносным программным обеспечением. В целях защиты наших пользователей мы не можем обработать ваш запрос немедленно.

Мы восстановим ваш доступ в кратчайшие сроки, поэтому повторите попытку через некоторое время. Пока же, если вы считаете, что ваш компьютер или локальная сеть могут быть заражены, то можете запустить приложение для проверки на наличие вирусов или удаления шпионских программ, чтобы убедиться, ваши компьютеры не заражены вирусами или вредоносным ПО.
Viteef вне форума Ответить с цитированием
Старый 02.03.2009, 09:17   #7
Лубышев
Участник клуба
 
Аватар для Лубышев
 
Регистрация: 23.07.2007
Сообщений: 1,054
По умолчанию

Я только вот не пойму, что это за кодировка используется в поисковой системе как в google так и yandex
например слово "привет" кодируется как
Код:
%D0%BF%D1%80%D0%B8%D0%B2%D0%B5%D1%82
Писано по д'Эльфийски
Лубышев вне форума Ответить с цитированием
Старый 02.03.2009, 15:33   #8
Viteef
stopfake.org
Участник клуба
 
Регистрация: 03.05.2007
Сообщений: 1,927
По умолчанию

Для конверта используй функции UrlEncode, UrlDecode.

Последний раз редактировалось Viteef; 02.03.2009 в 15:36.
Viteef вне форума Ответить с цитированием
Старый 16.03.2009, 08:34   #9
Лубышев
Участник клуба
 
Аватар для Лубышев
 
Регистрация: 23.07.2007
Сообщений: 1,054
По умолчанию

Так, с запросами разобрался я. Но мне обьяснили, что парсить страницу - не лучший вариант. Вроде бы можно напрямую обратиться к google и он в ответ выдаст список ссылок.
Писано по д'Эльфийски
Лубышев вне форума Ответить с цитированием
Старый 16.03.2009, 11:48   #10
Viteef
stopfake.org
Участник клуба
 
Регистрация: 03.05.2007
Сообщений: 1,927
По умолчанию

Насчет гугла не в курсе, но у яндекса есть API, можно делать не более 1000 запросов с 1 ip.
Viteef вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Сведенья о системе и железе Djem1991 Общие вопросы Delphi 5 07.02.2009 21:38
Сложение в 23ичной системе счисления Ямагути Общие вопросы C/C++ 6 04.12.2008 21:21
VBA и информация о системе iammajor Microsoft Office Excel 2 07.07.2008 05:48
запрос ссылается на несвязанный с ним запрос kolebatel SQL, базы данных 0 11.06.2008 12:50
Инфа о системе Sargon Работа с сетью в Delphi 2 23.12.2007 00:52