Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Клуб программистов > Свободное общение
Регистрация

Восстановить пароль

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 04.09.2013, 17:56   #11
Smitt&Wesson
Старожил
 
Аватар для Smitt&Wesson
 
Регистрация: 31.05.2010
Сообщений: 13,543
По умолчанию

Цитата:
Сообщение от rpy3uH Посмотреть сообщение
В мухостарнске интернет со скоростью 80 Мбит/с стоит примерно 1000 р., так что это не проблема
Тут просто непонятка вышла. Я подумал, что человек хочет поиск устроить со сврего домашнего компа. В третьем посте он пояснил, что у него выделенный сервер и выделенная линия. Вопрос снялся сам собой. ТС не хочет индексировать сайты, ему нужно тупо проскакать по ссылкам и на страничках что-то там найти (иначе говоря - порыбачить).
Пиши пьяным, редактируй трезвым.
Справочник по алгоритмам С++ Builder
Smitt&Wesson вне форума Ответить с цитированием
Старый 05.09.2013, 08:23   #12
myorient
Пользователь
 
Регистрация: 27.05.2013
Сообщений: 24
По умолчанию

Цитата:
Сообщение от Smitt&Wesson Посмотреть сообщение
Тут просто непонятка вышла. Я подумал, что человек хочет поиск устроить со сврего домашнего компа. В третьем посте он пояснил, что у него выделенный сервер и выделенная линия. Вопрос снялся сам собой. ТС не хочет индексировать сайты, ему нужно тупо проскакать по ссылкам и на страничках что-то там найти (иначе говоря - порыбачить).
Нет вы не правы... или я не верно высказался. Мне необходимо индексировать сайты в базу данных. Потом, по запросу пользователей, искать и выдавать ссылки на найденные ресурсы. На хабре нашёл принцип работы такой системы. Но есть вопросы:
Пишу систему на PHP, и тут-же возникает вопрос о времени выполнения скрипта (max_execution_time). Ведь мне нужно чтобы скрипт рекурсивно проходил все ссылки и скачивал страницы, находил ссылки, переходил по ним и опять скачивал страницы...
myorient вне форума Ответить с цитированием
Старый 05.09.2013, 09:30   #13
Smitt&Wesson
Старожил
 
Аватар для Smitt&Wesson
 
Регистрация: 31.05.2010
Сообщений: 13,543
По умолчанию

Если так, то PHP, не самый лучший выбор. Я бы поступил так. Паука, написал-бы на С++. Он обрабатывал бы странички и формировал базу данных. Интерфейс пользователей, написал бы на PHP. Дело в том, что PHP, это интерпретатор и скорость выполнения команд на нём, в разы ниже, чем на компилируемых языках.

У меня нескромный вопрос, а зачем Вам свой поисковик, если есть такие монстры как Гугл и Яндекс?

Есть промежуточный вариант, на мой взгляд более интересный.
Пользователь, даёт запрос. Ваш "поисковик", даёт запрос всем известным поисковикам и получает от них, релевантные странички. Объединяет эти странички и среди них, ищет наиболее релевантные, которые и выдаються пользвателю.
В этом случае, пользователь получит наиболее полную картину сети по своему запросу.
Пиши пьяным, редактируй трезвым.
Справочник по алгоритмам С++ Builder

Последний раз редактировалось Smitt&Wesson; 05.09.2013 в 10:03.
Smitt&Wesson вне форума Ответить с цитированием
Старый 05.09.2013, 09:37   #14
Stilet
Белик Виталий :)
Старожил
 
Аватар для Stilet
 
Регистрация: 23.07.2007
Сообщений: 57,097
По умолчанию

Цитата:
необходимо индексировать сайты в базу данных.
Если эти сайты не какие-то конкретные, скажем для предприятия, внутренние или внешние с ограниченным списком то я тоже присоединяюсь к мнению Смитта о напряге гугла-яндекса. Так проще и дешевше.
I'm learning to live...
Stilet вне форума Ответить с цитированием
Старый 05.09.2013, 09:45   #15
myorient
Пользователь
 
Регистрация: 27.05.2013
Сообщений: 24
По умолчанию

Цитата:
Если эти сайты не какие-то конкретные, скажем для предприятия, внутренние или внешние с ограниченным списком то я тоже присоединяюсь к мнению Смитта о напряге гугла-яндекса. Так проще и дешевше.
Цитата:
Пользователь, даёт запрос. Ваш "поисковик", даёт запрос всем известным поисковикам и получает от них, релевантные странички. Объединяет эти странички и среди них, ищет наиболее релевантные, которые и выдаються пользвателю.
В этом случае, пользователь получит наиболее полную картину сети.
А как это сделать?
myorient вне форума Ответить с цитированием
Старый 05.09.2013, 09:58   #16
Человек_Борща
Старожил
 
Аватар для Человек_Борща
 
Регистрация: 30.12.2009
Сообщений: 11,434
По умолчанию

Цитата:
Если так, то PHP, не самый лучший выбор. Я бы поступил так. Паука, написал-бы на С++. Он обрабатывал бы странички и формировал базу данных.
Пожалуй с этим PHP может спорить. Пример: Данный форум.
Перегрузки испытают Apache и база данных, но не php. Как генерировал жирные странички кода за полсекунды, так и продолжает это делать для пары сотен(а то и больше), для всех одновременно желающих.

Для небольшого кол-ва людей вполне хватит.

Проблема в другом: Нужна мощная и очень быстрая СУБД. Обычные СУБД в пролете.
Человек_Борща вне форума Ответить с цитированием
Старый 05.09.2013, 10:08   #17
Smitt&Wesson
Старожил
 
Аватар для Smitt&Wesson
 
Регистрация: 31.05.2010
Сообщений: 13,543
По умолчанию

Человек_Борща, так я о то-же. Конечно, нагрузка будет и даже не на Апачь (как программу), а на процессор.
PHP, с С++ (консольным без Винды), ему не поспорить.
Пиши пьяным, редактируй трезвым.
Справочник по алгоритмам С++ Builder
Smitt&Wesson вне форума Ответить с цитированием
Старый 05.09.2013, 11:00   #18
Stilet
Белик Виталий :)
Старожил
 
Аватар для Stilet
 
Регистрация: 23.07.2007
Сообщений: 57,097
По умолчанию

Цитата:
А как это сделать?
Для начала определись на чем писать буш.
Скажем в Билдере-Делфи-Лазаре можно использовать INDI или Synapse для запросов.
В С++ по другому придется. В ПХП тоже.
Как вариант для нативных программ (Си\Делфи...) можно использовать библиотеку WinINET, если опять таки операционка виндовс.
Примеры по этому делу есть, могу выложить.
I'm learning to live...
Stilet вне форума Ответить с цитированием
Старый 06.09.2013, 08:23   #19
myorient
Пользователь
 
Регистрация: 27.05.2013
Сообщений: 24
По умолчанию

Цитата:
Сообщение от Stilet Посмотреть сообщение
Для начала определись на чем писать буш.
Скажем в Билдере-Делфи-Лазаре можно использовать INDI или Synapse для запросов.
В С++ по другому придется. В ПХП тоже.
Как вариант для нативных программ (Си\Делфи...) можно использовать библиотеку WinINET, если опять таки операционка виндовс.
Примеры по этому делу есть, могу выложить.
Ммм-да... Ясно. Но всё же, хотелось бы написать паука на PHP. Этот язык для меня ближе всего, и некоторые тонкости я легко реализую на нём. С Дельфи трудновато, давно не практиковал и ювелирной отделки кода (что очень важно при написании) всё равно не добьюсь.
Как тогда начать писать на ПХП, с чего начать?
myorient вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Поисковый движок myorient Софт 9 16.08.2013 16:48
поисковый оператор Case denniskvazaryes SQL, базы данных 1 17.08.2012 12:42
Поисковый запрос к MYSQL victorshkoda БД в Delphi 3 20.01.2012 10:20
Поисковый системы serres Обсуждение статей 2 25.03.2010 15:00
Поисковый системы serres PHP 1 10.03.2010 01:00