Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Delphi программирование > Общие вопросы Delphi
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 09.11.2009, 08:53   #1
Garacio_cain
Пользователь
 
Аватар для Garacio_cain
 
Регистрация: 05.01.2008
Сообщений: 85
Лампочка Построение карты сайта

Встала задача написать функцию построения карты любого сайта. Что подразумевается под картой : все страницы на сервере, которые обычный пользователь может посетить.
Вариант выполнения примерно такой :
1. Считать html код страницы
2. Вывести из него все ссылки.
3. Отфильтровать ссылки убирая все "плохие ссылки" (JAVASCRIPT, #, /)
4. Отсортировать ссылки на принадлежность к текущему хосту (свои / чужие)
6. Добавить ссылки в общий список по всему сайту.
7. Убрать повторения.
8. Перемещаясь по списку выполнять пункты 1 - 7.

Нужна консультация. Если у кого есть более рациональные решения прошу предложить.
Garacio_cain вне форума Ответить с цитированием
Старый 09.11.2009, 10:45   #2
Stilet
Белик Виталий :)
Старожил
 
Аватар для Stilet
 
Регистрация: 23.07.2007
Сообщений: 57,097
По умолчанию

Помоему вполне логичный алгоритм...
I'm learning to live...
Stilet вне форума Ответить с цитированием
Старый 09.11.2009, 11:16   #3
Garacio_cain
Пользователь
 
Аватар для Garacio_cain
 
Регистрация: 05.01.2008
Сообщений: 85
По умолчанию

Честно сказать для меня он кажется каким то корявым но уже половину сделалю
Garacio_cain вне форума Ответить с цитированием
Старый 10.11.2009, 01:46   #4
DomiNick
Студент, не
Старожил
 
Аватар для DomiNick
 
Регистрация: 29.01.2009
Сообщений: 2,067
Радость

Цитата:
более рациональные решения
Ну а как же рациональней-то сделать?)
Только если у Google'а узнавать (он вроде может)...

<off>
Цитата:
2. Вывести из него все ссылки.
Хм... А есть ли какая готовая функция для вытаскивания ссылок из текста?
А то помню делал свою функцию для создания папки (проверку на существование всего пути), а оказалось есть ForceDirectories()
</off>
I am the First of Cyber Evolution...
I am the First to Program your Future...
DomiNick вне форума Ответить с цитированием
Старый 10.11.2009, 01:52   #5
Пепел Феникса
Старожил
 
Аватар для Пепел Феникса
 
Регистрация: 28.01.2009
Сообщений: 21,000
По умолчанию

Цитата:
Хм... А есть ли какая готовая функция для вытаскивания ссылок из текста?
разве что движок ИЕ прошерстить на экспорт подобный...
да и написать не трудно свою
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
Программа делает то что написал программист, а не то что он хотел.
Функции/утилиты ждут в параметрах то что им надо, а не то что вы хотите.
Пепел Феникса вне форума Ответить с цитированием
Старый 10.11.2009, 08:54   #6
Garacio_cain
Пользователь
 
Аватар для Garacio_cain
 
Регистрация: 05.01.2008
Сообщений: 85
По умолчанию

Цитата:
А есть ли какая готовая функция для вытаскивания ссылок из текста?
Не знаю есть ли или нет, я делал так. через idHTTP скачивал html, далее часть кода с тегом "<A " именно с пробелом в конце и "</A>".
Как только нахожу сразу вношу как поле в TStringList. Потом отрезаю все внешнее от тега "HREF" и оставляю все что стоит между кавычками или если кавычек не было то позиционирую по знаку "=" и ">" или пробелу в конце. Потом привожу к нормальному виду, ибо ссылку вида "/NEWS" нужно будет привести к виду "HTTP://site.domen/NEWS"

а потом сортируем на "свои чужие" и удаляем повторения из списка.
Garacio_cain вне форума Ответить с цитированием
Старый 10.11.2009, 12:04   #7
mihali4
*
Старожил
 
Регистрация: 22.11.2006
Сообщений: 9,201
По умолчанию

Это называется "парсинг".
На форуме вопросы парсинга обсосаны до костей.
Я за вас в поиск не пойду
mihali4 вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Карты - начинающий Scheres HTML и CSS 7 22.07.2009 10:30
Построение карты Карно prusal Помощь студентам 2 13.05.2009 22:24
Подобие карты сайта. Proger10 JavaScript, Ajax 5 12.05.2009 19:46
Интерактивные карты? myxaxa41 Свободное общение 2 13.02.2009 15:54
Требуется специалист для создания сайта со строгой аутентификацией или зашифрованного сайта. artembar Фриланс 1 01.09.2008 16:11