![]() |
|
|
Регистрация Восстановить пароль |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
![]() |
|
Опции темы
![]() |
Поиск в этой теме
![]() |
![]() |
#1 |
Пользователь
Регистрация: 05.01.2008
Сообщений: 85
|
![]()
Встала задача написать функцию построения карты любого сайта. Что подразумевается под картой : все страницы на сервере, которые обычный пользователь может посетить.
Вариант выполнения примерно такой : 1. Считать html код страницы 2. Вывести из него все ссылки. 3. Отфильтровать ссылки убирая все "плохие ссылки" (JAVASCRIPT, #, /) 4. Отсортировать ссылки на принадлежность к текущему хосту (свои / чужие) 6. Добавить ссылки в общий список по всему сайту. 7. Убрать повторения. 8. Перемещаясь по списку выполнять пункты 1 - 7. Нужна консультация. Если у кого есть более рациональные решения прошу предложить. |
![]() |
![]() |
![]() |
#2 |
Белик Виталий :)
Старожил
Регистрация: 23.07.2007
Сообщений: 57,097
|
![]()
Помоему вполне логичный алгоритм...
I'm learning to live...
|
![]() |
![]() |
![]() |
#3 |
Пользователь
Регистрация: 05.01.2008
Сообщений: 85
|
![]()
Честно сказать для меня он кажется каким то корявым но уже половину сделалю
|
![]() |
![]() |
![]() |
#4 | ||
Студент, не
Старожил
Регистрация: 29.01.2009
Сообщений: 2,067
|
![]() Цитата:
Только если у Google'а узнавать (он вроде может)... ![]() <off> Цитата:
А то помню делал свою функцию для создания папки (проверку на существование всего пути), а оказалось есть ForceDirectories() </off>
I am the First of Cyber Evolution...
I am the First to Program your Future... |
||
![]() |
![]() |
![]() |
#5 | |
Старожил
Регистрация: 28.01.2009
Сообщений: 21,000
|
![]() Цитата:
да и написать не трудно свою ![]() Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
Программа делает то что написал программист, а не то что он хотел. Функции/утилиты ждут в параметрах то что им надо, а не то что вы хотите. |
|
![]() |
![]() |
![]() |
#6 | |
Пользователь
Регистрация: 05.01.2008
Сообщений: 85
|
![]() Цитата:
Как только нахожу сразу вношу как поле в TStringList. Потом отрезаю все внешнее от тега "HREF" и оставляю все что стоит между кавычками или если кавычек не было то позиционирую по знаку "=" и ">" или пробелу в конце. Потом привожу к нормальному виду, ибо ссылку вида "/NEWS" нужно будет привести к виду "HTTP://site.domen/NEWS" а потом сортируем на "свои чужие" и удаляем повторения из списка. |
|
![]() |
![]() |
![]() |
#7 |
*
Старожил
Регистрация: 22.11.2006
Сообщений: 9,201
|
![]()
Это называется "парсинг".
На форуме вопросы парсинга обсосаны до костей. Я за вас в поиск не пойду ![]() |
![]() |
![]() |
![]() |
![]() |
||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Карты - начинающий | Scheres | HTML и CSS | 7 | 22.07.2009 10:30 |
Построение карты Карно | prusal | Помощь студентам | 2 | 13.05.2009 22:24 |
Подобие карты сайта. | Proger10 | JavaScript, Ajax | 5 | 12.05.2009 19:46 |
Интерактивные карты? | myxaxa41 | Свободное общение | 2 | 13.02.2009 15:54 |
Требуется специалист для создания сайта со строгой аутентификацией или зашифрованного сайта. | artembar | Фриланс | 1 | 01.09.2008 16:11 |