Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Операционные системы > Софт
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 18.04.2009, 02:41   #1
Виталий Серов
Заснувший
Форумчанин
 
Регистрация: 13.03.2009
Сообщений: 213
По умолчанию Сканер(редактор) SITEMAP.XML

Я уже писал об этой проге, точнее о старой версии, но с новой версией пришли новые проблемы, да и программа на старую не похожа.
О программе
- Сканер сайтов для создания карт в формате sitemap.xml
- Редактор этих карт
- Редактор Robots.txt
Проблема собственно в сканере, он не всегда выдаёт ссылки, а иногда вообще полный бред выдаёт. Я его исправил и испытал на нескольких сайтах - вроде работает. Но точно не знаю.
Может у кого есть желание помочь в тестировании, если обнаружите ошибки пишите название сайта который прога некоректно сканирует, или просто напишите замечания
Вложения
Тип файла: rar gs.rar (210.7 Кб, 17 просмотров)
Виталий Серов вне форума Ответить с цитированием
Старый 18.04.2009, 04:09   #2
Viteef
stopfake.org
Участник клуба
 
Регистрация: 03.05.2007
Сообщений: 1,927
По умолчанию

Внешние ссылки, картинки и прочий мусор в сайтмапе не нужен. Самое забавное что она по счетчику залезла на liveinternet и начала гулять по ихнему сайту пока не вылетела)))

В html может быть прописан и относительный путь, учитывай это.

На чем прога написана?

Последний раз редактировалось Viteef; 18.04.2009 в 04:13.
Viteef вне форума Ответить с цитированием
Старый 19.04.2009, 01:50   #3
Виталий Серов
Заснувший
Форумчанин
 
Регистрация: 13.03.2009
Сообщений: 213
По умолчанию

Прога так гуляет из-за того, что я в сриптах напутал со слешами.
Она перестанет гулять, если написать не
http://www.programmersforum.ru, а
http://www.programmersforum.ru/, я это исправил уже.
Связано с тем, что она берёт адрес сравнения от "//" до "/",и если последний символ не ввести, то всё прога считает все сайты "родными" и начинает "гулять". Картинки тоже исключаются по этому правилу, просто там IF NOT...... OR NOT....... OR NOT......, причём первым параметром выше указанное сравнение, ну и она его выполняет, и дальше не смотрит, отсюда и картинки в мапе.
Просто удивительно как "/" может дестабилизировать прогу
Насчёт разных url - это я с самого начала предусмотрел, она их может узнавать и "изменять" в "ТЕОРИИ".
Прога написана на Delphi.
А вот испровленный экземп, ещё это екземп пересажен на INDY, так он стал быстрее и интерфейс не виснет
Вложения
Тип файла: rar gs.rar (245.3 Кб, 18 просмотров)
Виталий Серов вне форума Ответить с цитированием
Старый 19.04.2009, 01:53   #4
Viteef
stopfake.org
Участник клуба
 
Регистрация: 03.05.2007
Сообщений: 1,927
По умолчанию

Когда скачиваешь страницу, исключения обрабатывать не забывай. И кинь на форму компонент AntiFreeze что не так висло.
Viteef вне форума Ответить с цитированием
Старый 19.04.2009, 02:27   #5
Виталий Серов
Заснувший
Форумчанин
 
Регистрация: 13.03.2009
Сообщений: 213
По умолчанию

AntiFreeze есть.... У меня вроде не виснет, а как его настроить тогда, чтоб не вис?
Виталий Серов вне форума Ответить с цитированием
Старый 23.04.2009, 02:10   #6
Viteef
stopfake.org
Участник клуба
 
Регистрация: 03.05.2007
Сообщений: 1,927
По умолчанию

Сделать отдельный поток и создавать в нем idhttp динамически.

Последний раз редактировалось Viteef; 23.04.2009 в 02:14.
Viteef вне форума Ответить с цитированием
Старый 24.04.2009, 00:17   #7
Виталий Серов
Заснувший
Форумчанин
 
Регистрация: 13.03.2009
Сообщений: 213
По умолчанию

Хотелось-бы обойтись без потоков, у меня почему к ним природная непереносимость, да и тут качать надо не архив в 200 мегов, а страницу в 50 кило, вот версия с перехватом ошибок
Вложения
Тип файла: rar gs.rar (345.0 Кб, 16 просмотров)
Виталий Серов вне форума Ответить с цитированием
Старый 24.05.2009, 00:50   #8
Виталий Серов
Заснувший
Форумчанин
 
Регистрация: 13.03.2009
Сообщений: 213
По умолчанию

Спасибо, Viteef за совет. Сделал с потоками всё стало работать "ядерно"
Вложения
Тип файла: zip gensitemap.zip (253.4 Кб, 17 просмотров)
Виталий Серов вне форума Ответить с цитированием
Старый 24.05.2009, 01:54   #9
Viteef
stopfake.org
Участник клуба
 
Регистрация: 03.05.2007
Сообщений: 1,927
По умолчанию

на http://yaproger.ru нашел только 2 страницы. Отлаживай.
Viteef вне форума Ответить с цитированием
Старый 24.05.2009, 02:17   #10
Виталий Серов
Заснувший
Форумчанин
 
Регистрация: 13.03.2009
Сообщений: 213
По умолчанию

Как две, у меня всё нормально сканирует
Однако я обнаружил ошибку прерывания закачки, буду переделывать
Изображения
Тип файла: jpg 22222.JPG (52.8 Кб, 55 просмотров)

Последний раз редактировалось Виталий Серов; 24.05.2009 в 02:21.
Виталий Серов вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Sitemap редактор для системы Google Виталий Серов Софт 0 30.03.2009 00:51
сканер монитора Drive Общие вопросы C/C++ 7 02.12.2008 21:47
Сканер портов One.Love Работа с сетью в Delphi 4 18.02.2008 16:05
Сканер Sanek_ntsk Общие вопросы Delphi 3 18.12.2007 19:54