|
|
Регистрация Восстановить пароль |
Повторная активизация e-mail |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
Опции темы | Поиск в этой теме |
18.10.2016, 21:12 | #1 |
Пользователь
Регистрация: 15.04.2010
Сообщений: 98
|
Получение ссылок из HTML
Нужно извлечь из HTML ссылки на ресурсы (картинки, скрипты и пр.). Использую Delphi 7 + TRegExpr.
Код:
Похоже, что TRegExpr не поддерживает условия. Подскажите, как можно изменить регекс, чтобы извлекало путь как с кавычками, так и без. |
18.10.2016, 21:16 | #2 |
Старожил
Регистрация: 12.01.2011
Сообщений: 19,500
|
Для парсинга HTML лучше брать парсер HTML, а не регекспы.
Но в Дельфи с их наличием вроде как-то не особо. Если производительность не важна можно взять TWebbrowser/IHTMLDocument2
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом. |
18.10.2016, 21:18 | #3 |
Пользователь
Регистрация: 15.04.2010
Сообщений: 98
|
Вот как раз нужно именно регексами (требование заказчика). Чтобы минимум зависимостей и быстро работало.
|
18.10.2016, 21:20 | #4 |
Старожил
Регистрация: 12.01.2011
Сообщений: 19,500
|
А задача-то какая исходная?
И точно ли именно Дельфи нужен, да еще и 7?
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом. |
18.10.2016, 21:29 | #5 |
Пользователь
Регистрация: 15.04.2010
Сообщений: 98
|
Да имено 7. Таково требование заказчика.
Задача: сделать очень упрощённый эмулятор браузера. По заданному URL получить HTML (при помощи synapse это уже сделал), затем получить ссылки на все ресурсы (такие как стили, картинки, скрипты и др.) и просто их скачать без сохранения. Вот и всё. |
18.10.2016, 21:42 | #6 |
Старожил
Регистрация: 12.01.2011
Сообщений: 19,500
|
Судя по требованиям для такой задачи — заказчик или школьник осваивающий Дельфи по каким-нибудь урокам Макрушина, или очень странный человек
А другие варианты регексов не подошли? https://www.google.com/search?q=regex+src+href или библиотека типа http://www.regular-expressions.info/delphi.html
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом. |
18.10.2016, 22:36 | #7 | |
Пользователь
Регистрация: 15.04.2010
Сообщений: 98
|
Цитата:
|
|
Опции темы | Поиск в этой теме |
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Парсер ссылок HTML | Lazio | C# (си шарп) | 4 | 14.09.2015 21:15 |
Получение всех ссылок со страницы | nibufep | Общие вопросы Delphi | 4 | 19.08.2015 13:02 |
Получение всех ссылок на видео с сайта | Tyoma5891 | PHP | 5 | 10.10.2013 13:45 |
Получение ссылок от родительского компонента на все визуальные дочерние | victorixx | Компоненты Delphi | 2 | 21.11.2011 09:13 |
получение списка ссылок на подпапки файлы однойпапки | i777 | Microsoft Office Excel | 3 | 06.10.2010 23:30 |