![]() |
|
|
Регистрация Восстановить пароль |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
![]() |
|
|
Опции темы | Поиск в этой теме |
![]() |
#11 |
Старожил
Регистрация: 12.01.2011
Сообщений: 19,500
|
![]()
Обычно гораздо проще использовать библиотеки типа вышеприведенной, чем париться с придумыванием сложных регекспов.
По ссылке выше описаны все + и - этого подхода. Иногда регекспы хорошо (например, чтобы не подключать лишние библиотеки ради одной простой страницы, или из-за скорости/памяти при очень больших объемах), но как правило нет. Ну и если не знаком с регекспами, то осваивать их до нужного уровня явно сложнее, чем XPath. Как и читать код потом.
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом. |
![]() |
![]() |
![]() |
#12 |
Форумчанин
Регистрация: 16.01.2015
Сообщений: 672
|
![]()
у сторонних библиотек тоже есть свои - и +.
я что-то не понимаю с чем вы спорите. Вы дали один вариант я другой, у автора 3-ий, все они могут решать вопрос, а дальше зависит от навыков, что по сути субъективно. Не можешь сам - найми, и все дела. |
![]() |
![]() |
![]() |
#13 |
Форумчанин
Регистрация: 18.01.2012
Сообщений: 975
|
![]()
Почему не стоит парсить HTML регулярками. В общем случае следует пользоваться специализированными библиотеками, поскольку в них (скорее всего, зависит от качества самой либы) корректно реализована обработка нестандартных/редко встречающихся ситуаций, которые автор при составлении регулярки мог не учесть. Например, редко кто учитывает возможность наличия комментариев в HTML при составлении регексов. А если все "щекотливые" ситуации, возможные в html, учитывать, то получится нечто достаточно большое и сложное => лишняя трата времени на изобретение очередного велосипеда.
С другой стороны, если анализируемый документ гарантированно не содержит неожиданностей, то с регулярками можно получить некоторый прирост в скорости, т.к. разбирать весь документ не будет надобности. Инструмент просто надо выбирать соответствующий задаче
Благодарить в репутацию. Проклинать — туда же
![]() |
![]() |
![]() |
![]() |
#14 | |
Форумчанин
Регистрация: 16.01.2015
Сообщений: 672
|
![]() Цитата:
что значит не учли комментарий? следовательно изначально его не было, так может и любой другой тег появиться, или атрибут или значение атрибута или .. мильен или, и скажем привет икспасу или профукали комментарий? опять не вижу специфики именно регулярак в этом вопросе с икспасом относительно проще - наверное да (и то смотря кому, перловщику думаю наоборот), мне с икспасом проще |
|
![]() |
![]() |
![]() |
#15 |
Форумчанин
Регистрация: 18.01.2012
Сообщений: 975
|
![]()
Комментарии xpath'у не помеха. А вот регулярку сломать как нефиг делать может
И новый атрибут xpath тоже не поломает. И порядок атрибутов ему нипочем. И одинарные/двойные кавычки. и еще много чего Регулярка тут достаточно тонкий и острый инструмент. Работает скорее всего быстрее, но порезаться легко
Благодарить в репутацию. Проклинать — туда же
![]() |
![]() |
![]() |
![]() |
#16 |
Форумчанин
Регистрация: 16.01.2015
Сообщений: 672
|
![]()
смотря какой икспас и смотря какая регулярка
|
![]() |
![]() |
![]() |
#17 | ||
Форумчанин
Регистрация: 18.01.2012
Сообщений: 975
|
![]() Цитата:
Цитата:
Благодарить в репутацию. Проклинать — туда же
![]() |
||
![]() |
![]() |
![]() |
#18 | |
Форумчанин
Регистрация: 16.01.2015
Сообщений: 672
|
![]() Цитата:
и что такое "корректно реализованный" икспас и что такое не "корректно реализованный" регекс |
|
![]() |
![]() |
![]() |
#19 | |
Форумчанин
Регистрация: 18.01.2012
Сообщений: 975
|
![]() Цитата:
p.s. Ссылка на стандарт xpath легко гуглится
Благодарить в репутацию. Проклинать — туда же
![]() |
|
![]() |
![]() |
![]() |
#20 |
Форумчанин
Регистрация: 16.01.2015
Сообщений: 672
|
![]()
а ну тады ок, буду самостоятельно думать
|
![]() |
![]() |
![]() |
|
![]() |
||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Как лучше всего защитить dll от взлома? | Ecosasha | Свободное общение | 8 | 04.09.2012 22:02 |
Как лучше всего получать письма? | DEA7H | Общие вопросы Delphi | 4 | 06.06.2012 17:55 |
Как лучше всего реализовать игру пятнашки? | Sauber | C++ Builder | 2 | 18.11.2011 22:52 |
ASP.NET. Как лучше всего сохранить запрос? | Stilet | ASP.NET | 4 | 01.06.2010 13:11 |
Как лучше всего освобождать созданные в потоке объекты? | TwiX | Общие вопросы Delphi | 2 | 13.03.2010 21:27 |