Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > .NET Frameworks (точка нет фреймворки) > C# (си шарп)
Регистрация

Восстановить пароль

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 20.02.2015, 10:51   #11
Alex11223
Старожил
 
Аватар для Alex11223
 
Регистрация: 12.01.2011
Сообщений: 19,500
По умолчанию

Обычно гораздо проще использовать библиотеки типа вышеприведенной, чем париться с придумыванием сложных регекспов.
По ссылке выше описаны все + и - этого подхода. Иногда регекспы хорошо (например, чтобы не подключать лишние библиотеки ради одной простой страницы, или из-за скорости/памяти при очень больших объемах), но как правило нет.

Ну и если не знаком с регекспами, то осваивать их до нужного уровня явно сложнее, чем XPath. Как и читать код потом.
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом.
Alex11223 вне форума Ответить с цитированием
Старый 20.02.2015, 11:09   #12
lomastr_
Форумчанин
 
Регистрация: 16.01.2015
Сообщений: 672
По умолчанию

у сторонних библиотек тоже есть свои - и +.
я что-то не понимаю с чем вы спорите. Вы дали один вариант я другой, у автора 3-ий, все они могут решать вопрос, а дальше зависит от навыков, что по сути субъективно.
Не можешь сам - найми, и все дела.
lomastr_ вне форума Ответить с цитированием
Старый 20.02.2015, 13:42   #13
Luuzuk
Форумчанин
 
Аватар для Luuzuk
 
Регистрация: 18.01.2012
Сообщений: 975
По умолчанию

Почему не стоит парсить HTML регулярками. В общем случае следует пользоваться специализированными библиотеками, поскольку в них (скорее всего, зависит от качества самой либы) корректно реализована обработка нестандартных/редко встречающихся ситуаций, которые автор при составлении регулярки мог не учесть. Например, редко кто учитывает возможность наличия комментариев в HTML при составлении регексов. А если все "щекотливые" ситуации, возможные в html, учитывать, то получится нечто достаточно большое и сложное => лишняя трата времени на изобретение очередного велосипеда.

С другой стороны, если анализируемый документ гарантированно не содержит неожиданностей, то с регулярками можно получить некоторый прирост в скорости, т.к. разбирать весь документ не будет надобности.

Инструмент просто надо выбирать соответствующий задаче
Благодарить в репутацию. Проклинать — туда же
Luuzuk вне форума Ответить с цитированием
Старый 20.02.2015, 13:48   #14
lomastr_
Форумчанин
 
Регистрация: 16.01.2015
Сообщений: 672
По умолчанию

Цитата:
речающихся ситуаций, которые автор при составлении регулярки мог не учесть
такое и икспасу относится

что значит не учли комментарий? следовательно изначально его не было, так может и любой другой тег появиться, или атрибут или значение атрибута или .. мильен или, и скажем привет икспасу
или профукали комментарий? опять не вижу специфики именно регулярак в этом вопросе

с икспасом относительно проще - наверное да (и то смотря кому, перловщику думаю наоборот), мне с икспасом проще
lomastr_ вне форума Ответить с цитированием
Старый 20.02.2015, 13:49   #15
Luuzuk
Форумчанин
 
Аватар для Luuzuk
 
Регистрация: 18.01.2012
Сообщений: 975
По умолчанию

Комментарии xpath'у не помеха. А вот регулярку сломать как нефиг делать может
И новый атрибут xpath тоже не поломает. И порядок атрибутов ему нипочем. И одинарные/двойные кавычки. и еще много чего
Регулярка тут достаточно тонкий и острый инструмент. Работает скорее всего быстрее, но порезаться легко
Благодарить в репутацию. Проклинать — туда же
Luuzuk вне форума Ответить с цитированием
Старый 20.02.2015, 14:24   #16
lomastr_
Форумчанин
 
Регистрация: 16.01.2015
Сообщений: 672
По умолчанию

смотря какой икспас и смотря какая регулярка
lomastr_ вне форума Ответить с цитированием
Старый 20.02.2015, 16:18   #17
Luuzuk
Форумчанин
 
Аватар для Luuzuk
 
Регистрация: 18.01.2012
Сообщений: 975
По умолчанию

Цитата:
смотря какой икспас
корректно реализованный

Цитата:
смотря какая регулярка
о том и речь. Регулярку для (почти) полностью корректной валидации e-mail видели? http://ex-parrot.com/~pdw/Mail-RFC822-Address.html
Благодарить в репутацию. Проклинать — туда же
Luuzuk вне форума Ответить с цитированием
Старый 20.02.2015, 16:26   #18
lomastr_
Форумчанин
 
Регистрация: 16.01.2015
Сообщений: 672
По умолчанию

Цитата:
валидации e-mail видели?
лет сто назад, и что? это говорит о том что регулярными пользоваться нельзя?
и что такое "корректно реализованный" икспас и что такое не "корректно реализованный" регекс
lomastr_ вне форума Ответить с цитированием
Старый 20.02.2015, 16:43   #19
Luuzuk
Форумчанин
 
Аватар для Luuzuk
 
Регистрация: 18.01.2012
Сообщений: 975
По умолчанию

Цитата:
что такое "корректно реализованный" икспас и что такое не "корректно реализованный" регекс
Это наивные вопросы, попробуйте немного подумать самостоятельно
p.s. Ссылка на стандарт xpath легко гуглится
Благодарить в репутацию. Проклинать — туда же
Luuzuk вне форума Ответить с цитированием
Старый 20.02.2015, 17:04   #20
lomastr_
Форумчанин
 
Регистрация: 16.01.2015
Сообщений: 672
По умолчанию

а ну тады ок, буду самостоятельно думать
lomastr_ вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Как лучше всего защитить dll от взлома? Ecosasha Свободное общение 8 04.09.2012 22:02
Как лучше всего получать письма? DEA7H Общие вопросы Delphi 4 06.06.2012 17:55
Как лучше всего реализовать игру пятнашки? Sauber C++ Builder 2 18.11.2011 22:52
ASP.NET. Как лучше всего сохранить запрос? Stilet ASP.NET 4 01.06.2010 13:11
Как лучше всего освобождать созданные в потоке объекты? TwiX Общие вопросы Delphi 2 13.03.2010 21:27