Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > .NET Frameworks (точка нет фреймворки) > C# (си шарп)
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 15.10.2013, 00:09   #1
SnaiperArts
Пользователь
 
Регистрация: 12.07.2012
Сообщений: 15
По умолчанию htmlagilitypack парсим текст

Здравствуйте, разбирался с htmlagilitypack насчет парсинга html вроде все понятно, но вот мне нужно вытащить текст, который не ограничен классами html. вот пример:
Цитата:
Раздел: Рефераты по авиации и космонавтике
Тип: реферат Просмотров: 657 Комментариев: 1
Встречается это в каждом реферате, т.е. 20 раз на странице, мне нужно вытащить слово "реферат", т.е. текст который находиться между "Тип:" и "Просмотров:", текст может быть любой (т.е. не обязательно "реферат", может быть еще например "курсовая" и т.д.). Как можно вытащить его средствами htmlagilitypack, или же др. способ.

P.S. регулярку писал, но не смог что бы он вытаскивал все значения, получилось только первое вхождение!
Регулярка которую писал:
Код:
var firstid = Regex.Match(html, @"Тип: ([^>]*)Просмотров").Groups[1].Value.Trim();
SnaiperArts вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
HtmlAgilityPack и HTTP авторизация speculari C# (си шарп) 2 27.11.2012 15:57
Парсим текст, не могу вникнуть antoxamad Помощь студентам 7 23.02.2012 10:02
Сохранить в текстовый файл текст из Memo и текст из нескольких Edit misher Общие вопросы Delphi 5 02.01.2011 15:37
Разобраться с HtmlAgilityPack GenniY Общие вопросы .NET 1 26.12.2010 21:19
Парсим bash.org.ru Merkator Работа с сетью в Delphi 1 21.04.2009 21:21