Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > C/C++ программирование > Общие вопросы C/C++
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 01.03.2008, 14:04   #11
B_N
Новичок
Джуниор
 
Регистрация: 18.01.2008
Сообщений: 1,720
По умолчанию

Цитата:
Сообщение от Табурет Посмотреть сообщение
1. за начало объекта берём любой тег (/<[^>]+>/) кроме непарных (<hr <br <img <итд).
Почти. IMG или HR вполне полноценные объекты и над ними тоже можно вызывать parse. Просто ей не придется углубляться в текст, вместо этого она добавит объект IMG к родительскому, заполнит атрибуты и повстречавшись с ">" вернется.
B_N вне форума Ответить с цитированием
Старый 02.03.2008, 19:26   #12
BOBAH13
Android Developer
Старожил Подтвердите свой е-майл
 
Аватар для BOBAH13
 
Регистрация: 19.02.2007
Сообщений: 3,708
По умолчанию

Смотрю на ваши мучения... недавно взялся за такое дело, ушло у меня двое суток. Да уж... хотел уже дать вам исходник но походу он у меня пропал, вообщем все делается через стек, опишите свои типа аттрибутов: имя, значение, тега, имя + массив аттрибуто + текст который в нем заключен... все далается как...

1. Одна функция получает текст html находит теги допусти открылся тег она идет пока он же не закроется, тобиш стек будет пуст и тот текст который между началом и концом тега получился передаете опять же этой функции, весь текст который остался после закрытия тега продолжаите парсить с таким же смыслом ( что когда стек пуст... )
После того как кидаите парсить внутренний текст тега выделите часть текста полученного т.е. часть которая идет после < и до > или /> это и будут атрибутты эту часть текста кидаите в другую функцию для получения и рассартировки текста...

Таким образом вы получаите так сказать дерево тегов ну т.е.

html->
title->
body->
p->
a->абра<-

типа такого будет чтот... думаю я вам помог чем то p.s. я прям расстроился что потерял исходник парсера.... все-таки двое суток просидел над ним..
BOBAH13 вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
HTML веб редактор dr.Chas Софт 7 17.03.2009 14:57
Код Html prizrak1390 Общие вопросы Delphi 4 13.04.2008 21:15
html тэг select Рустам HTML и CSS 3 08.01.2008 13:27
РНР<>HTML? Viteef HTML и CSS 5 18.07.2007 03:38
HTML>>>в>>>>PHP _Solomon_ PHP 5 06.05.2007 14:12