Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > .NET Frameworks (точка нет фреймворки) > C# (си шарп)
Регистрация

Восстановить пароль

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 25.09.2015, 20:49   #1
Programerok
Новичок
Джуниор
 
Регистрация: 25.09.2015
Сообщений: 1
По умолчанию Отделить код от текста, парсинг текстового файла

Суть задачи: есть вордовский файлик(допустим отчёт по курсовой) в котором есть текст и программный код(один или несколько). Каким образом можно спаристь код в документе?

Пока что есть такие соображения: пишем что-то типо синтаксического анализатора на несколько основных языков. Читаем 10 абзацов проверяем на каждый язык, сходство есть - читаем ещё одну строчку, проверяем и так пока не спарсим весь код. Если сходства нету - опять читаем 10 строчек но уже начиная со второй строчки и так же проверяем.


Как ещё можно это реализовать? Может есть какой-то алгоритм с помощью которого можно отделить текст, а не сам код(хотелось бы больше универсальности)? Каким ещё способом можно это реализовать? Буду благодарен за любую литературу по этому поводу.
Programerok вне форума Ответить с цитированием
Старый 25.09.2015, 21:02   #2
Stilet
Белик Виталий :)
Старожил
 
Аватар для Stilet
 
Регистрация: 23.07.2007
Сообщений: 57,097
По умолчанию

Когда я делал отчеты, я код вставлял в виде скриншотов, чтоб преподы не "коммуниздили" мои поделки. Как ты с этим бороться будешь?
И как ты к примеру отличишь Си от Си++? Или Паскаль АБЦ от Фрипаскаля?
I'm learning to live...
Stilet вне форума Ответить с цитированием
Старый 25.09.2015, 22:41   #3
Alex11223
Старожил
 
Аватар для Alex11223
 
Регистрация: 12.01.2011
Сообщений: 19,500
По умолчанию

Зачем их отличать?

Я правда не особо представляю зачем это вытаскивание кода вообще понадобиться может.
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом.
Alex11223 вне форума Ответить с цитированием
Старый 26.09.2015, 07:27   #4
Stilet
Белик Виталий :)
Старожил
 
Аватар для Stilet
 
Регистрация: 23.07.2007
Сообщений: 57,097
По умолчанию

Цитата:
зачем это вытаскивание кода вообще понадобиться может.
Для анализа на плагиат. В ВУЗах иногда озабачиваются таким.
I'm learning to live...
Stilet вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
парсинг текстового файла (Си) _BYTE Помощь студентам 0 14.12.2013 20:58
Парсинг html из текстового файла demiancz Общие вопросы Delphi 3 02.05.2013 17:53
копирование текста из одного текстового файла в другой Miserable_Silence Помощь студентам 0 24.01.2013 15:52
Преобразование текстового файла в ASCII код (NASM) wano13 Assembler - Ассемблер (FASM, MASM, WASM, NASM, GoASM, Gas, RosAsm, HLA) и не рекомендуем TASM 4 01.04.2012 19:27
перенос текста с текстового файла в mySQL БД sergeiqwe PHP 9 04.05.2010 01:36