|
|
Регистрация Восстановить пароль |
Повторная активизация e-mail |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
|
Опции темы | Поиск в этой теме |
20.12.2014, 23:30 | #1 |
Пользователь
Регистрация: 12.03.2012
Сообщений: 99
|
Сравнение на схожесть двух текстов
Ни у кого нет исходника в делфи программы для сравнения двух текстов, и вывода процента схожести текста.... Сравнение нужно не по символам, а по словам. Или подскажите где такую взять, или как написать. Сравнить или 2 текста, или два вордовских файла, лучше файлы конечно.
Последний раз редактировалось romantik1993; 20.12.2014 в 23:32. |
20.12.2014, 23:42 | #2 |
Форумчанин
Регистрация: 23.03.2013
Сообщений: 218
|
Ну так рассказывай как пытался делать, какой алгоритм придумал.
Инфы тут не надо никакой, придумал алгоритм и вперёд. и в чём именно у тебя проблема? код показывай, и подробное описание что не получается. |
20.12.2014, 23:48 | #3 |
Пользователь
Регистрация: 12.03.2012
Сообщений: 99
|
Так я просто не знаю как это реализовать.
|
21.12.2014, 00:21 | #4 |
Форумчанин
Регистрация: 23.03.2013
Сообщений: 218
|
я бы так сделал
2 текста суёшь в строку. Строку делишь на массивы, каждое слово новый элемент массива. А потом циклом проходишься по массивам и сравниваешь их содержимое |
21.12.2014, 02:39 | #5 |
ПШП
Участник клуба
Регистрация: 15.07.2013
Сообщений: 1,872
|
|
21.12.2014, 11:17 | #6 |
Старожил
Регистрация: 31.05.2010
Сообщений: 13,543
|
Делается примерно так. Из обоих текстов удаляются все знаки препинания кроме пробелов. Все междометия типа "и" "или" "не" и так далее.
Есть несколько типов проверки. 1. На полное совпадение участков текста. 2. На частотность повторения ключевых слов. 3. На статистическое совпадение позиций ключевых слов. Каждый из этих способов, обладает как преимуществами, так и недостатками. 1. Может проверить текст на наличие в нём текстовых вставок, но, если слова заменены синомимами проверка не состоится. 2. Может выявить замену слов на синонемы. 3. Может выявить стиль написания кусков текста. Т.е. соответствует ли стиль плагиата, стилю автора. Есть ещё несколько типов проверок, но они более сложные и без специальных познаний в лингвистике трудно реализуемы.
Пиши пьяным, редактируй трезвым.
Справочник по алгоритмам С++ Builder |
21.12.2014, 12:46 | #7 | |
Белик Виталий :)
Старожил
Регистрация: 23.07.2007
Сообщений: 57,097
|
Цитата:
Мне вот интересно, а что он будет делать с текстами, которые являются картинками в документе...
I'm learning to live...
|
|
21.12.2014, 13:54 | #8 |
Старожил
Регистрация: 31.05.2010
Сообщений: 13,543
|
Я так понимаю, вопрос о картинках не стоит. ТС нужно просто сравнивать текстовые документы.
Пиши пьяным, редактируй трезвым.
Справочник по алгоритмам С++ Builder |
21.12.2014, 15:01 | #9 |
Форумчанин
Регистрация: 23.03.2013
Сообщений: 218
|
он о ворде говорит. в нём текст и картинки вместе, при этом текст можно прочитать просто открыт файл как простой текстовик(если убрать все спец символы).
Но вот теже картинки сильно попортят сравнение текста - автор то сам не очень понимает что ему нужно, а мы тут гадаем |
21.12.2014, 15:25 | #10 | |
Белик Виталий :)
Старожил
Регистрация: 23.07.2007
Сообщений: 57,097
|
Цитата:
Если предлагать сравнение, то получается как я и говорил в другой теме - полнотекстовый поиск. Но опять таки критерии нужны. Фраза Сравнение нужно не по символам, а по словам лично мне ничего не проясняет, кроме того что тупо составить словарь слов и их количество, записать в некую таблицу БД. Потом взять другой текстовик - сделать тоже самое, а потом запросом сравнить две таблицы... Даже не знаю что лучше, и потянет ли такую схему автор... P.S. Я тут слегка подумал как это все упростить. Предлагаю такое: 1) http://msdn.microsoft.com/ru-ru/libr...nt.saveas.aspx Т.е. пересохранить два документа в ТХТ. Что-то вроде как здесь: http://www.programmersforum.ru/showthread.php?t=57263 Только в параметрах SaveAs добавить FileFormat:=wdFormatText 2)Далее загрузить оба созданных TXT файла в память: Код:
ИМХО это самое простое что может быть в данном случае.
I'm learning to live...
Последний раз редактировалось Stilet; 21.12.2014 в 16:25. |
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Сравнение двух прайсов | qwerty1 | Microsoft Office Excel | 10 | 15.01.2015 18:32 |
СРавнение двух папок | wins-zloi | Помощь студентам | 0 | 24.06.2013 14:15 |
сравнение двух днф | Zln | Помощь студентам | 0 | 11.05.2010 16:42 |
сравнение двух строк | aza_kaz | Assembler - Ассемблер (FASM, MASM, WASM, NASM, GoASM, Gas, RosAsm, HLA) и не рекомендуем TASM | 3 | 01.01.2010 23:40 |
Сравнение текстов на схожесть | PUH | Общие вопросы Delphi | 7 | 21.02.2008 22:18 |