|
|
Регистрация Восстановить пароль |
Повторная активизация e-mail |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
Опции темы | Поиск в этой теме |
06.09.2010, 11:31 | #1 |
Новичок
Джуниор
Регистрация: 06.09.2010
Сообщений: 2
|
извлечение информации из текста
Доброго времени суток.
Столкнулся с проблемой при реализации поставленной задачи. Опыт программирования невелик, но новая должность обязывает его набирать. Поставлена задача: На входе файл Word-овский с анкетой (номер вопроса-содержание вопроса-варианты ответов) Необходимо из файла вытянуть всю информацию и заполнить ею соответствующую таблицу из следующих полей: -номер вопроса -содержание вопроса -варианты ответов -наличие в тексте вопроса контрольного слова (+/-) При этом в исходном файле все, что удалось распознать, отмечается соответствующим цветом (фона или текста). Обобщив найденную в разных книгах и примерах информацию понял, что самостоятельно реализовать не в силах. Плюс ко всему Delphi не подсказывает варианты методов по Word-овским объектам Application и WordBasic, да еще и не могу найти как закрыть документ и приложение winword через WordBasic. Помогите, люди добрые! ))) |
06.09.2010, 13:47 | #2 |
Балуюсь кодами
Участник клуба
Регистрация: 09.01.2009
Сообщений: 1,837
|
Задача специфическая и решается для каждого конкретного случая по-своему. Информацию вытягивать нужно поиском. Для этого должны быть отличительные признаки, например номер вопроса начинается всегда с цифры, вариант ответа с открывающей скобки, может быть разное форматирование.
Я делал такую задачу, правда не на Delpi, а на VBA, но это не принципиально Приложите пример документа, который нужно обработать, тогда можно будет подсказать более конкретно. WordBasic не нужен совершенно, т.к. это оставлено для совместимости с Word 97
Лучше день потерять — потом за пять минут долететь!©
|
06.09.2010, 14:23 | #3 |
Новичок
Джуниор
Регистрация: 06.09.2010
Сообщений: 2
|
отличительные признаки есть, я их первым делом выделил. Они не меняются, из раза в раз стандартные. Напишу пример (с учетом атрибутов текста):----
" 1. К какой возрастной группе вы относитесь? 001 - 15-20 лет 002 - 20-30 лет 003 - 30-40 лет 2. Как часто вы пользуетесь интернетом? Выберите, пожалуйста, один вариант ответа. 011 - Каждый день 012 - Несколько раз в неделю 013 - Раз в неделю 014 - Реже одного раза в неделю 015 - Не пользуюсь " В результате распознавания необходимо вытянуть из текста в табличку номера вопросов, их содержание, коды ответов и содержание ответов. А исходный файл преобразуется в следующий вид: " 1. К какой возрастной группе вы относитесь? 001 - 15-20 лет 002 - 20-30 лет 003 - 30-40 лет 2. Как часто вы пользуетесь интернетом? Выберите, пожалуйста, один вариант ответа. 011 - Каждый день 012 - Несколько раз в неделю 013 - Раз в неделю 014 - Реже одного раза в неделю 015 - Не пользуюсь " Последний раз редактировалось Alejandr0; 06.09.2010 в 15:28. |
Опции темы | Поиск в этой теме |
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Извлечение информации из JAVA приложения. | bbFV | Общие вопросы по Java, Java SE, Kotlin | 3 | 28.05.2010 12:13 |
RichViewEdit, извлечение текста | Alter | Компоненты Delphi | 3 | 02.05.2010 14:02 |
извлечение текста | Kavaler2i | Общие вопросы Delphi | 1 | 27.01.2010 17:18 |
извлечение текста и стилевой разметки из doc на с++ | valid | Общие вопросы C/C++ | 0 | 06.04.2009 01:32 |
ввод информации с клавиутуры в двумерный масив, запись информации с масива в файл | x_omega_x | Помощь студентам | 1 | 29.12.2008 02:30 |