Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Microsoft Office и VBA программирование > Microsoft Office Word
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 06.09.2010, 11:31   #1
Alejandr0
Новичок
Джуниор
 
Регистрация: 06.09.2010
Сообщений: 2
По умолчанию извлечение информации из текста

Доброго времени суток.
Столкнулся с проблемой при реализации поставленной задачи.
Опыт программирования невелик, но новая должность обязывает его набирать.
Поставлена задача:
На входе файл Word-овский с анкетой (номер вопроса-содержание вопроса-варианты ответов)
Необходимо из файла вытянуть всю информацию и заполнить ею соответствующую таблицу из следующих полей:
-номер вопроса
-содержание вопроса
-варианты ответов
-наличие в тексте вопроса контрольного слова (+/-)
При этом в исходном файле все, что удалось распознать, отмечается соответствующим цветом (фона или текста).

Обобщив найденную в разных книгах и примерах информацию понял, что самостоятельно реализовать не в силах.
Плюс ко всему Delphi не подсказывает варианты методов по Word-овским объектам Application и WordBasic, да еще
и не могу найти как закрыть документ и приложение winword через WordBasic. Помогите, люди добрые! )))
Alejandr0 вне форума Ответить с цитированием
Старый 06.09.2010, 13:47   #2
viter.alex
Балуюсь кодами
Участник клуба
 
Аватар для viter.alex
 
Регистрация: 09.01.2009
Сообщений: 1,837
По умолчанию

Задача специфическая и решается для каждого конкретного случая по-своему. Информацию вытягивать нужно поиском. Для этого должны быть отличительные признаки, например номер вопроса начинается всегда с цифры, вариант ответа с открывающей скобки, может быть разное форматирование.
Я делал такую задачу, правда не на Delpi, а на VBA, но это не принципиально
Приложите пример документа, который нужно обработать, тогда можно будет подсказать более конкретно.

WordBasic не нужен совершенно, т.к. это оставлено для совместимости с Word 97
Лучше день потерять — потом за пять минут долететь!©
viter.alex вне форума Ответить с цитированием
Старый 06.09.2010, 14:23   #3
Alejandr0
Новичок
Джуниор
 
Регистрация: 06.09.2010
Сообщений: 2
По умолчанию

отличительные признаки есть, я их первым делом выделил. Они не меняются, из раза в раз стандартные. Напишу пример (с учетом атрибутов текста):----
"
1. К какой возрастной группе вы относитесь?
001 - 15-20 лет
002 - 20-30 лет
003 - 30-40 лет
2. Как часто вы пользуетесь интернетом? Выберите, пожалуйста, один вариант ответа.
011 - Каждый день
012 - Несколько раз в неделю
013 - Раз в неделю
014 - Реже одного раза в неделю
015 - Не пользуюсь
"
В результате распознавания необходимо вытянуть из текста в табличку номера вопросов, их содержание, коды ответов и содержание ответов. А исходный файл преобразуется в следующий вид:
"
1. К какой возрастной группе вы относитесь?
001 - 15-20 лет
002 - 20-30 лет
003 - 30-40 лет
2. Как часто вы пользуетесь интернетом? Выберите, пожалуйста, один вариант ответа.
011 - Каждый день
012 - Несколько раз в неделю
013 - Раз в неделю
014 - Реже одного раза в неделю
015 - Не пользуюсь
"

Последний раз редактировалось Alejandr0; 06.09.2010 в 15:28.
Alejandr0 вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Извлечение информации из JAVA приложения. bbFV Общие вопросы по Java, Java SE, Kotlin 3 28.05.2010 12:13
RichViewEdit, извлечение текста Alter Компоненты Delphi 3 02.05.2010 14:02
извлечение текста Kavaler2i Общие вопросы Delphi 1 27.01.2010 17:18
извлечение текста и стилевой разметки из doc на с++ valid Общие вопросы C/C++ 0 06.04.2009 01:32
ввод информации с клавиутуры в двумерный масив, запись информации с масива в файл x_omega_x Помощь студентам 1 29.12.2008 02:30