Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > IT форум > Помощь студентам
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 12.05.2013, 15:59   #1
Лизавета7
Пользователь
 
Регистрация: 12.05.2013
Сообщений: 11
По умолчанию Извлечение фактов из текста

Ребята,помогите,пожалуйста,набросат ь программку для извлечения фактов из текста. Например, "Андрей Васильев,директор торговой сети Евроопт заключил сделку с крупными поставщиками из России". Из этого должно быть извлечено:
Имя: Андрей Васильев
Должность: Директор
Организация:Евроопт
Лизавета7 вне форума Ответить с цитированием
Старый 12.05.2013, 16:04   #2
Poma][a
Новичок
Джуниор
 
Регистрация: 11.10.2011
Сообщений: 3,882
По умолчанию

Какой язык?
Я правильно понимаю, что :
Всё что идет до запятой - это подходит под нашу графу "имя".
Дальше (после запятой) - "должность"
А то что с Большой буквы - организация..
?
Poma][a вне форума Ответить с цитированием
Старый 12.05.2013, 16:10   #3
Sciv
Старожил
 
Аватар для Sciv
 
Регистрация: 16.05.2012
Сообщений: 3,211
По умолчанию

нифига себе "помогите"! Этак полноценную коммерческую софтину можно в качестве лабораторной сделать.

Ну для начала положим, что фактами могут служить: 1) существительные; 2) Имена собственные (и фамилии);

Это автоматически отсечет из предложения все, что не является фактом.

Следующий шаг: выделить имя (для этого используем словарь имен, словарь фамилий), выделить должность (словарь должностей), выделить наименование фирмы (два варианта - либо словарь наименований фирм использовать, либо относить к фирме все имена собственные, отсутствующие в первом словаре).

Словарь наименований фирм имхо невыгоден просто потому, что у нас в стране этих фирм - как навоза за баней, и каждый в названии извращается как может.
Со вторым способом тоже есть проблема - предположим, фирма называется "Валентина" в честь любимой тещи - в первом словаре она есть. Поэтому имеет смысл проверки сочетания "Имя-Фамилия" - если у имени есть фамилия, то это человек, если нет - то фирма.

Как-то так. Размышления чисто от фонаря.
Начал решать проблему с помощью регулярных выражений. Теперь решаю две проблемы...
Sciv вне форума Ответить с цитированием
Старый 12.05.2013, 16:21   #4
rrrFer
Санитар
Старожил
 
Аватар для rrrFer
 
Регистрация: 04.10.2008
Сообщений: 2,577
По умолчанию

ну да, такая штука стоит бесконечно много и вобще, почти нереальна если нет никаких ограничений на предложения.

Цитата:
Евроопт заключил сделку с крупными поставщиками из России"
Цитата:
А то что с Большой буквы - организация..
России - тоже организация, причем названия организаций начинают склоняца даже в этом примере )
rrrFer вне форума Ответить с цитированием
Старый 12.05.2013, 16:26   #5
Sciv
Старожил
 
Аватар для Sciv
 
Регистрация: 16.05.2012
Сообщений: 3,211
По умолчанию

Цитата:
России - тоже организация, причем названия организаций начинают склоняца даже в этом примере )
Согласен, не учел этого. Нужен целиком словарь имен собственных - людей, городов, стран. С учетом падежей. И анализ знаков препинания, а то еще решит, что в предложении:

"Россия. Петров украл коров и был таков"

Россия Петров - это человек
Начал решать проблему с помощью регулярных выражений. Теперь решаю две проблемы...
Sciv вне форума Ответить с цитированием
Старый 12.05.2013, 16:50   #6
Лизавета7
Пользователь
 
Регистрация: 12.05.2013
Сообщений: 11
По умолчанию

мне нужна элементарная программка,чтобы хотя бы одно это предложение разобрала и всё
Лизавета7 вне форума Ответить с цитированием
Старый 12.05.2013, 16:54   #7
Sciv
Старожил
 
Аватар для Sciv
 
Регистрация: 16.05.2012
Сообщений: 3,211
По умолчанию

Цитата:
мне нужна элементарная программка,чтобы хотя бы одно это предложение разобрала и всё
Тогда вернемся к посту Ромахи (№2 в этой теме): какой язык программирования?
Начал решать проблему с помощью регулярных выражений. Теперь решаю две проблемы...
Sciv вне форума Ответить с цитированием
Старый 12.05.2013, 16:56   #8
Лизавета7
Пользователь
 
Регистрация: 12.05.2013
Сообщений: 11
По умолчанию

Цитата:
Сообщение от Sciv Посмотреть сообщение
Тогда вернемся к посту Ромахи (№2 в этой теме): какой язык программирования?
Язык программирования- Делфи
Лизавета7 вне форума Ответить с цитированием
Старый 12.05.2013, 16:59   #9
Stilet
Белик Виталий :)
Старожил
 
Аватар для Stilet
 
Регистрация: 23.07.2007
Сообщений: 57,097
По умолчанию

Цитата:
нужна элементарная программка
Кажется без словарей тут не обойтись.
I'm learning to live...
Stilet вне форума Ответить с цитированием
Старый 12.05.2013, 17:06   #10
Лизавета7
Пользователь
 
Регистрация: 12.05.2013
Сообщений: 11
По умолчанию

где я могу взять словари и как их подключать?
Лизавета7 вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
извлечение информации из текста Alejandr0 Microsoft Office Word 2 06.09.2010 14:23
RichViewEdit, извлечение текста Alter Компоненты Delphi 3 02.05.2010 14:02
извлечение текста Kavaler2i Общие вопросы Delphi 1 27.01.2010 17:18
извлечение текста и стилевой разметки из doc на с++ valid Общие вопросы C/C++ 0 06.04.2009 01:32