|
|
Регистрация Восстановить пароль |
Повторная активизация e-mail |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
|
Опции темы | Поиск в этой теме |
12.05.2013, 15:59 | #1 |
Пользователь
Регистрация: 12.05.2013
Сообщений: 11
|
Извлечение фактов из текста
Ребята,помогите,пожалуйста,набросат ь программку для извлечения фактов из текста. Например, "Андрей Васильев,директор торговой сети Евроопт заключил сделку с крупными поставщиками из России". Из этого должно быть извлечено:
Имя: Андрей Васильев Должность: Директор Организация:Евроопт |
12.05.2013, 16:04 | #2 |
Новичок
Джуниор
Регистрация: 11.10.2011
Сообщений: 3,882
|
Какой язык?
Я правильно понимаю, что : Всё что идет до запятой - это подходит под нашу графу "имя". Дальше (после запятой) - "должность" А то что с Большой буквы - организация.. ? |
12.05.2013, 16:10 | #3 |
Старожил
Регистрация: 16.05.2012
Сообщений: 3,211
|
нифига себе "помогите"! Этак полноценную коммерческую софтину можно в качестве лабораторной сделать.
Ну для начала положим, что фактами могут служить: 1) существительные; 2) Имена собственные (и фамилии); Это автоматически отсечет из предложения все, что не является фактом. Следующий шаг: выделить имя (для этого используем словарь имен, словарь фамилий), выделить должность (словарь должностей), выделить наименование фирмы (два варианта - либо словарь наименований фирм использовать, либо относить к фирме все имена собственные, отсутствующие в первом словаре). Словарь наименований фирм имхо невыгоден просто потому, что у нас в стране этих фирм - как навоза за баней, и каждый в названии извращается как может. Со вторым способом тоже есть проблема - предположим, фирма называется "Валентина" в честь любимой тещи - в первом словаре она есть. Поэтому имеет смысл проверки сочетания "Имя-Фамилия" - если у имени есть фамилия, то это человек, если нет - то фирма. Как-то так. Размышления чисто от фонаря.
Начал решать проблему с помощью регулярных выражений. Теперь решаю две проблемы...
|
12.05.2013, 16:21 | #4 | ||
Санитар
Старожил
Регистрация: 04.10.2008
Сообщений: 2,577
|
ну да, такая штука стоит бесконечно много и вобще, почти нереальна если нет никаких ограничений на предложения.
Цитата:
Цитата:
|
||
12.05.2013, 16:26 | #5 | |
Старожил
Регистрация: 16.05.2012
Сообщений: 3,211
|
Цитата:
"Россия. Петров украл коров и был таков" Россия Петров - это человек
Начал решать проблему с помощью регулярных выражений. Теперь решаю две проблемы...
|
|
12.05.2013, 16:50 | #6 |
Пользователь
Регистрация: 12.05.2013
Сообщений: 11
|
мне нужна элементарная программка,чтобы хотя бы одно это предложение разобрала и всё
|
12.05.2013, 16:54 | #7 | |
Старожил
Регистрация: 16.05.2012
Сообщений: 3,211
|
Цитата:
Начал решать проблему с помощью регулярных выражений. Теперь решаю две проблемы...
|
|
12.05.2013, 16:56 | #8 |
Пользователь
Регистрация: 12.05.2013
Сообщений: 11
|
|
12.05.2013, 16:59 | #9 | |
Белик Виталий :)
Старожил
Регистрация: 23.07.2007
Сообщений: 57,097
|
Цитата:
I'm learning to live...
|
|
12.05.2013, 17:06 | #10 |
Пользователь
Регистрация: 12.05.2013
Сообщений: 11
|
где я могу взять словари и как их подключать?
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
извлечение информации из текста | Alejandr0 | Microsoft Office Word | 2 | 06.09.2010 14:23 |
RichViewEdit, извлечение текста | Alter | Компоненты Delphi | 3 | 02.05.2010 14:02 |
извлечение текста | Kavaler2i | Общие вопросы Delphi | 1 | 27.01.2010 17:18 |
извлечение текста и стилевой разметки из doc на с++ | valid | Общие вопросы C/C++ | 0 | 06.04.2009 01:32 |