Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > IT форум > Общие вопросы по программированию, компьютерный форум
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 04.07.2019, 14:06   #1
WorldMaster
Старожил
 
Аватар для WorldMaster
 
Регистрация: 25.08.2011
Сообщений: 2,841
По умолчанию Словарь слов.

Здравствуйте. Подскажите пожалуйста где можно взять словарь всех слов русского языка с описанием морфологических свойств.

Скачал вот отсюда словарь зализняка. Но он какой то до жути мутный. Описания слов где то есть где то нету. Причем описания видимо собирали с разных источников в итоге нету четкого поняти что относится к существительным что к глаголам и так далее.
Вот пример некоторых слов:
Цитата:
"полгорода 5 #1"
"полдвенадцатого 8.2 #2"
Вот что это за описание такое ...

а викисловарь очень все достойно описывает
Цитата:
полго́рода - Существительное, неодушевлённое, средний род, несклоняемое
по̀лдвена́дцатого - Наречие; неизменяемое.
Если кто знает как выкачать словарь из викисловаря с удовольствием послушал бы. Или может у кого то есть база сформированная.

Спасибо.
Skype - wmaster_s E-Mail - WorldMasters@gmail.com
Работаем по 3 критериям - быстро, качественно, недорого. Заказчик выбирает любые два.
WorldMaster вне форума Ответить с цитированием
Старый 04.07.2019, 16:07   #2
Pavia
Лис
Старожил
 
Аватар для Pavia
 
Регистрация: 18.09.2015
Сообщений: 2,409
По умолчанию

Вики словарь выкачить можно отсюда
https://github.com/itkach/slob/wiki/...ies#wiktionary
Описание формата файла простое
https://github.com/itkach/slob

Из минусов
Цитата:
Сообщение от WorldMaster Посмотреть сообщение
а викисловарь очень все достойно описывает
Та же самая помойка. 1 миллион страниц. Из них 800 тысяч пустых.
Из оставшихся 200 только ~100 страниц имеют описание морфологии.

Единого шаблона нет. Но судя по всему это автосгенерированный текст. Так что регуляторами можно попытаться вытащить к какой части речи относится.
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
У дзен программиста программа делает то что он хотел, а не то что он написал .
Pavia вне форума Ответить с цитированием
Старый 04.07.2019, 16:36   #3
Pavia
Лис
Старожил
 
Аватар для Pavia
 
Регистрация: 18.09.2015
Сообщений: 2,409
По умолчанию

http://odict.ru (Скачать словарь,)
Первая цифра позиция ударения ударение затем код слова

м — существительное мужского рода неодушевленное
мо — существительное мужского рода одушевленное
ж — существительное женского рода неодушевленное
жо — существительное женского рода одушевленное
с — существительное среднего рода неодушевленное
со — существительное среднего рода одушевленное
мо-жо — существительное так наз. общего рода одушевленное (т. е. выступающее как
существительное мужского рода при обозначении мужчин, женского рода — при обозначении
женщин)
мн. (без слова от), мн. неод., мн. одуш.— существительные группы pluralia tantura (см.
стр. 5); одушевленность — неодушевленность, если она не указана прямо, определяется
дополнительным буквенным символом (который в этом случае обязательно имеется)
мн. от — форма мн. числа от существительного, употребляющегося также и в единственном
числе (см. стр. 5) и обозначенного после слова от его основным буквенным символом и индексом
(или приведенного непосредственно)

п — прилагательное
мс — местоимение (точнее, местоимение-существительное; см. также стр. 6)
мс-п — местоименное прилагательное
част. — частица
числ.-— числительное (количественное или собирательное; см. также стр. 6)
числ.-п — порядковое числительное (= счетное прилагательное)
св — глагол совершенного вида
нсв — глагол несовершенного вида
св-нсв — двувидовой глагол (т. е. могущий выступать и как глагол совершенного, и как глагол несовершенного вида).
союз — союз

Пометы:
нп — непереходный глагол.
«безл.» — обозначение безличных глаголов.
Помета «многокр.» — обозначение многократных глаголов.

Затем индекс склонения и отступления. Но с ним всё труно там проще взять уже синтизированные варианты. http://odict.ru (Скачать словарь словоформ,)
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
У дзен программиста программа делает то что он хотел, а не то что он написал .

Последний раз редактировалось Pavia; 04.07.2019 в 17:06.
Pavia вне форума Ответить с цитированием
Старый 04.07.2019, 20:24   #4
WorldMaster
Старожил
 
Аватар для WorldMaster
 
Регистрация: 25.08.2011
Сообщений: 2,841
По умолчанию

одикт это тотже зализняк. с теми же самыми косяками. По сути мне прям все формы не нужны. Набросал парсер страниц с викисловаря. Проверю тот же зализняк и в целом это должно дать нормальный результат.

А про помойку есть пример слов где викисловарь не дает результата?
Skype - wmaster_s E-Mail - WorldMasters@gmail.com
Работаем по 3 критериям - быстро, качественно, недорого. Заказчик выбирает любые два.
WorldMaster вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
посчитать количество всех слов,слов-маркеров и процент слов-маркеров ksenya91 Помощь студентам 9 09.01.2013 07:00
Словарь с частотою повторений слов sabaton Общие вопросы C/C++ 11 08.04.2010 21:13
Словарь.База слов. Chartvit Общие вопросы C/C++ 0 22.11.2009 12:10
Словарь. База слов. Chartvit Помощь студентам 0 22.11.2009 01:22
Словарь служебных слов языка delphi Kate68 Помощь студентам 1 09.11.2009 22:06