Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Скриптовые языки программирования > Python
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 01.04.2024, 14:03   #1
Ципихович Эндрю
Старожил
 
Регистрация: 24.01.2011
Сообщений: 3,043
По умолчанию Прогнозирование завершения слов=словосочетаний

здравствуйте прогнозирование- штука тёмная))
но то что под капотом у одного из простых примеров
Код:
import nltk # pip install nltk
from nltk.util import ngrams
from collections import defaultdict

# Assume we have a large corpus of text data
with open("i:/replaces/AllDoc.txt", 'r', encoding='utf-8') as f_in:  # исходные файлы
    text_data = f_in.read()


# Create a list of all possible words in the text data
words = text_data.split()

# Build an n-gram model with n=2 (bi-grams)
bigrams = list(ngrams(words, 2))

# Create a frequency distribution of the bi-grams
freq_dist = defaultdict(int)
for bi_gram in bigrams:
    freq_dist[bi_gram[0]] += 1

# Now we can use the frequency distribution to predict the next word based on the current word
current_word = "значительный"
predictions = [word for word, freq in freq_dist.items() if word.startswith(current_word[len(current_word)-1])]

print(predictions)
ни в какие ворота
выдало ответ ['йенах,', 'йод,'] - тушите свет
есть у кого пример кода получше, в датасете закондательство РФ, спасибо
Ципихович Эндрю вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Помогите с макросом: поиск и подсчет словосочетаний в примечаниях Alex_dolg Microsoft Office Word 3 05.11.2016 19:19
Прогнозирование осадков TURIK Паскаль, Turbo Pascal, PascalABC.NET 1 20.12.2011 17:56
Заплачу за создание системы для выбора правильного перевода слов (а). Словосочетаний. aquatell Фриланс 0 10.05.2011 10:44
прогнозирование excel dron7sem Фриланс 0 07.05.2011 23:57
Анализ словосочетаний. PUH Помощь студентам 19 11.06.2008 01:53