Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > C/C++ программирование > Общие вопросы C/C++
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 05.06.2016, 23:53   #1
Krasi
Форумчанин
 
Регистрация: 12.02.2010
Сообщений: 787
По умолчанию Библиотека для распознавания речи и как ею пользоваться

Я недавно понял, что хочу свою систему, которой можно:

1. Давать голосовые команды.
2. Получать голосовой ответ.
3. По распознаммым командам совершать некоторые действия.

Нужна хорошая библиотека по распознаванию речевых команд. Желательно, в которой есть возможность обучения к конкретному пользователю.

Если заранее знаете библиотеки по синтезу речи - здорово.
Krasi вне форума Ответить с цитированием
Старый 06.06.2016, 00:14   #2
Smitt&Wesson
Старожил
 
Аватар для Smitt&Wesson
 
Регистрация: 31.05.2010
Сообщений: 13,543
По умолчанию

Ну, знаю. Счастья тебе это не принесёт. Бесплатных нет, а у платных, цены начинаются с планки 2 000$. Всё, что ниже - лохотронные поделки или просто - разводилово.
Пиши пьяным, редактируй трезвым.
Справочник по алгоритмам С++ Builder
Smitt&Wesson вне форума Ответить с цитированием
Старый 06.06.2016, 11:22   #3
pproger
C++ hater
СтарожилДжуниор
 
Аватар для pproger
 
Регистрация: 19.07.2009
Сообщений: 3,333
По умолчанию

Цитата:
Сообщение от Krasi Посмотреть сообщение
Я недавно понял, что хочу свою систему, которой можно:

1. Давать голосовые команды.
2. Получать голосовой ответ.
3. По распознаммым командам совершать некоторые действия.

Нужна хорошая библиотека по распознаванию речевых команд. Желательно, в которой есть возможность обучения к конкретному пользователю.

Если заранее знаете библиотеки по синтезу речи - здорово.
eSpeak, festival, ms speech engine
I invented the term Object-Oriented, and I can tell you I did not have C++ in mind. (c)Alan Kay

My other car is cdr.

Q: Whats the object-oriented way to become wealthy?
A: Inheritance
pproger вне форума Ответить с цитированием
Старый 06.06.2016, 12:42   #4
Krasi
Форумчанин
 
Регистрация: 12.02.2010
Сообщений: 787
По умолчанию

Ок, поразбираюсь. А вот я нашел компромисс: я вчера нашел пример распознавания речи в Матлаб за счет нейросети, поэтому немного расширяю вопрос, если это нелегко - мне нужна любая опция распознавания сети, которую я могу обучать и встраивать в свое приложение.

Суть в том, что вчера я сделал базу слов, обучил нейросеть и программа, в результате, отлично определяла сказанные слова.
Но тут я понял 2 недостатка, из-за которых я не могу использовать такой способ распознавания речи, если Вы не предложите что-нибудь.

1. Если я называю слово, которого еще нет в базе данных, то программа все-равно выбирает слово из базы данных. Как можно сделать, чтобы она вместо поиска решения при наличии вопроса спросила бы: введите текстом, что означает эта фраза, этого слова я не знаю и хочу его выучить...

2. Если я обучу систему стандартной фразе, а потом просто добавлю еще одно слово к этой фразе, либо вставлю его в середину фразы, то система меня не поймет при большой базе данных. Система не может принять сразу 2 решения, она находит только одно заученное слово... Как быть с этим?

Ну и, вообще говоря, хочу спросить: а сложно ли распознавать речь разных тембров. То есть если я поменяю микрофон или за меня команду скажет моя жена, то устройство сначала этого не поймет. А хотелось бы. Как бы вы предложили, делать распознавание сразу для всех людей, или только под себя?
Krasi вне форума Ответить с цитированием
Старый 06.06.2016, 12:45   #5
Krasi
Форумчанин
 
Регистрация: 12.02.2010
Сообщений: 787
По умолчанию

И насчет синтезаторов речи... Я бы хотел использовать не стандартный голос, а например, свой или жены и тп...
Как можно обучить тот же синтезатор eSpeak (можно и другой...) говорить моим голосом?
Krasi вне форума Ответить с цитированием
Старый 06.06.2016, 14:27   #6
pproger
C++ hater
СтарожилДжуниор
 
Аватар для pproger
 
Регистрация: 19.07.2009
Сообщений: 3,333
По умолчанию

Цитата:
или жены и тп
а жена о тп знает?
I invented the term Object-Oriented, and I can tell you I did not have C++ in mind. (c)Alan Kay

My other car is cdr.

Q: Whats the object-oriented way to become wealthy?
A: Inheritance
pproger вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Программа распознавания русской речи - Комбат denis47 Помощь студентам 10 25.06.2016 22:39
как пользоваться буферами в Дельфи для анимации и движение картинак? TLabel Gamedev - cоздание игр: Unity, OpenGL, DirectX 1 02.01.2011 20:59
Для создания файла правил выгрузки в xml формате чем пользоваться и как? Аэлита Ивановна Помощь студентам 0 15.02.2010 12:53
Объясните плх для чего нужен блок try except finally и как им пользоваться) TwiX Общие вопросы Delphi 7 02.10.2009 12:27
Программа для разпознавания речи Иллидан Софт 3 25.03.2008 20:37