Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > IT форум > Помощь студентам
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 26.09.2012, 22:10   #11
VIK_aka_TOR
Участник клуба
 
Аватар для VIK_aka_TOR
 
Регистрация: 30.01.2011
Сообщений: 1,578
По умолчанию

найдите себе девушку... и не нужно будет искать возможности разговаривать с компьютером...
а так да... С++ за 21 день...))) и через пару лет что нибудь получится...)
пишу код не только за печеньки
VIK_aka_TOR вне форума Ответить с цитированием
Старый 26.09.2012, 22:43   #12
ViktorR
Старожил
 
Регистрация: 23.10.2010
Сообщений: 2,309
По умолчанию

Конечно же эту тему лучше перенести в другое место, но все же ...
Цитата:
Просто людям лень на клавиши нажимать стало. Вот и появляются очередные Маниловы.
Было бы порой чем нажимать.

Цитата:
найдите себе девушку...
Это о парочке, где парень в Афгане потерял руки и ноги и теперь она носит его как куклу?

Жаль конечно, что на сегодня нет достойного решения.
Меня, в свое время поразила работа друзей для известного ученого С.У. Хокинга, которому сделали синтезатор речи, а затем и устройство, которое реагирует на подвижность мимической мышци для общения с окружающим миром, используя "аля RS-232 протокол" ...
Как-то так, ...
ViktorR вне форума Ответить с цитированием
Старый 27.09.2012, 00:10   #13
LightRain
 
Регистрация: 24.09.2012
Сообщений: 3
По умолчанию

>Вы охрипните и программа Вас не узнает. Соответственно не сможете получить доступ к функциям.
Если получится научить программу воспринимать мой голос, то с охрипшей версией будет чуть меньше мороки

>Способное адекватно воспринимать различные вариации одной и той же команды, намного сложнее
Команды должны быть фиксированные, чтобы не получилось случайных активаций.
Впрочем вы правы. Программа будет больше походить на человека, если будут разные варианты.

>Поэтому начните с изучения C++ воспользовавшись новейшей ускоренной методикой за 21 день.
Уже

>Без очень приличного знания темы в целом, и уж тем более, без знания программирования .... Флаг в руки ...
Я всё-таки начал изучать программирование, так что ждите от меня великих открытий :3

>Да это пошесть какая-то, четвертая тема за неделю с голосовым управлением
Тема голосового управления популярна

>Dragon Dictate
Эту программу ещё не пробовал. Попробую) Спасибо

>Найдите себе девушку... и не нужно будет искать возможности разговаривать с компьютером...
Компьютору не нужен шопинг и он не истерит xD Впрочем может и истерить, смотря сколько вирусов нацеплять х)

>А так да... С++ за 21 день...))) и через пару лет что нибудь получится...)
Всё может быть. Я не буду сдаваться, пока окончательно не пойму, что это невозможно х)

>Было бы порой чем нажимать.
А вот отрывать мне руки-ноги раньше времени не надо х) Отсутствие конечностей не обязательное условие для пользования такого рода программами.

Спасибо за внимание к моему вопросу)

По теме программ, имитирующих человеческое поведение...
LightRain вне форума Ответить с цитированием
Старый 27.09.2012, 05:35   #14
Smitt&Wesson
Старожил
 
Аватар для Smitt&Wesson
 
Регистрация: 31.05.2010
Сообщений: 13,543
По умолчанию

Братва, кончайте холиварить!
А если по-теме, лет 15 назад, я занимался этой темой. Но на том оборудовании, это было сложно осуществить (может на этом по-проще окажется).
Большинство распознавателей речи, строятся на предположении, что каждое слово состоит из фонем. То-есть из отдельных блоков со специфическим спектром. Именно поэтому они могут работать только с одним оператором.
Но люди понимают и охрипших людей (хотя с некоторыми затруднениями).
Я пришёл к выводу, что нужно опираться не только на фонемы, но и на форманты и дифтонги, а так-же на взрывные согласные.
Если посмотреть на осциллограмму произносимых слов, мы увидим примерно такую картину. После паузы, идёт резкое нарастание звука. Этот звуковой скачёк, несёт практически всю (в большинстве случаев) информацию о слове.
Затем идут ещё несколько подобных всплесков. Мои измерения показали, что при любом темпе речи и у разных операторов, абсолютное соотношение этих всплесков (размерность) одинакова, для одних и тех-же слов.
Таким образом, можно построить распознаватель, опирающийся только на эту особенность языка. Моё устройство (АЦП и анализатор созданный на РК-86) распознавало, по этому принципу до 50% слов. Причём, распознавание длинных слов, происходило лучше, чем коротких. Я это связываю с тем, что для коротких слов, "рисунок" звуковой характеристики совпадал в большей степени.
Я это к чему?
В первую очередь, нужно проверять общий рисунок всплесков (не помню как он называется).
Если совпадений много, анализируются дифтонги (переходы между гласными) и если опять совпадений много - анализируются фонемы.
Если и в этом случае получаем более одного совпадения - компьютер просит повторить слово (или фразу), как это делает человек, в случае недопонимания.
Вот, примерно так, исходя из моего скромного опыта в этом вопросе.

Кому интересно, могу показать фотку того "распознавателя" (если найду) .
Пиши пьяным, редактируй трезвым.
Справочник по алгоритмам С++ Builder

Последний раз редактировалось Smitt&Wesson; 27.09.2012 в 05:43.
Smitt&Wesson вне форума Ответить с цитированием
Старый 27.09.2012, 07:29   #15
Utkin
Старожил
 
Аватар для Utkin
 
Регистрация: 04.02.2009
Сообщений: 17,351
По умолчанию

Цитата:
Если получится научить программу воспринимать мой голос, то с охрипшей версией будет чуть меньше мороки
Угу, и с простуженным тоже никаких проблем. И когда у Вас гайморит, не дай Аллах, случится.
Маньяк-самоучка
Utkin появился в результате деления на нуль.
Осторожно! Альтернативная логика
Utkin вне форума Ответить с цитированием
Старый 28.09.2012, 08:54   #16
Smitt&Wesson
Старожил
 
Аватар для Smitt&Wesson
 
Регистрация: 31.05.2010
Сообщений: 13,543
По умолчанию

Да, вот нашёл свой "распознаватель".
Даже смешно его сейчас разглядывать.
Изображения
Тип файла: jpg speech_recognizer.jpg (129.0 Кб, 73 просмотров)
Пиши пьяным, редактируй трезвым.
Справочник по алгоритмам С++ Builder
Smitt&Wesson вне форума Ответить с цитированием
Старый 28.09.2012, 09:00   #17
Utkin
Старожил
 
Аватар для Utkin
 
Регистрация: 04.02.2009
Сообщений: 17,351
По умолчанию

Короче он ищет Siri - только предупреждаю сразу, такие проги стучат на своих пользователей (вплоть до записей голосовых запросов).
Маньяк-самоучка
Utkin появился в результате деления на нуль.
Осторожно! Альтернативная логика
Utkin вне форума Ответить с цитированием
Старый 28.09.2012, 09:28   #18
DiemonStar
Старожил
 
Регистрация: 08.02.2012
Сообщений: 2,173
По умолчанию

Цитата:
Команды должны быть фиксированные, чтобы не получилось случайных активаций.
Так это уже давно в мобильниках сделано. Голосовой набор называется. Записывается эталон звуковой команды и дальше уже команды сравниваются с этим эталоном.
Правильно поставленная задача - три четверти решения.
DiemonStar вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
ищу программу из статьи !!! RS23 Помощь студентам 4 18.03.2012 16:45
Ищу программу TP andrewpalkin Паскаль, Turbo Pascal, PascalABC.NET 2 07.12.2010 20:02
Ищу программу. _Malinka_ Софт 1 06.10.2010 14:32
Ищу программу marikkk Assembler - Ассемблер (FASM, MASM, WASM, NASM, GoASM, Gas, RosAsm, HLA) и не рекомендуем TASM 0 15.05.2010 14:01
Ищу программу Demitriy Софт 0 11.06.2009 14:12