Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > IT форум > Общие вопросы по программированию, компьютерный форум
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 28.10.2020, 19:10   #11
kvitaliy
Участник клуба
 
Регистрация: 17.05.2011
Сообщений: 1,660
По умолчанию

Цитата:
Сообщение от NetSpace Посмотреть сообщение
да это просто моя мечта - программно переводить микрофонную речь в печатный текст.
Да в чем проблема то?
Включай смартфон и диктуй. Гугл давно это реализовал, работает вполне сносно.
kvitaliy вне форума Ответить с цитированием
Старый 28.10.2020, 21:14   #12
MihalNik
МегаМодератор
СуперМодератор
 
Регистрация: 27.11.2012
Сообщений: 5,723
По умолчанию

Цитата:
Сообщение от babai-rais Посмотреть сообщение
Это классический пример определения частоты сигнала основного тона, Распознавание речи начиналось с этого. таких программ уже тысячи. Создать графическое отображение результатов измерения тоже очень просто, полно таких программ.
Новизна моей идеи в том что я не предлагаю измерять частоту одиночного сигнала а сравнивать частоту с последующим сигналом. Звук "а" как продемонстрировано в ролике может расположится на любой высоте нотной линейки но он все равно остается буквой "а" следовательно для понимания что это именно буква "а", частота не имеет ни какого значения и измерять ее нет особого смысла.
Во-первых, идея слишком очевидна и вряд ли нова. Во-вторых, частота имеет смысл. В-третьих, жуткий поток формулировок, которые вообще не нужны.
Благими намерениями устлана дорога на programmersforum.ru

Последний раз редактировалось MihalNik; 28.10.2020 в 21:18.
MihalNik вне форума Ответить с цитированием
Старый 28.10.2020, 22:34   #13
babai-rais
Пользователь
 
Регистрация: 27.10.2020
Сообщений: 36
По умолчанию

Цитата:
Сообщение от MihalNik Посмотреть сообщение
Во-первых, идея слишком очевидна и вряд ли нова.
Для того и зашел на форум чтобы обсудить идею, может кто то подскажет почему такой алгоритм не даст результатов.

Последний раз редактировалось babai-rais; 28.10.2020 в 22:37.
babai-rais вне форума Ответить с цитированием
Старый 28.10.2020, 23:02   #14
MihalNik
МегаМодератор
СуперМодератор
 
Регистрация: 27.11.2012
Сообщений: 5,723
По умолчанию

Почему не даст? На нейросети можно натянуть даже такую дичь как двухбуквенные сочетания.
Благими намерениями устлана дорога на programmersforum.ru

Последний раз редактировалось MihalNik; 28.10.2020 в 23:07.
MihalNik вне форума Ответить с цитированием
Старый 29.10.2020, 06:26   #15
Pavia
Лис
Старожил
 
Аватар для Pavia
 
Регистрация: 18.09.2015
Сообщений: 2,409
По умолчанию

Цитата:
Сообщение от babai-rais Посмотреть сообщение
Для того и зашел на форум чтобы обсудить идею, может кто то подскажет почему такой алгоритм не даст результатов.
Вы уже всё для себя решили. Смысл Вас отговаривать? Тут только можно посочувствовать и сказать, что надо делать. Работать не будет по многим причинам.
Вы бы основы распознавания открыли и посмотрели.

Звуки давно классифицированы. Есть шипящие, есть гласные, а есть звуки смыкания и размыкания и прочие переходные процессы.
Так вот резонанс это только для гласных. А ваша идея ещё сильнее ограничивает так как тежи О и У отличаются насколько помню не соотношением, а именно частотой.
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
У дзен программиста программа делает то что он хотел, а не то что он написал .
Pavia вне форума Ответить с цитированием
Старый 29.10.2020, 09:30   #16
babai-rais
Пользователь
 
Регистрация: 27.10.2020
Сообщений: 36
По умолчанию

Цитата:
Сообщение от Pavia Посмотреть сообщение
Звуки давно классифицированы. Есть шипящие, есть гласные, а есть звуки смыкания и размыкания и прочие переходные процессы.
Основы фонетики в школе уже с первого класса дают.
babai-rais вне форума Ответить с цитированием
Старый 29.10.2020, 09:50   #17
babai-rais
Пользователь
 
Регистрация: 27.10.2020
Сообщений: 36
По умолчанию

Цитата:
Сообщение от Pavia Посмотреть сообщение
А ваша идея ещё сильнее ограничивает так как тежи О и У отличаются насколько помню не соотношением, а именно частотой.
Мой алгоритм не может отличить одну от другой отдельно произнесенную гласную. Если сильно упростить, гласные звуки это периодические сигналы с определенной окраской звука. Если убрать окраску то будем иметь гармонические колебания определенной частоты. Для женских голосов эти звуки будут выше для мужских ниже. Мужской голос можем сделать женским при ускоренной прослушивании, а женский мужским при замедлении. Согласитесь ли с этим?
babai-rais вне форума Ответить с цитированием
Старый 29.10.2020, 10:41   #18
babai-rais
Пользователь
 
Регистрация: 27.10.2020
Сообщений: 36
По умолчанию

Цитата:
Сообщение от Pavia Посмотреть сообщение
Вы бы основы распознавания открыли и посмотрели.
Существуют следующие процедуры обработки:
временная;
частотная;
частотно-временная.
В основах распознавания входной сигнал нарезается на фреймы по 10-12 мсек с перекрытием. Я предлагаю не резать фонограмму а анализировать в непрерывном скользящем окне которое получается сдвигом, В этом скользящем окне происходит беспрерывная регистрация соотношений следующих друг за другом периодов сигнала а в существующих алгоритмах происходит анализ сигнала в фреймах. Способ предлагаемый мной на порядок грубее и проще и не имеет ни чего общего с традиционными способами обработки звука.
babai-rais вне форума Ответить с цитированием
Старый 29.10.2020, 10:56   #19
digitalis
Старожил
 
Аватар для digitalis
 
Регистрация: 04.02.2011
Сообщений: 4,534
По умолчанию

Ну дык в путь. Нобелевка, может, и не светит, то хоть госпремия и докторская без защиты.
Но для начала хорошо бы научиться пользоваться форумом - не лепить посты один за другим, а добавлять правкой в предыдущий.
Весной и осенью активизируются изобретатели вечных двигателей и панацей от всех болезней.

Последний раз редактировалось digitalis; 29.10.2020 в 11:01.
digitalis вне форума Ответить с цитированием
Старый 29.10.2020, 12:17   #20
babai-rais
Пользователь
 
Регистрация: 27.10.2020
Сообщений: 36
По умолчанию

Цитата:
Сообщение от digitalis Посмотреть сообщение
Ну дык в путь. Нобелевка, может, и не светит, то хоть госпремия и докторская без защиты.
Не надо издеваться.
Цитата:
Сообщение от digitalis Посмотреть сообщение
Но для начала хорошо бы научиться пользоваться форумом - не лепить посты один за другим, а добавлять правкой в предыдущий.
Хотелось бы обсудить идею а не мои знания и умения. Если бы я умел все сформулировать и оформить то я бы патентную заявку сделал или в серьезный журнал написал.
babai-rais вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Автоматическое распознавание речи IADom Безопасность, Шифрование 1 04.11.2020 13:36
C# Распознавание речи satirikzn Фриланс 0 23.05.2015 14:51
Распознавание речи SpeechAPI rmv240899 Помощь студентам 2 23.11.2012 21:39
Распознавание речи Артегор Visual C++ 3 11.06.2012 22:47
Распознавание речи php Krasi PHP 5 29.08.2011 08:37