Распознавание речи без библиотек - Общие вопросы по программированию, компьютерный форум - Страница 5

Pavia · 02.11.2020, 11:18

Цитата:

Сообщение от babai-rais

7. Дальнейшая обработка сигнала думается будет так же по линейному алгоритму. Об этом пока не думал.

Задача распознавание это отнесение данных к одному из классов. Классами могут быть буквы или слова или фонемы. Последние не имеют четкого количества, поэтому в разных работах требуется ещё и кластеризация выделения классов под конкретный алгоритм.
Так что пока что у вас пред обработка. Это даже близко не распознавание.

Цитата:

Сообщение от babai-rais

8. Для музыкального сигнала такой алгоритм вполне рабочий это можно доказать простыми арифметическими действиями без высшей математики. действиями. Доказательств не привожу это может сделать каждый простыми умозаключениями.

От теории до практики большая пропасть.

Цитата:

Сообщение от babai-rais

Я так думаю, что периодические сигналы это импульсы тока различной формы, гармонические, прямоугольные, пилообразные и так далее. Я как то не так формулирую?

Дело в том что музыка это не импульсы, а смесь различных звуков периодических и не периодических. Без чёткой границы между ними. Поэтому результаты работать будут далеки от желаемых. Тут реально огромная пропасть между теорий и практикой.

Цитата:

Сообщение от babai-rais

Получим картину как сдвинутый негатив и позитив.

10-50 мс это разные фонемы. Вот только разные фонемы имеют разную длительность.

babai-rais · 03.11.2020, 09:26

Цитата:

Сообщение от Pavia

Задача распознавание это отнесение данных к одному из классов. Классами могут быть буквы или слова или фонемы. Последние не имеют четкого количества, поэтому в разных работах требуется ещё и кластеризация выделения классов под конкретный алгоритм.
Так что пока что у вас пред обработка. Это даже близко не распознавание.

На выходе получаются данные количество комбинаций которых имеют предел, значит может быть таблица или алфавит или что то другое алгоритмы работы с которыми уже давно разработаны. Я не программист, по моему разумению получается алфавит?! Из чередования единичек и нулей можно создать укрупненный код для дикторо зависимого распознавания. По этому коду можно вычислить диктора. Это идея подойдет для дипломной работы. Может получится простая программа для умного дома распознавания дикторо зависимых команд. А как потом можно будет распознавать речь трудно сказать. Это пока просто новая идея.

babai-rais · 03.11.2020, 09:52

Цитата:

Сообщение от Pavia

Задача распознавание это отнесение данных к одному из классов. Классами могут быть буквы или слова или фонемы. Последние не имеют четкого количества, поэтому в разных работах требуется ещё и кластеризация выделения классов под конкретный алгоритм.
Так что пока что у вас пред обработка. Это даже близко не распознавание.

На выходе получаются данные количество комбинаций которых имеют предел, значит может быть таблица или алфавит или что то другое алгоритмы работы с которыми уже давно разработаны. Я не программист, по моему разумению получается

Цитата:

Сообщение от Pavia

Дело в том что музыка это не импульсы, а смесь различных звуков периодических и не периодических.

babai-rais · 03.11.2020, 10:16

Цитата:

Сообщение от Pavia

10-50 мс это разные фонемы. Вот только разные фонемы имеют разную длительность.

Предложенный алгоритм следит сколько фронтов импульсов укладывается между фронтами текущего сигнала к отстоящему на 10-50 мс.Самое близкое понятие которое могу привлечь для объяснения это работа цифрового частотомера. Там подсчитывают количество импульсов между эталонными строб импульсами. В предложенном мной алгоритме строб импульсами являются фронты импульсов задержанного сигнала. Понятия фонемы к этому уже неприемлемы как и всё что используется в традиционных способах распознавания речи. Мы с самого начала отказались от частотного анализа , и также в нашем полученном коде нет времени. Полученный код позволят сказать лишь во сколько раз предыдущая высота звука отличается от другой, в какой октаве и в близка к какой ноте если находится в одной октаве. Забудьте все что знаете об традиционных способах распознавания.

ViktorR · 03.11.2020, 14:20

Прочитал внимательнее предложение.
Мне понятно, что если сигнал периодический ...

Ну а что делать, если он не периодический?
Как в одном анекдоте:" Так-то оно так, ежели рассуждать правильно. Ну а ежели не правильно?"

Голос как раз таковым и является.
Когда называют какую либо частоту для голоса, то это, например, основная частота, которая выделяется в спектре (Фурье). И эта частота довольно условна.
Но от Фурье преобразования предложено отказаться.

Для Фурье преобразования необходимо выделить временной интервал, который мы определяем как периодически повторяющийся и форма сигнала, в этом интервале, используется в преобразовании.
Но и от времени мы тоже, вроде как, должны отказаться.

То, что вы рисуете генераторами и частотомерами тут, на мой некомпетентный взгляд, вовсе не подходит. И не подходит потому, что в случае генераторов - сигнал периодический.
В голосе таких сигналов нет.
В голосе есть сигнал сложной формы и он не периодический. И тогда что и с чем сравнивать?

PS:
Посмотрел на одном сайте: https://picture-sound.ru/pf/interesn...kartin-golosa/
Предлагается записывать голоса. Изображений огромное количество. Но вот как в этих изображениях, без какой либо обработки, увидеть периодичность? Не представляю.

PSS: Вот тут нашёл статью "АКУСТИЧЕСКИЙ АСПЕКТ ФОНЕТИЧЕСКИХ ОПИСАНИЙ"
http://www.philol.msu.ru/~ruslang/data/pdf/2.pdf
В ней говорится о периодических колебаниях голосовых связок, но с поправкой - квазипериодических.
Вместе с тем, звук - это не колебания голосовых связок, как и не колебания струн.
Это результат взаимодействия таких колебаний с окружающим пространством (гортань, корпус инструмента, воздушная среда, уши слушателя, ...), в котором происходят операции интегрирования и дифференцирования сигнала.

digitalis · 03.11.2020, 15:15

Вот вечно пытаются подрезать крылья на самом взлёте. "Если мои взгляды не сходятся с теорией - тем хуже для теории" .

babai-rais · 03.11.2020, 15:31

Цитата:

Сообщение от ViktorR

В голосе есть сигнал сложной формы и он не периодический. И тогда что и с чем сравнивать?

Мы не сравниваем с чем то а считаем сколько попугаев укладывается в удаве. Нас не интересует какой формы импульсы периодические или какой длительности. Мы получаем последовательность в которой каждый последующий период измеряется предыдущим и так каждый раз. Каждый раз определяется во сколько раз длина импульса длиннее или короче, по другому, выше или ниже по частоте предыдущего. В коротком фрагменте записи такой способ позволяет находить лишь целые кратные числа, Как можно подсчитать если частоты отличаются не в разы можно понять изменяя частоты на этой игрушке. Чем меньше частоты друг от друга отличаются тем дальше по оси времени произойдет переход периодов. Для музыкального сигнала получится определить положение любого участка в соответствии на нотной линейке без мудреных алгоритмов зная мчто такое музыкальная грамота. Для речевого сигнала утверждать не буду. Проще объяснить похоже уже не смогу.

MihalNik · 03.11.2020, 15:42

Цитата:

Сообщение от digitalis

Вот вечно пытаются подрезать крылья на самом взлёте. "Если мои взгляды не сходятся с теорией - тем хуже для теории" .

Дело даже не в теории, а в том, что без библиотек не получится, потому что русский язык как и любой другой естественный это далеко не нотная грамота.

digitalis · 03.11.2020, 15:55

Ну дык библиотеки не на пустом месте образовались, а на основании теории. Я полагаю.
Будем ждать реализации. Не в одной же Америкосии П.Нортонам и Д.Кнуттам рождаться.
"Может собственных Протонов
И быстрых разумом Нейтронов
Расейская земля рождать" .

babai-rais · 03.11.2020, 17:07

Цитата:

Сообщение от MihalNik

Дело даже не в теории, а в том, что без библиотек не получится, потому что русский язык как и любой другой естественный это далеко не нотная грамота.

Зачем библиотека если полученный код имеет конечное количество комбинаций которые путем укрупнения позволят составить подобие алфавита комбинации которых будут соответствовать определенному звуку и букве. Мои рассуждения эмпирические, я университетов не кончал. Те кто учились в технических вузах могут меня поправить своими знаниями из раздела высшей математики как комбинаторика.

03.11.2020, 14:20	#45
ViktorR Старожил Регистрация: 23.10.2010 Сообщений: 2,309	Прочитал внимательнее предложение. Мне понятно, что если сигнал периодический ... Ну а что делать, если он не периодический? Как в одном анекдоте:" Так-то оно так, ежели рассуждать правильно. Ну а ежели не правильно?" Голос как раз таковым и является. Когда называют какую либо частоту для голоса, то это, например, основная частота, которая выделяется в спектре (Фурье). И эта частота довольно условна. Но от Фурье преобразования предложено отказаться. Для Фурье преобразования необходимо выделить временной интервал, который мы определяем как периодически повторяющийся и форма сигнала, в этом интервале, используется в преобразовании. Но и от времени мы тоже, вроде как, должны отказаться. То, что вы рисуете генераторами и частотомерами тут, на мой некомпетентный взгляд, вовсе не подходит. И не подходит потому, что в случае генераторов - сигнал периодический. В голосе таких сигналов нет. В голосе есть сигнал сложной формы и он не периодический. И тогда что и с чем сравнивать? PS: Посмотрел на одном сайте: https://picture-sound.ru/pf/interesn...kartin-golosa/ Предлагается записывать голоса. Изображений огромное количество. Но вот как в этих изображениях, без какой либо обработки, увидеть периодичность? Не представляю. PSS: Вот тут нашёл статью "АКУСТИЧЕСКИЙ АСПЕКТ ФОНЕТИЧЕСКИХ ОПИСАНИЙ" http://www.philol.msu.ru/~ruslang/data/pdf/2.pdf В ней говорится о периодических колебаниях голосовых связок, но с поправкой - квазипериодических. Вместе с тем, звук - это не колебания голосовых связок, как и не колебания струн. Это результат взаимодействия таких колебаний с окружающим пространством (гортань, корпус инструмента, воздушная среда, уши слушателя, ...), в котором происходят операции интегрирования и дифференцирования сигнала. Как-то так, ... Последний раз редактировалось ViktorR; 03.11.2020 в 14:45.

03.11.2020, 15:55	#49
digitalis Старожил Регистрация: 04.02.2011 Сообщений: 4,550	Ну дык библиотеки не на пустом месте образовались, а на основании теории. Я полагаю. Будем ждать реализации. Не в одной же Америкосии П.Нортонам и Д.Кнуттам рождаться. "Может собственных Протонов И быстрых разумом Нейтронов Расейская земля рождать" . Последний раз редактировалось digitalis; 03.11.2020 в 16:00.

Похожие темы
Тема	Автор	Раздел	Ответов	Последнее сообщение
Автоматическое распознавание речи	IADom	Безопасность, Шифрование	1	04.11.2020 13:36
C# Распознавание речи	satirikzn	Фриланс	0	23.05.2015 14:51
Распознавание речи SpeechAPI	rmv240899	Помощь студентам	2	23.11.2012 21:39
Распознавание речи	Артегор	Visual C++	3	11.06.2012 22:47
Распознавание речи php	Krasi	PHP	5	29.08.2011 08:37

03.11.2020, 15:15	#46
digitalis Старожил Регистрация: 04.02.2011 Сообщений: 4,550	Вот вечно пытаются подрезать крылья на самом взлёте. "Если мои взгляды не сходятся с теорией - тем хуже для теории" .