Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > IT форум > Общие вопросы по программированию, компьютерный форум
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 02.11.2020, 11:18   #41
Pavia
Лис
Старожил
 
Аватар для Pavia
 
Регистрация: 18.09.2015
Сообщений: 2,409
По умолчанию

Цитата:
Сообщение от babai-rais Посмотреть сообщение
7. Дальнейшая обработка сигнала думается будет так же по линейному алгоритму. Об этом пока не думал.
Задача распознавание это отнесение данных к одному из классов. Классами могут быть буквы или слова или фонемы. Последние не имеют четкого количества, поэтому в разных работах требуется ещё и кластеризация выделения классов под конкретный алгоритм.
Так что пока что у вас пред обработка. Это даже близко не распознавание.

Цитата:
Сообщение от babai-rais Посмотреть сообщение
8. Для музыкального сигнала такой алгоритм вполне рабочий это можно доказать простыми арифметическими действиями без высшей математики. действиями. Доказательств не привожу это может сделать каждый простыми умозаключениями.
От теории до практики большая пропасть.

Цитата:
Сообщение от babai-rais Посмотреть сообщение
Я так думаю, что периодические сигналы это импульсы тока различной формы, гармонические, прямоугольные, пилообразные и так далее. Я как то не так формулирую?
Дело в том что музыка это не импульсы, а смесь различных звуков периодических и не периодических. Без чёткой границы между ними. Поэтому результаты работать будут далеки от желаемых. Тут реально огромная пропасть между теорий и практикой.

Цитата:
Сообщение от babai-rais Посмотреть сообщение
Получим картину как сдвинутый негатив и позитив.
10-50 мс это разные фонемы. Вот только разные фонемы имеют разную длительность.
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
У дзен программиста программа делает то что он хотел, а не то что он написал .
Pavia вне форума Ответить с цитированием
Старый 03.11.2020, 09:26   #42
babai-rais
Пользователь
 
Регистрация: 27.10.2020
Сообщений: 36
По умолчанию

Цитата:
Сообщение от Pavia Посмотреть сообщение
Задача распознавание это отнесение данных к одному из классов. Классами могут быть буквы или слова или фонемы. Последние не имеют четкого количества, поэтому в разных работах требуется ещё и кластеризация выделения классов под конкретный алгоритм.
Так что пока что у вас пред обработка. Это даже близко не распознавание.
На выходе получаются данные количество комбинаций которых имеют предел, значит может быть таблица или алфавит или что то другое алгоритмы работы с которыми уже давно разработаны. Я не программист, по моему разумению получается алфавит?! Из чередования единичек и нулей можно создать укрупненный код для дикторо зависимого распознавания. По этому коду можно вычислить диктора. Это идея подойдет для дипломной работы. Может получится простая программа для умного дома распознавания дикторо зависимых команд. А как потом можно будет распознавать речь трудно сказать. Это пока просто новая идея.
babai-rais вне форума Ответить с цитированием
Старый 03.11.2020, 09:52   #43
babai-rais
Пользователь
 
Регистрация: 27.10.2020
Сообщений: 36
По умолчанию

Цитата:
Сообщение от Pavia Посмотреть сообщение
Задача распознавание это отнесение данных к одному из классов. Классами могут быть буквы или слова или фонемы. Последние не имеют четкого количества, поэтому в разных работах требуется ещё и кластеризация выделения классов под конкретный алгоритм.
Так что пока что у вас пред обработка. Это даже близко не распознавание.
На выходе получаются данные количество комбинаций которых имеют предел, значит может быть таблица или алфавит или что то другое алгоритмы работы с которыми уже давно разработаны. Я не программист, по моему разумению получается
Цитата:
Сообщение от Pavia Посмотреть сообщение
Дело в том что музыка это не импульсы, а смесь различных звуков периодических и не периодических.
babai-rais вне форума Ответить с цитированием
Старый 03.11.2020, 10:16   #44
babai-rais
Пользователь
 
Регистрация: 27.10.2020
Сообщений: 36
По умолчанию

Цитата:
Сообщение от Pavia Посмотреть сообщение
10-50 мс это разные фонемы. Вот только разные фонемы имеют разную длительность.
Предложенный алгоритм следит сколько фронтов импульсов укладывается между фронтами текущего сигнала к отстоящему на 10-50 мс.Самое близкое понятие которое могу привлечь для объяснения это работа цифрового частотомера. Там подсчитывают количество импульсов между эталонными строб импульсами. В предложенном мной алгоритме строб импульсами являются фронты импульсов задержанного сигнала. Понятия фонемы к этому уже неприемлемы как и всё что используется в традиционных способах распознавания речи. Мы с самого начала отказались от частотного анализа , и также в нашем полученном коде нет времени. Полученный код позволят сказать лишь во сколько раз предыдущая высота звука отличается от другой, в какой октаве и в близка к какой ноте если находится в одной октаве. Забудьте все что знаете об традиционных способах распознавания.

Последний раз редактировалось babai-rais; 03.11.2020 в 10:31.
babai-rais вне форума Ответить с цитированием
Старый 03.11.2020, 14:20   #45
ViktorR
Старожил
 
Регистрация: 23.10.2010
Сообщений: 2,309
По умолчанию

Прочитал внимательнее предложение.
Мне понятно, что если сигнал периодический ...

Ну а что делать, если он не периодический?
Как в одном анекдоте:" Так-то оно так, ежели рассуждать правильно. Ну а ежели не правильно?"

Голос как раз таковым и является.
Когда называют какую либо частоту для голоса, то это, например, основная частота, которая выделяется в спектре (Фурье). И эта частота довольно условна.
Но от Фурье преобразования предложено отказаться.

Для Фурье преобразования необходимо выделить временной интервал, который мы определяем как периодически повторяющийся и форма сигнала, в этом интервале, используется в преобразовании.
Но и от времени мы тоже, вроде как, должны отказаться.

То, что вы рисуете генераторами и частотомерами тут, на мой некомпетентный взгляд, вовсе не подходит. И не подходит потому, что в случае генераторов - сигнал периодический.
В голосе таких сигналов нет.
В голосе есть сигнал сложной формы и он не периодический. И тогда что и с чем сравнивать?

PS:
Посмотрел на одном сайте: https://picture-sound.ru/pf/interesn...kartin-golosa/
Предлагается записывать голоса. Изображений огромное количество. Но вот как в этих изображениях, без какой либо обработки, увидеть периодичность? Не представляю.

PSS: Вот тут нашёл статью "АКУСТИЧЕСКИЙ АСПЕКТ ФОНЕТИЧЕСКИХ ОПИСАНИЙ"
http://www.philol.msu.ru/~ruslang/data/pdf/2.pdf
В ней говорится о периодических колебаниях голосовых связок, но с поправкой - квазипериодических.
Вместе с тем, звук - это не колебания голосовых связок, как и не колебания струн.
Это результат взаимодействия таких колебаний с окружающим пространством (гортань, корпус инструмента, воздушная среда, уши слушателя, ...), в котором происходят операции интегрирования и дифференцирования сигнала.
Как-то так, ...

Последний раз редактировалось ViktorR; 03.11.2020 в 14:45.
ViktorR вне форума Ответить с цитированием
Старый 03.11.2020, 15:15   #46
digitalis
Старожил
 
Аватар для digitalis
 
Регистрация: 04.02.2011
Сообщений: 4,550
По умолчанию

Вот вечно пытаются подрезать крылья на самом взлёте. "Если мои взгляды не сходятся с теорией - тем хуже для теории" .
digitalis вне форума Ответить с цитированием
Старый 03.11.2020, 15:31   #47
babai-rais
Пользователь
 
Регистрация: 27.10.2020
Сообщений: 36
По умолчанию

Цитата:
Сообщение от ViktorR Посмотреть сообщение
В голосе есть сигнал сложной формы и он не периодический. И тогда что и с чем сравнивать?
Мы не сравниваем с чем то а считаем сколько попугаев укладывается в удаве. Нас не интересует какой формы импульсы периодические или какой длительности. Мы получаем последовательность в которой каждый последующий период измеряется предыдущим и так каждый раз. Каждый раз определяется во сколько раз длина импульса длиннее или короче, по другому, выше или ниже по частоте предыдущего. В коротком фрагменте записи такой способ позволяет находить лишь целые кратные числа, Как можно подсчитать если частоты отличаются не в разы можно понять изменяя частоты на этой игрушке. Чем меньше частоты друг от друга отличаются тем дальше по оси времени произойдет переход периодов. Для музыкального сигнала получится определить положение любого участка в соответствии на нотной линейке без мудреных алгоритмов зная мчто такое музыкальная грамота. Для речевого сигнала утверждать не буду. Проще объяснить похоже уже не смогу.

Последний раз редактировалось babai-rais; 03.11.2020 в 15:58.
babai-rais вне форума Ответить с цитированием
Старый 03.11.2020, 15:42   #48
MihalNik
МегаМодератор
СуперМодератор
 
Регистрация: 27.11.2012
Сообщений: 5,657
По умолчанию

Цитата:
Сообщение от digitalis Посмотреть сообщение
Вот вечно пытаются подрезать крылья на самом взлёте. "Если мои взгляды не сходятся с теорией - тем хуже для теории" .
Дело даже не в теории, а в том, что без библиотек не получится, потому что русский язык как и любой другой естественный это далеко не нотная грамота.
Благими намерениями устлана дорога на programmersforum.ru

Последний раз редактировалось MihalNik; 03.11.2020 в 15:47.
MihalNik вне форума Ответить с цитированием
Старый 03.11.2020, 15:55   #49
digitalis
Старожил
 
Аватар для digitalis
 
Регистрация: 04.02.2011
Сообщений: 4,550
По умолчанию

Ну дык библиотеки не на пустом месте образовались, а на основании теории. Я полагаю.
Будем ждать реализации. Не в одной же Америкосии П.Нортонам и Д.Кнуттам рождаться.
"Может собственных Протонов
И быстрых разумом Нейтронов
Расейская земля рождать" .

Последний раз редактировалось digitalis; 03.11.2020 в 16:00.
digitalis вне форума Ответить с цитированием
Старый 03.11.2020, 17:07   #50
babai-rais
Пользователь
 
Регистрация: 27.10.2020
Сообщений: 36
По умолчанию

Цитата:
Сообщение от MihalNik Посмотреть сообщение
Дело даже не в теории, а в том, что без библиотек не получится, потому что русский язык как и любой другой естественный это далеко не нотная грамота.
Зачем библиотека если полученный код имеет конечное количество комбинаций которые путем укрупнения позволят составить подобие алфавита комбинации которых будут соответствовать определенному звуку и букве. Мои рассуждения эмпирические, я университетов не кончал. Те кто учились в технических вузах могут меня поправить своими знаниями из раздела высшей математики как комбинаторика.
babai-rais вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Автоматическое распознавание речи IADom Безопасность, Шифрование 1 04.11.2020 13:36
C# Распознавание речи satirikzn Фриланс 0 23.05.2015 14:51
Распознавание речи SpeechAPI rmv240899 Помощь студентам 2 23.11.2012 21:39
Распознавание речи Артегор Visual C++ 3 11.06.2012 22:47
Распознавание речи php Krasi PHP 5 29.08.2011 08:37