Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Web программирование > Общие вопросы Web
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 15.08.2017, 12:11   #1
Эльбрус
Новичок
Джуниор
 
Регистрация: 14.08.2017
Сообщений: 3
По умолчанию Транскрибация web speech api

Господа, подскажите, как в web speech api транскрибировать текст с временными метками не считая "тишины"?
На текущий момент, я загружаю аудиозапись телефонного разговора записанного в 2 потока (фактически 2-е аудиозаписи, каждому говорящему принадлежит 1 запись: когда один говорит, у другого в этот момент в его аудиозаписи тишина).
На выходе я получаю вот такой текст:
Говорящий 1
Привет как дела пойдем в кино ужасы все собирайся я сейчас приеду пока
Говорящий 2
привет номально что за фильм ок поехали пока
ЧТО НЕОБХОДИМО СДЕЛАТЬ:
(00.00) Привет (00.02)
(00.03) привет (00.04)
(00.05) как дела (00.06)
(00.07) нормально (00.08)
(00.09) пойдем в кино(00.10)
(00.11) что за фильм (00.12)
(00.13) ок (00.14)
(00.15) все собирайся я сейчас приеду (00.16)
(00.17) пока (00.18)
(00.19) пока (00.20)
Временные метки только в момент разговора (тишина не учитывается)
Спасибо.
Эльбрус вне форума Ответить с цитированием
Старый 15.08.2017, 21:09   #2
kutani
Форумчанин
 
Регистрация: 23.01.2016
Сообщений: 608
По умолчанию

...так понимаю, гугл уже за кадром остался (его API проставление временных меток отдельным словам в общем потоке не предусматривает).

И да, вам уже ответили, что следует синхронно отслеживать паузы (начало слов), разница по времени и даст очередность. Делать это можно как realtime до распознавания, так и после при наличии распознанной речи.
kutani вне форума Ответить с цитированием
Старый 16.08.2017, 10:37   #3
Эльбрус
Новичок
Джуниор
 
Регистрация: 14.08.2017
Сообщений: 3
По умолчанию

Спасибо за ответ!
Подскажите, а Вы умеете настраивать данный функционал (realtime до распознавания)?
Если да, подскажите бюджет и сроки.
Спасибо
Эльбрус вне форума Ответить с цитированием
Старый 16.08.2017, 12:40   #4
kutani
Форумчанин
 
Регистрация: 23.01.2016
Сообщений: 608
По умолчанию

Так настраивать или разработать? Потому как, чтобы что-то настраивать - нужен функционал. Которого нет.

Это не раздел фриланса.
kutani вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
В какие темы форума можно задать вопрос по Google web speech api? Эльбрус Свободное общение 2 14.08.2017 15:35
google speech API и HTTPS dmitriegorovih Работа с сетью в Delphi 8 29.08.2014 11:40
Speech API в Delphi Konung21 Общие вопросы Delphi 2 07.07.2010 13:09
Speech api Яр|/||< (^_^) Windows 2 06.07.2009 20:18
Подсветка в Speech api Яр|/||< (^_^) Мультимедиа в Delphi 0 19.06.2009 11:33