Речевые алгоритмы и анализ текста с помощью нейросетей: как и где применяется
Нейросети умеют транскрибировать аудио, синтезировать текст в аудио и оценивать эмоции в тексте.
Безопасность и наблюдение
Распознавание речи используют в системах безопасности, чтобы распознавать потенциально опасные звуки: крик, взрыв или шипение газа.
Виртуальные помощники
Алиса, Сири, Алекса используют распознавание речи, чтобы понимать команды и реагировать на них.
Голосовые помощники и автоматизированные центры обработки вызовов
Анализ и транскрибация текста применяются в кол-центрах, чтобы автоматизировать шаблонную работу оператора. В клиниках такие системы могут записывать на приём. В магазине — консультировать по характеристикам товара. В банке — озвучивать интерактивное меню.
Где это применяется

Распознавание речи
Система умеет переводить текст в аудио. Мы использовали эту технологию в инструменте для стримингового сервиса, чтобы заглушить нецензурные слова. Работает это так: аудио и видео разделяется на два потока. Во время стрима аудио переводится в текст и проверяется на наличие стоп-слов. Если на стриме человек произносит стоп-слово, оно заглушается, а аудиопоток склеивается с видео и отправляется на сервер. Таким образом мы удаляем нежелательные слова во время онлайн-трансляции.

Для образовательного учреждения мы сделали проект, который распознает слова и потенциальные угрозы.
Демо умеет переводить аудио в текст. Разработку можно использовать в мессенджерах, видеостриминге или системах речевой аналитики.
Наши кейсы

Оценка эмоций человека по тексту
Система умеет распознавать позитив и негатив в тексте. Распознавание эмоционального окраса текста применяется для оценки и сортировки отзывов, анализа новостей и прогнозирования событий.
Кроме того, разработку можно использовать для оценки качества переговоров операторов кол-центра и других сотрудников.
Для образовательного учреждения мы сделали проект, который распознает слова и потенциальные угрозы.
Демо умеет переводить аудио в текст. Разработку можно использовать в мессенджерах, видеостриминге или системах речевой аналитики.