Новые наушники с ИИ оставляют только нужные голоса в разговоре

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

Исследовательская группа Вашингтонского университета разработала экспериментальный прототип наушников, способных автоматически изолировать голоса конкретных собеседников в многолюдной среде. Устройство получило название «проактивный слуховой помощник».


Технология основана на алгоритмах искусственного интеллекта, которые анализируют временные паттерны речи во время диалога. Система определяет очередность реплик между участниками беседы и подавляет звуковые сигналы, не соответствующие выявленному ритму разговора. Модель ИИ обрабатывает исключительно аудиоданные, что исключает необходимость использования дополнительных датчиков или электродов.

Автор: Вашингтонский университет Источник: www.yankodesign.com

Старший автор разработки Шьям Голлакота объяснил принцип работы устройства: система обучена распознавать естественную очередность речи при взаимодействии людей и прогнозировать эти ритмы в реальном времени. Текущая версия прототипа поддерживает одновременную фильтрацию голосов до четырех человек помимо пользователя наушников. Обработка звука происходит без временных задержек.

Команда разработчиков тестирует две параллельные модели обработки. Первая выполняет идентификацию говорящих и временную привязку их реплик для определения участников активного диалога. Вторая модель производит очистку исходного аудиосигнала и передает изолированный звук пользователю в режиме реального времени. По результатам испытаний с участием 11 человек, вторая модель показала более высокие результаты.

Автор: Вашингтонский университет Источник: www.yankodesign.com

Физически прототип представляет собой полноразмерные наушники с установленными дополнительными микрофонами. Разработчики ведут работу по миниатюризации компонентов и созданию специализированных чипов для интеграции ИИ-моделей в компактные устройства — слуховые аппараты, беспроводные наушники, смарт-очки и VR-гарнитуры.

нет
Автор не входит в состав редакции iXBT.com
Автор Рейтинг +356.90
Блог Аудио и звук 1151 5392 RSS

Читайте также

Новости

Публикации