Как настроить наушники, чтобы слышать только те звуки, которые хотите: новая технология семантического прослушивания

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Мнение | Оффтопик

Как часто мы хотели бы отключиться от шумного мира и погрузиться в свои мысли? Или наоборот, выделить из общего фона те звуки, которые для нас важны или приятны? Например, услышать сирену скорой помощи, когда мы едем на машине, или насладиться пением птиц, когда мы гуляем в парке. Но как нам сделать так, чтобы наши наушники понимали, что мы хотим слышать, а что нет?

Автор: Bing image creator

Современные наушники с функцией шумоподавления умеют лишь полностью заглушать или пропускать окружающий звук, не давая нам возможности выбирать его по своему вкусу. Однако американские ученые из Университета Вашингтона придумали новую технологию, которая позволяет нам настраивать наушники так, чтобы они фильтровали только те звуки, которые мы хотим слышать в реальном времени. Они назвали свое изобретение «семантическим прослушиванием».

Принцип работы этой технологии таков: наушники снимают аудио сигнал из окружающей среды и передают его на смартфон, который подключен к ним. Смартфон отменяет все звуки, кроме тех, которые мы выбрали с помощью голосовых команд или специального приложения. Мы можем выбрать из 20 разных категорий звуков, таких как речь, музыка, плач ребенка, сирены, пылесосы и т. д. Только эти звуки будут возвращаться в наушники.

Ученые представили свою технологию на конференции UIST '23 в Сан-Франциско 1 ноября. Они планируют запустить ее в продажу в ближайшее время.

«Чтобы понять, что это за звук, например, птица, и выделить его из всех остальных, нужен реальный интеллект, которого нет у обычных наушников с шумоподавлением», — говорит Шьям Голлакота, профессор компьютерных наук и инженерии Университета Вашингтона и ведущий автор исследования. «Сложность еще и в том, что звуки должны соответствовать тому, что мы видим. Нельзя, чтобы мы слышали голос человека с задержкой в несколько секунд после того, как он заговорил. Поэтому наши алгоритмы должны обрабатывать звуки очень быстро, менее чем за сотую секунды».

Автор: Bing image creator

Для этого технология семантического прослушивания использует нейронные сети, которые обучены распознавать разные звуки и отделять их друг от друга. Эти нейронные сети работают на смартфоне, а не на облачных серверах, чтобы ускорить процесс и снизить расходы. Кроме того, технология сохраняет пространственные характеристики звуков, такие как направление и расстояние, чтобы мы могли лучше ориентироваться в звуковом пространстве.

Ученые проверили свою технологию в разных условиях, таких как офисы, улицы и парки. Они смогли успешно извлекать целевые звуки, такие как сирены, птицы, тревоги и другие, убирая при этом весь лишний шум. Когда 22 добровольца оценивали качество звука, полученного с помощью технологии, они сказали, что оно стало лучше, чем в оригинальной записи. Однако иногда технология путала звуки, которые были похожи друг на друга, например, вокальную музыку и человеческую речь.

Семантическое прослушивание — это новый виток в развитии умных наушников, которые могут подстраиваться под наши потребности и желания. Такие наушники могут не только повысить наш комфорт и качество жизни, но и предупредить некоторые риски, связанные с неправильным восприятием звуковой среды. Например, такие наушники могут помочь людям с проблемами со слухом или аутизмом, которые могут реагировать на определенные звуки. Также такие наушники могут способствовать изучению иностранных языков, позволяя нам концентрироваться на речи, а не на шуме.

Семантическое прослушивание — это перспективная технология, которая может открыть новые горизонты для наушников и их пользователей. Однако для ее успешного внедрения на рынок потребуется решить ряд технических и этических вопросов, связанных с качеством звука, безопасностью данных, конфиденциальностью и социальным взаимодействием. Возможно, в скором будущем мы сможем не только слышать, но и выбирать, что мы хотим слышать.

Сейчас на главной

Новости

Публикации

FiiO EH13 — по воздуху и по проводу с EQ и шумодавом — обзор полноразмерных Bluetooth 6.0 наушников

Спустя несколько лет FiiO от лица своего основного бренда выпускают полноразмерные беспроводные наушники EH13. Как положено, не обошлась новинка без активного шумоподавления, бонусом добавили ей...

Светишь прямо — летит вбок: как новая технология световой тяги сделает межзвездные корабли управляемыми

Идея использования света для перемещения физических объектов разрабатывается в науке уже довольно давно. Физически процесс построен на том, что фотоны, несмотря на отсутствие массы покоя, обладают...

Обзор эргономичного кресла ZONE 51 X-Prime Eco Grey: спина отдыхает, и вы счастливы

Работа за компьютером давно перестала быть чем-то временным — для многих это по 6-10 часов в день в одном положении. И именно здесь начинает проявляться главный враг...

До Марса за 56 дней: найден межпланетный короткий путь по данным околоземных астероидов

Проектирование полетов к Марсу требует компромисса между временем в пути и затратами топлива. Классические полеты осуществляются по так называемым гомановским траекториям — эллиптическим...

Дорога, которую строят больше ста лет и не могут закончить: почему шесть регионов России до сих пор не имеют прямого железнодорожного сообщения с общероссийской сетью

Идея соединить север европейской части России и Западную Сибирь железной дорогой родилась ещё в начале 20 века. Полярный исследователь и художник А. А. Борисов, хорошо знавший арктические...

Turbo, TipiTip, Love is: кто придумал и производил популярные жвачки из детства

В конце восьмидесятых годов на прилавках ларьков появились яркие пачки жевательной резинки, которые быстро стали желанной добычей для школьников. Turbo с вкладышами про машины, TipiTip с забавным...