Робот EMO научился самостоятельно синхронизировать движения губ при разговоре

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | Дроны, роботы и конструкторы

Исследователи из Лаборатории творческих машин Колумбийского университета представили робота EMO, способного самостоятельно обучаться синхронизации движений губ с произносимыми словами. Разработку возглавили аспирант Юхан Ху и профессор Ход Липсон.

Конструктивно EMO представляет собой роботизированную голову с 26 миниатюрными моторчиками, расположенными под гибкой силиконовой оболочкой лица. Различные комбинации активации моторчиков позволяют формировать мимику и изменять положение губ.

Процесс обучения робота проходил в два этапа. На первом этапе EMO располагался перед зеркалом и совершал тысячи случайных движений лицевыми мышцами, одновременно наблюдая за результатом. Таким образом система установила связь между командами двигательным механизмам и визуальными изменениями. Этот метод относится к категории языковых моделей VLA — «от видения к действию».

Автор: Лаборатория Творческих Машин Источник: newatlas.com

На втором этапе робот проанализировал многочасовые видеозаписи с YouTube, на которых люди разговаривают и поют. Это позволило выявить закономерности между звуками речи и соответствующими движениями губ. Искусственный интеллект EMO объединил полученные данные с результатами зеркального обучения и научился формировать артикуляцию для слов, воспроизводимых синтетическим голосовым модулем.

На текущем этапе разработки робот испытывает трудности с воспроизведением отдельных звуков, в частности «B» и «W». По словам Юхана Ху, интеграция технологии с диалоговыми системами искусственного интеллекта, такими как ChatGPT или Gemini, позволит роботу вести контекстно-зависимые беседы и воспроизводить соответствующие мимические жесты.

Источник: New Atlas

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Обзор смартфона Infinix Note 60 Pro: котики правят миром

Купил смартфон дочке, но выпросил на обзор. Когда она увидела матричный дисплей и котиков, она сказала что ничего другого не хочет. Ну, а я лишь сказал «Дайте два!» а если без шуток, то в этом...

Почему огурцы желтеют и чахнут, даже если вы за ними «ухаживаете»: три ошибки огородников и что делать

Делаете всё правильно, а урожая огурцов нет? Скорее всего, вы губите корни растения своей «заботой». Вот почему полив и подкормка «на глаз» лишают вас плодов, и как исправить ситуацию за пару шагов.

Шаровая молния: миф или физическое явление? 3 подтвержденные теории

Мы привыкли думать, что современная наука уже расставила все атмосферные явления по полкам. Грозу объясняют разностью потенциалов между облаком и землёй, смерч — перепадом давления, а...

Почему некоторые люди слышат гул электросетей: биофизика и акустика в городской среде

Многим знакома ситуация: в тихой комнате при выключенных приборах едва уловимо фонит низкочастотный гул. Найти источник сложно, а самое неприятное — другие люди в той же комнате...

Обзор KZ Vibe X: басовитые невероятно эффектные бюджетные наушники

Инженеры компании Knowledge Zenith, видимо, с головой ушли в эксперименты, оттого им удается выпускать, буквально, хит за хитом. В новеньких Vibe X они использовали 10 мм динамик из своих же...

Обзор пароочистителя FELFRI FSC-002: уборка в доме и без химии

Устали от постоянной уборки с использованием химии, появились раны и раздражение на руках, а после перчаток остаются неприятные ощущения? Тогда на помощь приходит отпариватель с отличной...