Робот EMO научился самостоятельно синхронизировать движения губ при разговоре

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | Дроны, роботы и конструкторы

Исследователи из Лаборатории творческих машин Колумбийского университета представили робота EMO, способного самостоятельно обучаться синхронизации движений губ с произносимыми словами. Разработку возглавили аспирант Юхан Ху и профессор Ход Липсон.

Конструктивно EMO представляет собой роботизированную голову с 26 миниатюрными моторчиками, расположенными под гибкой силиконовой оболочкой лица. Различные комбинации активации моторчиков позволяют формировать мимику и изменять положение губ.

Процесс обучения робота проходил в два этапа. На первом этапе EMO располагался перед зеркалом и совершал тысячи случайных движений лицевыми мышцами, одновременно наблюдая за результатом. Таким образом система установила связь между командами двигательным механизмам и визуальными изменениями. Этот метод относится к категории языковых моделей VLA — «от видения к действию».

Автор: Лаборатория Творческих Машин Источник: newatlas.com

На втором этапе робот проанализировал многочасовые видеозаписи с YouTube, на которых люди разговаривают и поют. Это позволило выявить закономерности между звуками речи и соответствующими движениями губ. Искусственный интеллект EMO объединил полученные данные с результатами зеркального обучения и научился формировать артикуляцию для слов, воспроизводимых синтетическим голосовым модулем.

На текущем этапе разработки робот испытывает трудности с воспроизведением отдельных звуков, в частности «B» и «W». По словам Юхана Ху, интеграция технологии с диалоговыми системами искусственного интеллекта, такими как ChatGPT или Gemini, позволит роботу вести контекстно-зависимые беседы и воспроизводить соответствующие мимические жесты.

Источник: New Atlas

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Kiwi Ears B_Media Chorus: обзор наушников с мягким и универсальным звучанием

Kiwi Ears Chorus — это слегка бас ориентированные, нейтральные динамические наушники из бюджетного сегмента, выпущенные в сотрудничестве с аудиорецензентом B_Media. СодержаниеПараметры...

Червоточина внутри атома: как обычный водород проверяет главную гипотезу квантовой гравитации

Объединение квантовой механики и теории относительности остается главной нерешенной задачей теоретической физики. Две эти теории описывают мир на разных масштабах: первая работает со сверхмалыми...

Грозит ли Земле перенаселение? Новая математическая модель предсказывает резкий обвал населения к 2064 году

В середине XX века ученые всерьез опасались, что человечество погибнет от перенаселения. Самый известный и пугающий прогноз сделал американский физик Хайнц фон Фёрстер в 1960 году. Он...

Стоит ли покупать Xiaomi 15 в 2026 году: обзор и опыт использования компактного флагмана

Если вы ищете смартфон за 40-50 тысяч рублей, то лучшим вариантом может стать прошлогодний флагман. Одним из таких является Xiaomi 15. Мощный аппарат с компактным корпусом, тройной камерой...

Озеро Утренней Славы: как туристы превратили чудо природы в разноцветную лужу

В Йеллоустоне находится одно из самых красивых озер мира — небольшая по диаметру воронка с водой такого насыщенного синего цвета, что кажется, будто на землю упал кусочек неба. Жена...