Робот EMO научился самостоятельно синхронизировать движения губ при разговоре

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | Дроны, роботы и конструкторы

Исследователи из Лаборатории творческих машин Колумбийского университета представили робота EMO, способного самостоятельно обучаться синхронизации движений губ с произносимыми словами. Разработку возглавили аспирант Юхан Ху и профессор Ход Липсон.

Конструктивно EMO представляет собой роботизированную голову с 26 миниатюрными моторчиками, расположенными под гибкой силиконовой оболочкой лица. Различные комбинации активации моторчиков позволяют формировать мимику и изменять положение губ.

Процесс обучения робота проходил в два этапа. На первом этапе EMO располагался перед зеркалом и совершал тысячи случайных движений лицевыми мышцами, одновременно наблюдая за результатом. Таким образом система установила связь между командами двигательным механизмам и визуальными изменениями. Этот метод относится к категории языковых моделей VLA — «от видения к действию».

Автор: Лаборатория Творческих Машин Источник: newatlas.com

На втором этапе робот проанализировал многочасовые видеозаписи с YouTube, на которых люди разговаривают и поют. Это позволило выявить закономерности между звуками речи и соответствующими движениями губ. Искусственный интеллект EMO объединил полученные данные с результатами зеркального обучения и научился формировать артикуляцию для слов, воспроизводимых синтетическим голосовым модулем.

На текущем этапе разработки робот испытывает трудности с воспроизведением отдельных звуков, в частности «B» и «W». По словам Юхана Ху, интеграция технологии с диалоговыми системами искусственного интеллекта, такими как ChatGPT или Gemini, позволит роботу вести контекстно-зависимые беседы и воспроизводить соответствующие мимические жесты.

Источник: New Atlas

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Как современные технологии помогли восстановить термос времён СССР

Новая пробка для старого термоса: опыт 3D-сканирования и 3D-печати. Технологии шагнули настолько далеко вперёд, что сегодня практически любую деталь можно изготовить, не выходя из дома. В этой...

Epomaker Luma100: обзор низкопрофильной механической клавиатуры в алюминиевом корпусе

Если вы ищете низкопрофильную механическую клавиатуру, то столкнётесь с тем, что моделей на рынке не так много, а полноразмерных вариантов — ещё меньше. Epomaker Luma100 представляет...

✦ ИИ  Сверло Форстнера: зачем оно нужно, чем отличается от обычных сверл и где применяется

Если человек хотя бы раз занимался сборкой мебели, установкой скрытых петель или просто пытался аккуратно выбрать углубление в деревянной детали, он почти неизбежно сталкивался со сверлом...

Олени против газопровода: как советские инженеры спасали тундру на Таймыре

В 1970-х годах во время строительства газопровода Мессояха — Норильск на Таймыре проектировщики столкнулись со специфической проблемой. Наземные трубы и железнодорожные насыпи преградили...

Почему и как пирамида Хеопса пережила тысячи лет землетрясений: разбор физики конструкции

Великая пирамида Хеопса на плато Гиза — единственный дошедший до наших дней памятник из списка семи чудес древнего мира. Построенная в период Древнего царства (ориентировочно в 2600-2450...

Всемирное хранилище семян: почему «Ноев ковчег» для растений построили именно в вечной мерзлоте и что там скрыто

На архипелаге Шпицберген, далеко за Полярным кругом, в толще горы из песчаника, скрыто одно из важнейших сооружений современности. Это Всемирное хранилище семян. Его часто называют «хранилищем...