Робот EMO научился самостоятельно синхронизировать движения губ при разговоре

✦ ИИ  Этот пост, предположительно, был создан при помощи искусственного интеллекта
Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | Дроны, роботы и конструкторы

Исследователи из Лаборатории творческих машин Колумбийского университета представили робота EMO, способного самостоятельно обучаться синхронизации движений губ с произносимыми словами. Разработку возглавили аспирант Юхан Ху и профессор Ход Липсон.

Конструктивно EMO представляет собой роботизированную голову с 26 миниатюрными моторчиками, расположенными под гибкой силиконовой оболочкой лица. Различные комбинации активации моторчиков позволяют формировать мимику и изменять положение губ.

Процесс обучения робота проходил в два этапа. На первом этапе EMO располагался перед зеркалом и совершал тысячи случайных движений лицевыми мышцами, одновременно наблюдая за результатом. Таким образом система установила связь между командами двигательным механизмам и визуальными изменениями. Этот метод относится к категории языковых моделей VLA — «от видения к действию».

Автор: Лаборатория Творческих Машин Источник: newatlas.com

На втором этапе робот проанализировал многочасовые видеозаписи с YouTube, на которых люди разговаривают и поют. Это позволило выявить закономерности между звуками речи и соответствующими движениями губ. Искусственный интеллект EMO объединил полученные данные с результатами зеркального обучения и научился формировать артикуляцию для слов, воспроизводимых синтетическим голосовым модулем.

На текущем этапе разработки робот испытывает трудности с воспроизведением отдельных звуков, в частности «B» и «W». По словам Юхана Ху, интеграция технологии с диалоговыми системами искусственного интеллекта, такими как ChatGPT или Gemini, позволит роботу вести контекстно-зависимые беседы и воспроизводить соответствующие мимические жесты.

Источник: New Atlas

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

✦ ИИ  Физики впервые поймали ультрабыстрые импульсы света, рожденного из абсолютной пустоты

Все время оптическая физика развивалась по двум независимым направлениям, которые практически не пересекались друг с другом. Первое направление — сверхбыстрая наука. Она изучает...

✦ ИИ  Kiwi Ears Cadenza II — нейтральный баланс — обзор динамических внутриканальных наушников

Я узнал о компании Kiwi Ears примерно три года назад, когда у них вышла первая Cadenza и сразу словила хайп. Я, к сожалению, с первой версией не познакомился, поэтому сравнить обе версии не смогу....

✦ ИИ  Мон-Сен-Мишель: как древний замок стоит посреди моря и почему его стоит посетить

Вот вам загадка: кто, приехав во Францию, постоянно мониторит время приливов, идет на экскурсию пешком, а вернуться с нее может уже вплавь? Это турист, пожелавший осмотреть аббатство...

✦ ИИ  Универсальное постоянное питание регистратора: обзор TrendVision HardWare Kit 2.0 (Pro Edition) и тест с DDPAI

Многие автомобильные видеорегистраторы можно использовать не только для записи дорожной обстановки непосредственно в поездке, но и для охранной записи на парковке. Для этого в меню устройства...

✦ ИИ  Когда жалко 100 Вт GaN зарядник: сетевой адаптер питания GP WM2A

GP WM2A — сетевой адаптер питания мощностью 20 Вт, который может служить основой для многих USB устройств, которым нужно немного, а занимать какой-нибудь 90-ваттный адаптер не хочется....

✦ ИИ  Обзор аккумуляторной дрели-шуруповёрта TECHNICOM TC-CD797: щеточный двигатель RS-755S, быстрозажимной патрон и 40 нМ

Проверяем, на что способна бюджетная аккумуляторная дрель-шуруповёрт TECHNICOM TC-CD797 с щеточным двигателем. Инструмент работает на штатном 2Ач аккумуляторе с быстрой зарядкой. Для удобства...