Робот под управлением GPT-4 играет на воображаемой гитаре и притворяется призраком

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Мнение | Оффтопик

В данной статье мы рассмотрим, как большая языковая модель GPT-4 позволяет управлять движениями гуманоидного робота Alter3 посредством инструкций на естественном языке. Такой подход обладает рядом преимуществ по сравнению с традиционным программированием робота, а также демонстрирует потенциал для создания более интеллектуальных, адаптивных и «осознанных» роботических сущностей.

Alter3. Тело имеет 43 оси, которые управляются пневматическими приводами. Он оснащен камерой внутри каждого глаза. Система управления посылает команды через последовательный порт для управления движениями. Частота обновления составляет 100-150 мс
Автор: arXiv (2023). DOI: 10.48550/arxiv.2312.06571 Источник: techxplore.com

Alter3 — это третье поколение гуманоидного робота, разработанного в лаборатории Икегами в Токийском университете. Он состоит из 43 подвижных суставов, которые воспроизводят человеческое мышечно-скелетное движение. Он способен выполнять сложные движения верхней части тела, включая выражения лица. Он не имеет ног, но может имитировать ходьбу. Он также оснащен камерой, которая дает ему возможность «видеть» людей.

До недавнего времени для того, чтобы заставить Alter3 делать какие-то действия, нужно было написать специальный код для каждого сценария. Это был трудоемкий и скучный процесс, который ограничивал возможности робота. Но теперь ученые используют GPT-4 для того, чтобы создать мост между языком и движением.

GPT-4 — это большая языковая модель, которая обучена на огромном корпусе текстов на разных языках. Она может генерировать текст по любой теме, а также понимать смысл и контекст входных данных. Ученые использовали GPT-4 для того, чтобы научить ее преобразовывать инструкции на естественном языке в код Python, который запускает движок Android, управляющий роботом.

Альтер3 играет на воображаемой гитаре

Таким образом, теперь можно просто сказать роботу, что ему нужно сделать, и он выполнит это. Причем он спокойно может имитировать сложные движения, такие как бросок мяча, поедание попкорна, игра на воображаемой гитаре и т. д. Он даже может показывать эмоции, например, удивление или смущение, если он сделал что-то не так.

Альтер3 притворяется призраком

Alter3 не просто повторяет действия, которые ему говорят. Он запоминает их и улучшает со временем. Он также может учиться, наблюдая за реакциями людей. Это похоже на то, как новорожденные дети подражают взрослым. Ученые сравнивают такую способность обучения с «zero-shot» обучением, когда модель может справляться с новыми задачами без дополнительных данных.

Использование GPT-4 в робототехнике открывает новые горизонты для сотрудничества человека и робота. Роботы становятся более интеллектуальными, адаптивными и «осознанными». Они могут понимать человеческий язык и выражать себя через движение.

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Парадокс Миджли: о том, как гениальные открытия дважды губили планету

Знаете, есть такая категория людей, которых называют «злыми гениями». Обычно это персонажи комиксов, мечтающие захватить мир или совершить что-то, что могло бы его погубить. Томас...

FiiO SnowSky Echo — продолжение хита — обзор портативного плеера/ЦАПа с 3.5 и 4.4 разъемами и Bluetooth

Спустя год компания FiiO в лице своего суббренда SnowSky выпустила продолжение хитового компактного плеера Echo Mini, но теперь уже без каких-либо приставок, а просто как Echo. Новинка получила...

Обзор аккумуляторного секатора PROCRAFT ES25Li на бесщеточном двигателе. Режем ветки до 25 мм в диаметре

Любой дачник согласится, что секатор в саду или на даче, необходим. Без него ни яблоню не подрежешь, ни куст смородины не проредить. У меня на участке деревьев и кустарников довольно много, что...

Защищённые гаджеты нового поколения: Ulefone и RugOne представили инновации на «Связь-2026»

  • Статья
  • Ulefone
Москва, апрель 2026 года. На выставке «Связь-2026», которая проходит с 7 по 10 апреля в Центре имени Тимирязева, стенд компаний Ulefone и RugOne стал точкой притяжения для профессионалов и...

Обзор корпуса Jonsbo Jonsplus BO400CG – что дает модульная конструкция на практике

Корпус Jonsplus BO400CG попал ко мне не просто как очередная модель на обзор. Он рассматривается как замена текущего корпуса для уже собранной системы с Ryzen 9 9950X3D и мощной видеокартой....

Почему у орангутанов существуют два типа взрослых самцов, и один из них внешне долго остаётся похожим на самку

Если смотреть на орангутанов совсем издалека, картина кажется почти банальной. Ну да, самцы крупнее, заметнее, ведут себя громче. В мире приматов такое не редкость. Уже хочется мысленно закрыть...