DeepMind выпустила Genie 3: новая модель создает интерактивные миры в реальном времени

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Google DeepMind представила третье поколение своей «мировой модели» Genie. Новая версия Genie 3 способна генерировать интерактивные симуляции в реальном времени на основе текстового запроса или изображения. Модель создает детализированные виртуальные миры с разрешением 720p при частоте 24 кадра в секунду.

Ключевым улучшением Genie 3 по сравнению с предыдущей версией, выпущенной всего семь месяцев назад, стала существенно расширенная «память» системы. Если Genie 2 могла удерживать визуальную целостность мира лишь около 10 секунд, то новая версия сохраняет последовательность и детали на протяжении нескольких минут. Это означает, что объекты и элементы виртуального пространства остаются неизменными даже после того, как исчезают из поля зрения пользователя.

Genie 3 позволяет модифицировать созданный мир в процессе взаимодействия с ним. Пользователи могут добавлять новые объекты, изменять погодные условия или вводить персонажей с помощью текстовых команд. DeepMind называет эту функцию «событиями, вызываемыми запросом».

Автор: Google DeepMind Источник: arstechnica.com

Несмотря на значительный прогресс, модель сохраняет ряд ограничений. Она не может воссоздавать реальные локации — все генерируемые миры уникальны и недетерминированы. Система также подвержена типичным для генеративного ИИ «галлюцинациям» — например, некорректно отображает человеческую походку или создает нечитаемый текст. Хотя Genie 3 может служить средой для ИИ-агентов, их взаимодействие с миром ограничивается лишь перемещением внутри него.

DeepMind рассматривает Genie 3 не только как инструмент для создания игровых миров, но и как важную исследовательскую платформу. Компания считает, что подобные мировые модели могут сыграть ключевую роль в обучении ИИ-агентов в разнообразных интерактивных средах, что особенно важно для развития «воплощенных агентов» и продвижения к созданию общего искусственного интеллекта.

На данный момент Genie 3 остается закрытым исследовательским инструментом. DeepMind планирует предоставить доступ ограниченной группе экспертов и исследователей для дальнейшего совершенствования технологии, с перспективой более широкого доступа в будущем.

Источник: Ars Technica

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Независимые эксперименты окончательно опровергли утверждение об обнаружении тёмной материи на Земле

Около 27 процентов всей массы и энергии во Вселенной приходится на темную материю. Она не испускает света, не отражает его и не участвует в электромагнитном взаимодействии. Единственный способ,...

Закон Вурхиза: физики объяснили, почему обгонять медленные машины в городе абсолютно бессмысленно

Вы нажимаете на газ, резко перестраиваетесь и с чувством глубокого удовлетворения оставляете тихохода позади. Всего пара рискованных маневров — и вы выигрываете драгоценные секунды. Но...

Пещера Вайтомо: почему в ней запрещено использовать фонари и другие источники света

В изучении пещер фонарик: лучший друг, главный помощник и штатный спасатель от сотрясений мозга, вызванных падениями в темноте. Короче, без него в пещеру лучше не соваться, если вы не видите в...

Пять лет назад мы потеряли смартфоны LG: история падения главного конкурента Samsung

Когда-то давно эти смартфоны вовсю конкурировали с Samsung и занимали своё место в списке А-брендов. Именно они первыми предложили 2 ГБ оперативной памяти, вытянутый экран и ультраширик в качестве...