Компания xAI Илона Маск представила самое масштабное обновление для своей системы генерации изображений и видеороликов Grok Imagine. Режим Agent Mode в Grok Imagine стал доступен пользователям приложения Grok на iOS.
Раньше поддержание одинакового образа персонажей было одной из главных проблем ИИ-генераторов изображений. Новый режим позволяет создавать гораздо более кинематографичные и согласованные визуальные истории с персонажами, которые не меняют внешность.
Главные возможности:
- Согласованные персонажи — один и тот же герой сохраняет внешность на протяжении нескольких генераций;
- Многосценарные истории — генерация последовательных кадров с одним персонажем в разных локациях и ситуациях;
- Разные ракурсы и окружения — можно менять угол зрения, масштаб и окружение;
- Кинематографическое качество — изображения получаются более цельными.
Ранее Grok Imagine получил бета-обновление Agent Mode, которое превращает его из обычного генератора изображений и видеороликов в полноценного «творческого агента» с единым рабочим пространством. Новая функция уже доступна в веб-версии и позволяет работать в формате бесконечного холста, где процесс создания идёт непрерывно.
Ранее Grok Imagine получил обновление, которое добавляет возможность анимации изображений и их объединения в одну сцену. До этого Илон Маск репостнул сообщение о новом обновлении функции Grok Imagine, которая теперь умеет «умно» продолжать видеоролики. Ранее xAI представила обновление Grok 4.3, в котором основной упор сделан на практические инструменты для работы. Кроме того, xAI официально сделала общедоступным свой API Grok Speech to Text (STT).
В начале апреля Grok Imagine научился создавать реалистичные кинематографические ролики по короткому prompt-шаблону.
