Google представила Gemini 2.5 Flash Image с улучшенными возможностями обработки фотографий

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Компания Google выпустила новое обновление для своего приложения Gemini, получившее официальное название Gemini 2.5 Flash Image. Во время тестирования разработка носила кодовое имя Nano Banana. Основной особенностью обновления стали значительно улучшенные возможности редактирования изображений.

Как по волшебству, появляется автобус
Автор: Логан Вейвер @LGNWVR/Unsplash/Gemini Источник: www.popsci.com

Новая версия Gemini позволяет вносить точечные изменения в фотографии без использования специализированных графических редакторов. Пользователи могут изменять отдельные элементы изображений, сохраняя остальные части нетронутыми. Например, система способна изменить цвет одежды на фотографии, скорректировать прическу персонажа или удалить нежелательные объекты из кадра.

Система также позволяет трансформировать фотографии, изменяя фон, время суток или погодные условия на снимке. Возможно добавление новых объектов в существующую сцену, например, предметов мебели в интерьер или транспортных средств на уличную фотографию.

Измените цвет определенного объекта
Автор: Юрий Крупенин/Unsplash/Gemini Источник: www.popsci.com

Среди ключевых возможностей Gemini 2.5 Flash Image — объединение нескольких изображений в одно с сохранением целостности персонажей, выполнение целевых преобразований с помощью естественно-языковых команд и использование базы знаний Gemini для создания и редактирования изображений.

Функция доступна в веб-приложении Gemini. Для начала работы пользователю необходимо нажать на значок инструментов в поле ввода, выбрать опцию «Создать изображения» и загрузить исходное изображение с помощью кнопки «+».

Плавно объедините два изображения
Автор: Энни Спратт/Андрей Лишаков/Unsplash/Gemini Источник: www.popsci.com

Google отмечает, что все данные, вводимые в Gemini, могут использоваться для дальнейшего обучения моделей искусственного интеллекта компании и иногда могут быть доступны рецензентам-людям. Пользователи имеют возможность запретить Google сохранять свои чаты или изображения, используя настройки в разделе «Активность» на левой панели навигации.

Обновление направлено на решение проблем, с которыми ранее сталкивались генеративные ИИ-системы при редактировании изображений, таких как несогласованность изменений, некорректное изменение частей изображений или несоблюдение инструкций.

Источник: Popsci.com

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Детальное изучение мозга чемпиона по памяти раскрыло нейробиологию его трюков

Рабочая память человека имеет свои физиологические ограничения. Исторически в когнитивной психологии этот предел описывался формулой «семь плюс-минус два элемента». Вы можете легко удержать в...

Эффект странника: как навыки ориентации в пространстве породили у человека геометрическое мышление

Со времен Платона геометрия считалась высшим проявлением абстрактного мышления. В диалоге «Менон» философ просит необразованного мальчика-раба удвоить площадь квадрата — и тот, опираясь...

Каньон Антилопы: почему он самый извилистый и фотогеничный в мире

В Аризоне, на землях индейцев навахо, находится место, любимое фотографами со всего мира. Каньон Антилопы вы наверняка хоть раз видели на заставке своего компьютера. Microsoft вносила его виды в...

Почему кофе и чай бодрят: взгляд с точки зрения науки

Вы когда-нибудь замечали, что после чашки кофе фокусировка внимания резко обостряется, но уже через полчаса ясность мысли начинает неумолимо угасать? Эти «американские горки» связаны с конкретными...

Как гора выше Эвереста остаётся невидимой: 75% высоты Мауна-Кеа скрыто океаном

Говоря о горных вершинах, достигающих наибольших высот, невозможно не вспомнить об Эвересте. Эта гора возносится в небо на 8848 метров над уровнем моря, и этот рекорд закреплён в школьных учебниках...