Google представила Gemini 2.5 Flash Image с улучшенными возможностями обработки фотографий

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Компания Google выпустила новое обновление для своего приложения Gemini, получившее официальное название Gemini 2.5 Flash Image. Во время тестирования разработка носила кодовое имя Nano Banana. Основной особенностью обновления стали значительно улучшенные возможности редактирования изображений.

Как по волшебству, появляется автобус
Автор: Логан Вейвер @LGNWVR/Unsplash/Gemini Источник: www.popsci.com

Новая версия Gemini позволяет вносить точечные изменения в фотографии без использования специализированных графических редакторов. Пользователи могут изменять отдельные элементы изображений, сохраняя остальные части нетронутыми. Например, система способна изменить цвет одежды на фотографии, скорректировать прическу персонажа или удалить нежелательные объекты из кадра.

Система также позволяет трансформировать фотографии, изменяя фон, время суток или погодные условия на снимке. Возможно добавление новых объектов в существующую сцену, например, предметов мебели в интерьер или транспортных средств на уличную фотографию.

Измените цвет определенного объекта
Автор: Юрий Крупенин/Unsplash/Gemini Источник: www.popsci.com

Среди ключевых возможностей Gemini 2.5 Flash Image — объединение нескольких изображений в одно с сохранением целостности персонажей, выполнение целевых преобразований с помощью естественно-языковых команд и использование базы знаний Gemini для создания и редактирования изображений.

Функция доступна в веб-приложении Gemini. Для начала работы пользователю необходимо нажать на значок инструментов в поле ввода, выбрать опцию «Создать изображения» и загрузить исходное изображение с помощью кнопки «+».

Плавно объедините два изображения
Автор: Энни Спратт/Андрей Лишаков/Unsplash/Gemini Источник: www.popsci.com

Google отмечает, что все данные, вводимые в Gemini, могут использоваться для дальнейшего обучения моделей искусственного интеллекта компании и иногда могут быть доступны рецензентам-людям. Пользователи имеют возможность запретить Google сохранять свои чаты или изображения, используя настройки в разделе «Активность» на левой панели навигации.

Обновление направлено на решение проблем, с которыми ранее сталкивались генеративные ИИ-системы при редактировании изображений, таких как несогласованность изменений, некорректное изменение частей изображений или несоблюдение инструкций.

Источник: Popsci.com

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Каньон Антилопы: почему он самый извилистый и фотогеничный в мире

В Аризоне, на землях индейцев навахо, находится место, любимое фотографами со всего мира. Каньон Антилопы вы наверняка хоть раз видели на заставке своего компьютера. Microsoft вносила его виды в...

Почему кофе и чай бодрят: взгляд с точки зрения науки

Вы когда-нибудь замечали, что после чашки кофе фокусировка внимания резко обостряется, но уже через полчаса ясность мысли начинает неумолимо угасать? Эти «американские горки» связаны с конкретными...

Как гора выше Эвереста остаётся невидимой: 75% высоты Мауна-Кеа скрыто океаном

Говоря о горных вершинах, достигающих наибольших высот, невозможно не вспомнить об Эвересте. Эта гора возносится в небо на 8848 метров над уровнем моря, и этот рекорд закреплён в школьных учебниках...

Почему на Кубе так мало машин новых моделей, хотя страна в Карибском бассейне с развитым туристическим потоком

Улицы Гаваны и других кубинских городов напоминают живой музей на колесах. Яркие американские автомобили 1950-х годов соседствуют с советскими «Жигулями», «Москвичами» и редкими современными...

Быстро заряжает смартфоны Xiaomi. Обзор пауэрбанка Ugreen 55W PB727

Пауэрбанк Ugreen модели PB727 — компактный внешний аккумулятор с ёмкостью встроенного аккумулятора 10 000 мА·ч. Устройство поддерживает популярные протоколы быстрой зарядки, в том числе...