Google представила Gemini 2.5 Flash Image с улучшенными возможностями обработки фотографий

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Компания Google выпустила новое обновление для своего приложения Gemini, получившее официальное название Gemini 2.5 Flash Image. Во время тестирования разработка носила кодовое имя Nano Banana. Основной особенностью обновления стали значительно улучшенные возможности редактирования изображений.

Как по волшебству, появляется автобус
Автор: Логан Вейвер @LGNWVR/Unsplash/Gemini Источник: www.popsci.com

Новая версия Gemini позволяет вносить точечные изменения в фотографии без использования специализированных графических редакторов. Пользователи могут изменять отдельные элементы изображений, сохраняя остальные части нетронутыми. Например, система способна изменить цвет одежды на фотографии, скорректировать прическу персонажа или удалить нежелательные объекты из кадра.

Система также позволяет трансформировать фотографии, изменяя фон, время суток или погодные условия на снимке. Возможно добавление новых объектов в существующую сцену, например, предметов мебели в интерьер или транспортных средств на уличную фотографию.

Измените цвет определенного объекта
Автор: Юрий Крупенин/Unsplash/Gemini Источник: www.popsci.com

Среди ключевых возможностей Gemini 2.5 Flash Image — объединение нескольких изображений в одно с сохранением целостности персонажей, выполнение целевых преобразований с помощью естественно-языковых команд и использование базы знаний Gemini для создания и редактирования изображений.

Функция доступна в веб-приложении Gemini. Для начала работы пользователю необходимо нажать на значок инструментов в поле ввода, выбрать опцию «Создать изображения» и загрузить исходное изображение с помощью кнопки «+».

Плавно объедините два изображения
Автор: Энни Спратт/Андрей Лишаков/Unsplash/Gemini Источник: www.popsci.com

Google отмечает, что все данные, вводимые в Gemini, могут использоваться для дальнейшего обучения моделей искусственного интеллекта компании и иногда могут быть доступны рецензентам-людям. Пользователи имеют возможность запретить Google сохранять свои чаты или изображения, используя настройки в разделе «Активность» на левой панели навигации.

Обновление направлено на решение проблем, с которыми ранее сталкивались генеративные ИИ-системы при редактировании изображений, таких как несогласованность изменений, некорректное изменение частей изображений или несоблюдение инструкций.

Источник: Popsci.com

Автор не входит в состав редакции iXBT.com (подробнее »)

Сейчас на главной

Новости

Публикации

Обзор электронной книги ОНИКС БУКС Галилео 3: всё самое лучшее в одном устройстве

В сегодняшнем обзоре я расскажу об обновленной электронной книге ОНИКС БУКС Галилео 3, которая названа в честь итальянского учёного Галилео Галилея (1564-1642), первого человека, который...

Практичный 16-дюймовый спутник для работы и отдыха: обзор ноутбука Honor MagicBook X16 2025

Honor продолжает развивать линейку ноутбуков, и в этом году мы получили обновленную модель — Honor MagicBook X16 2025. Этот 16-дюймовый лэптоп позиционируется как универсальное решение...

Стоит ли покупать сушилку для филамента? Тест до и после: разница на глаз.

Сушилка для филамента. Нашел такую, куда поместится катушка FD Plast. Которую можно превратить в абсолютно бесшумную. Смотрю тепловизором. Тестирую на PETG, печать до и после. Делюсь выводами.

Обзор микрофонной системы Maono Wave T5: шикарная петличка с богатыми возможностями

В мире петличных микрофонов сейчас, наверное, наиболее жаркое время — очень уж много вышло разных сильных игроков. Сегодня мы поговорим о максимально возможном комплекте модели Maono...

Почему при смене галогенок на LED-лампы фары могут запотевать: решение проблемы

Многие автовладельцы решают заменить галогеновые лампы в фарах своих автомобилей на современные LED-лампы. Светодиодные лампы могут светить значительно ярче, а также имеют большой срок службы,...

Экономика намерений: как алгоритмы ИИ учатся незаметно манипулировать вашими решениями

Эпоха, когда интернет конкурировал только за наше внимание, заканчивается. Развитие больших языковых моделей (LLM) и чат-ботов открывает новую коммерческую границу, способную влиять на наши планы и...