Новая модель Gemini 2.5 с функцией управления веб-страницами уже проходит бета-тестирование

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Google разработала усовершенствованную модель ИИ Gemini 2.5 Computer Use, дающую возможность ИИ-агентам взаимодействовать с веб-сайтами подобно человеку: нажимать кнопки, вводить текст, а также работать с их элементами в режиме реального времени. Новая версия ИИ уже доступна для тестирования через API в Google AI Studio и платформе Vertex AI.

Автор: Google Источник: blog.google

В основе технологии лежат визуальное восприятие и логика, унаследованные от Gemini 2.5 Pro. Но в отличие от классических решений, работающих через API, эта модель анализирует скриншоты пользовательского интерфейса, а потом определяет, какое действие следует выполнить: например, открыть выпадающее меню или ввести данные в форму. По завершении операции делается новый снимок экрана, и процесс повторяется.

Компания демонстрирует работу системы на примерах, где агент сортирует элементы на цифровой доске или переносит данные между сайтами. Тесты показывают, что модель работает быстрее аналогов и стабильно справляется с задачами в браузерах. Поддерживается 13 типов действий, и хотя настольные приложения пока не в приоритете, модель уже показала потенциал и в мобильной среде. Для безопасности реализована проверка всех действий ИИ, особенно при работе с чувствительными задачами вроде онлайн-платежей. Разработчики могут задавать ограничения или запросить подтверждение от пользователя.

Уже сейчас новая модель ИИ уже используется внутри Google: внешние разработчики в программе бета-тестирования применяют ее с целью разработки интеллектуальных помощников и бизнес-автоматизации.

Источник: Google

Сейчас на главной

Новости

Публикации

Почему время жизни свободного нейтрона — один из главных вопросов физики?

На первый взгляд может показаться, что невзрачному нейтрону нечем нас удивить. Это простая субатомная частица существует во многих атомных ядрах и, по сути дела, выполняет роль клея для протонов....

Обзор зарядного устройства Ugreen Nexode GaN 100W X606: Мощный, холодный и с встроенным кабелем

Ugreen Nexode X606 — это попытка решить извечную проблему: куча проводов в сумке и вечный поиск нужного кабеля. Компания встроила USB-C кабель прямо в корпус зарядника, сделав его...

Простой рецепт уличного освещения: обзор наружного светильника с солнечной батареей и PIR-сенсором

Темнеть на улице стало раньше, жена уговорила купить и установить вот такой наружный светильник — на аккумуляторной батарее с подзарядкой от солнца. Все просто — днем...

Провал 8К-телевизоров: почему они не пользуются спросом и что будет дальше?

Современные технологии стремительно развиваются, предлагая пользователям всё новые устройства и форматы, обещающие невероятное качество просмотра. Одним из ярких примеров стал выход телевизоров...

Эксперименты с центробежным канальным вентилятором

Один из хороших вариантов для создания тихой и эффективной самодельной системы домашней приточной вентиляции — сильно замедленный большой центробежный канальный вентилятор, причём чем...

Обзор роторной электробритвы Polaris PMR 0431RC ProLong 4D Li+

Давно присматривался к современным роторным бритвам. Хотелось понять, насколько они продвинулись за последние годы. Мой прошлый опыт был не самым удачным: сухое бритьё вызывало дискомфорт, поэтому...