Новая модель Gemini 2.5 с функцией управления веб-страницами уже проходит бета-тестирование

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Google разработала усовершенствованную модель ИИ Gemini 2.5 Computer Use, дающую возможность ИИ-агентам взаимодействовать с веб-сайтами подобно человеку: нажимать кнопки, вводить текст, а также работать с их элементами в режиме реального времени. Новая версия ИИ уже доступна для тестирования через API в Google AI Studio и платформе Vertex AI.

Автор: Google Источник: blog.google

В основе технологии лежат визуальное восприятие и логика, унаследованные от Gemini 2.5 Pro. Но в отличие от классических решений, работающих через API, эта модель анализирует скриншоты пользовательского интерфейса, а потом определяет, какое действие следует выполнить: например, открыть выпадающее меню или ввести данные в форму. По завершении операции делается новый снимок экрана, и процесс повторяется.

Компания демонстрирует работу системы на примерах, где агент сортирует элементы на цифровой доске или переносит данные между сайтами. Тесты показывают, что модель работает быстрее аналогов и стабильно справляется с задачами в браузерах. Поддерживается 13 типов действий, и хотя настольные приложения пока не в приоритете, модель уже показала потенциал и в мобильной среде. Для безопасности реализована проверка всех действий ИИ, особенно при работе с чувствительными задачами вроде онлайн-платежей. Разработчики могут задавать ограничения или запросить подтверждение от пользователя.

Уже сейчас новая модель ИИ уже используется внутри Google: внешние разработчики в программе бета-тестирования применяют ее с целью разработки интеллектуальных помощников и бизнес-автоматизации.

Источник: Google

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Ученые впервые наблюдали процесс, давший начало сложной жизни на Земле: как контакт двух простых клеток изменил ход эволюции

Один из самых сложных вопросов в современной биологии — это механизм появления эукариотической клетки. Вся жизнь на Земле делится на простые микроорганизмы (бактерии и археи) и...

Архитектура преисподней: как на самом деле устроен источник магмы Йеллоустоунского супервулкана

Традиционно считалось, что под Йеллоустоуном находится мантийный плюм. Согласно этой классической концепции, глубоко в недрах планеты, на границе земного ядра и мантии, зарождается мощный...

Секрет Саграда Фамилия: почему у самого высокого храма мира предел высоты в 172 метра

В прошлой статье я писал про долгострой, и вот совпадение, тоже храм, в Таиланде. Но если Храм Истины это самый масштабный проект целиком из древесины, то Саграда Фамилия уже самый высокий...

Как первоцветы выживают в суровых условиях ранней весны

Ранняя весна в центральной полосе России — время, когда природа только пробуждается от зимнего сна. Еще в низинах лежит снег, а на полянках появляются первые цветы, это кажется настоящим...

Где находится самый старый пароход в России и почему его сохранили

На набережной Енисея в центре Красноярска стоит пароход, который по праву считается одним из самых старых сохранившихся судов России. Грузопассажирский колёсный пароход «Святитель Николай»,...