Новая модель Gemini 2.5 с функцией управления веб-страницами уже проходит бета-тестирование

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Google разработала усовершенствованную модель ИИ Gemini 2.5 Computer Use, дающую возможность ИИ-агентам взаимодействовать с веб-сайтами подобно человеку: нажимать кнопки, вводить текст, а также работать с их элементами в режиме реального времени. Новая версия ИИ уже доступна для тестирования через API в Google AI Studio и платформе Vertex AI.

Автор: Google Источник: blog.google

В основе технологии лежат визуальное восприятие и логика, унаследованные от Gemini 2.5 Pro. Но в отличие от классических решений, работающих через API, эта модель анализирует скриншоты пользовательского интерфейса, а потом определяет, какое действие следует выполнить: например, открыть выпадающее меню или ввести данные в форму. По завершении операции делается новый снимок экрана, и процесс повторяется.

Компания демонстрирует работу системы на примерах, где агент сортирует элементы на цифровой доске или переносит данные между сайтами. Тесты показывают, что модель работает быстрее аналогов и стабильно справляется с задачами в браузерах. Поддерживается 13 типов действий, и хотя настольные приложения пока не в приоритете, модель уже показала потенциал и в мобильной среде. Для безопасности реализована проверка всех действий ИИ, особенно при работе с чувствительными задачами вроде онлайн-платежей. Разработчики могут задавать ограничения или запросить подтверждение от пользователя.

Уже сейчас новая модель ИИ уже используется внутри Google: внешние разработчики в программе бета-тестирования применяют ее с целью разработки интеллектуальных помощников и бизнес-автоматизации.

Источник: Google

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Как заставить звук проходить сквозь стены: новый материал направляет сигнал изнутри, оставаясь невидимым для внешних волн

Управление звуком всегда опиралось на создание физических преград. Звук это механическая волна, чередование зон высокого и низкого давления, которое распространяется в пространстве. Чтобы направить...

Ежегодное ТО газового котла. Разбираемся, за что «газовщики» берут деньги?

На днях с моими родителями случилась неприятная история — начал «скрежетать» газовый котел. Вызвали мастера, который определил, что данная проблема требует замены насоса, причем сумма за...

✦ ИИ  Между забвением и «понтами»: почему наручные часы отказываются умирать

Наручным часам уже лет тридцать безапелляционно пророчат неминуемую смерть. Начались подобные «упаднические» разговоры с появления массовых карманных компьютеров вроде легендарных Palm, грозивших...

Десять лет назад вышел смартфон, который мог спасти HTC от краха — HTC 10: почему у него ничего не получилось

Один из пионеров рынка Android, компания HTC, очень быстро растеряла свои позиции. Сначала люди недооценили аппарат One M8, который мало отличался от предыдущего M7, а затем стали ругать...

Победа «лопаты»: как Galaxy Note заставил Apple переделать iPhone, а Samsung научила мир любить большие телефоны

Если бы вы оказались в начале 2010-х и спросили любого техногика, каким должен быть идеальный смартфон, ответ был бы почти единогласным. Правила игры казались высеченными в граните, а...