Google Research и Google Cloud представили новую архитектуру поиска и генерации ответов под названием agentic RAG — расширение подхода retrieval-augmented generation (RAG), в котором система не ограничивается одноразовым поиском информации, а способна итеративно уточнять запрос и добирать недостающие данные из разных источников.
Новая архитектура встроена в платформу Gemini Enterprise Agent Platform и используется для кросс-корпусного поиска — то есть работы сразу с несколькими разрозненными хранилищами данных.
Классический RAG-подход работает в один шаг: система получает запрос, находит близкие документы и передаёт их языковой модели для генерации ответа. Это эффективный подход для простых запросов, но он ломается в задачах, где информация распределена по разным источникам и требует «цепочки поиска». Например, если документ о проекте содержит только идентификатор сервера, система может не догадаться сделать второй запрос в другую базу, чтобы найти его характеристики.
Agentic RAG решает эту проблему за счёт многоагентной схемы. Запрос сначала анализируется «корневым агентом», затем «планировщик» разбивает задачу на подзапросы, а «переписчик запросов » упрощает их для поиска. Отдельный агент выполняет извлечение данных из разных источников, после чего специальный модуль проверяет, достаточно ли найденного контекста для ответа.
Ключевая особенность системы — механизм проверки полноты данных (sufficient context). Он анализирует, покрывают ли найденные фрагменты все фрагменты исходного запроса. Если нет, то система не завершает ответ, а формирует уточнения и запускает дополнительный поиск. Например, если найдены данные о лекарствах и диете пациента, но отсутствует информация об аллергиях, система возвращается к поиску и уточняет запросы, чтобы закрыть пробел.
Такой подход меняет поведение системы: вместо выдачи неполного ответа или сообщения об отсутствии данных она пытается последовательно «достроить» контекст, пока не сможет сформировать обоснованный результат.
По данным разработчиков, agentic RAG увеличивает точность ответов на задачах с проверкой фактов до 34% по сравнению с базовыми RAG-системами. Отдельно отмечается устойчивость при работе с несколькими независимыми наборами данных: в кросс-корпусных тестах система сохраняет около 90,1% точности даже при необходимости выбирать между несколькими источниками.
Важным элементом архитектуры является и то, что она не требует значительного увеличения времени ответа: задержка остаётся близкой к стандартным системам поиска, отклонение составляет около 3%.
Исследователи подчёркивают, что ключевая проблема современных RAG-систем — не в качестве моделей, а в отсутствии механизма понимания полноты информации. Именно этот разрыв между «что найдено» и «что нужно для ответа» и закрывает agentic подход.
Google позиционирует новую систему как шаг к более надёжным корпоративным ИИ-системам, способным работать с распределёнными базами данных в компаниях, где информация хранится в разных подразделениях и форматах. В настоящее время agentic RAG доступен в режиме публичного предпросмотра в Gemini Enterprise Agent Platform.
