Команда Яндекса улучшила функцию поиска по архивам, внедрив новую модель распознавания документов Alice AI VLM. Теперь сервис не только распознаёт текст архивного файла, но и структурирует информацию, выделяя роли участников события и связи между людьми. Это позволяет пользователям сразу видеть имя нужного человека и быстрее находить данные о предках.
Новая модель позволяет настраивать фильтры по событиям и ролям, например, «родившийся», «отец», «мать» для документов о рождении или «жених», «невеста», «свидетель» для свидетельств о браке.
Обновлённый сервис работает на основе мультимодальной модели Яндекса Alice AI VLM, которая обладает глубоким пониманием русского языка и изображений. Как отметили разработчики, благодаря этому удалось достичь высокой точности поиска — в среднем 90,5%, а для записей о рождении — до 92,7%.
Напомним, сервис Яндекса «Поиск по архивам» помогает быстро находить упоминания о людях, населённых пунктах и событиях в рукописных документах XVIII–XX веков. В базе сервиса доступно более 20 млн страниц исторических документов из архивов различных регионов России, а также информация из более чем 200 дореволюционных и советских газет и справочников.