Яндекс «прокачал» поиск по архивам с помощью Alice AI VLM

В среднем точность составила 90,5%, достигая 92,7% для записей о рождении, 89,7% — для свадеб и 87,2% — для смертей

Команда Яндекса улучшила функцию поиска по архивам, внедрив новую модель распознавания документов Alice AI VLM. Теперь сервис не только распознаёт текст архивного файла, но и структурирует информацию, выделяя роли участников события и связи между людьми. Это позволяет пользователям сразу видеть имя нужного человека и быстрее находить данные о предках.

Сгенерировано нейросетью Midjourney

Новая модель позволяет настраивать фильтры по событиям и ролям, например, «родившийся», «отец», «мать» для документов о рождении или «жених», «невеста», «свидетель» для свидетельств о браке.

Иллюстрация: Яндекс

Обновлённый сервис работает на основе мультимодальной модели Яндекса Alice AI VLM, которая обладает глубоким пониманием русского языка и изображений. Как отметили разработчики, благодаря этому удалось достичь высокой точности поиска — в среднем 90,5%, а для записей о рождении — до 92,7%.

Напомним, сервис Яндекса «Поиск по архивам» помогает быстро находить упоминания о людях, населённых пунктах и событиях в рукописных документах XVIII–XX веков. В базе сервиса доступно более 20 млн страниц исторических документов из архивов различных регионов России, а также информация из более чем 200 дореволюционных и советских газет и справочников.

VerKo Источники: Яндекс
Главное