ABBYY: новый FineReader XIX распознает средневековые тексты

ABBYY: новый FineReader XIX распознает средневековые тексты Российская компания ABBYY выпустила FineReader XIX, позволяющий распознавать тексты, датируемые XVII-XIX вв. Программа призвана помогать там, где существует потребность в компьютерной обработке исторических документов и в создании современных архивов: в библиотеках, исторических фондах, в университетах и исследовательских центрах.

ABBYY FineReader XIX совмещает все возможности FineReader Corporate Edition с новой технологией распознавания старых европейских текстов. Дополнительно к 177 языкам, используемым в системе FineReader, программа поддерживает 5 старых европейских языков: английский, немецкий, французский, испанский и итальянский. В арсенале системы — способность обрабатывать популярные в прошлом шрифты Fraktur и Schwabacher и большое количество готических шрифтов.

Во время работы над ABBYY FineReader XIX разработчики провели специальное обучение системы: более чем 2500 примеров было подобрано для каждого символа готического шрифта. Созданная технология распознавания была протестирована на 31 тыс. страниц оригинального текста из различных источников. Специальные языковые модели для распознавания старых европейских языков были созданы совместно с партнером ABBYY — новосибирской компанией ATAPY Software. В ходе разработки проанализировано 10 словарей и более 100 книг, изданных в период с 1750 по 1930 год. В систему добавлено 159 грамматических моделей, не использующихся в современных европейских языках.

8 февраля 2005 в 15:55

Автор:

Все новости за сегодня

Календарь

февраль
Пн
Вт
Ср
Чт
Пт
Сб
Вс