ABBYY FineReader 15: искусственный интеллект в действии

Информационная страница

Первая версия ABBYY FineReader увидела свет более четверти века тому назад, когда компания представила рыночную OCR-систему, которая работала с любыми видами шрифтов и могла одновременно распознавать символы на разных языках. С тех пор эта программа стала чуть ли не стандартом «де-факто» в сегменте соответствующих решений: приобретению сканера сопутствовала установка на ПК FineReader. Сейчас речь пойдет о возможностях, которые предоставляет пятнадцатая версия продукта — разумеется, никто не собирается сравнивать ее с первыми релизами, за 26 лет математическая модель не только прошла путь «от самоката до сверхзвукового истребителя», но и обзавелась элементами искусственного интеллекта и стала универсальной программой для работы с PDF-документами.

Предыдущим версиям программы уже было под силу многое: например, с помощью ABBYY FineReader уже удалось оцифровать все 90 томов из собрания сочинений Л. Н. Толстого. Решением ABBYY люди давно пользуются не только дома, но и на работе. Например, в «Ростелекоме» с программой работают более 700 сотрудников – юристов и специалистов отдела кадров. В последней версии продукт ABBYY превратился в мощный офисный пакет, поддерживающий работу с PDF-файлами, где OCR-модуль является лишь одной из частей. Ныне он позиционируется, как «многофункциональный редактор для решения любых задач с PDF и бумажными документами», причем слово — «любых» всячески акцентируется.

В описании продукта сказано, что он позволяет оператору «... редактировать любые PDF-документы - от исправления опечатки до изменения содержания целого абзаца и страницы, перемещать текстовые блоки, добавлять строки (или параграфы), изменять форматирование текста и структуру документа, автоматизировать повторяющиеся задачи и сравнивать документы в различных форматах». Действительно, если излагать максимально сжато — так и есть, но в если вникнуть, то все оказывается намного сложнее.

Сперва о создании первичного манускрипта. Для его формирования пользователю предлагается скомпоновать различные источники и документы разных типов, и не только электронные, но и бумажные. Выполнив компиляцию, к ней можно добавить водяные знаки и цифровые подписи, провести окончательное форматирование документов, внести комментарии, скрыть конфиденциальную информацию, установить парольную защиту и проделать множество других действий для того, чтобы получить на выходе полностью готовый документ.

И сделать это можно так быстро, как только позволит квалификация работника. Наивысшая продуктивность пятнадцатой версии достигнута во многом благодаря технологиям машинного обучения и искусственного интеллекта, построенных на базе нейросетей. Искаженные кодировки и испорченные места в исходных документах для таких механизмов перестали быть неразрешимой проблемой, также успешнее распознаются тексты на языках Востока — японском и корейском, например. В частности, при обнаружении искаженного (испорченного) участка в PDF-документе, будет задействован механизм оптического распознавания, что существенно повышает качество переноса информации. Также улучшена работа с электронными таблицами с текстом на языках с записью справа налево.

Тестовые исследования показывают, что ускорение работы в сопоставлении с предыдущей версией может достигать 40% даже при работе с объемными документами (в т.ч. PDF), изобилующих изображениями, диаграммами и таблицами. Ускорит работу и новая возможность извлечения текста из полей для заполнения и элементов типа «текстовый блок» в комментариях — теперь это не придется делать полностью вручную. Да и со структурой текста меньше проблем: при удалении, изменении или добавлении слов в абзацах (многострочное редактирование) текст автоматически равномерно перераспределяется по строкам.

Доработки коснулись и модуля сравнения документов: результаты сравнения можно сразу перемещать в документ Microsoft Word и отображать их в режиме отслеживания изменений: такая функция востребована при работе с бухгалтерскими, юридическими и проектными документами. Причем для разных форматов — важно, чтобы они входили в список поддерживаемых.

Внедрение искусственного интеллекта позволило реализовать даже такие возможности редактирования, которые до этого были невообразимыми: как PDF-документ (который вообще не предназначен для правки) можно подредактировать? Сейчас это не проблема: тот же искусственный интеллект способен определять практически любые элементы форматирования, в том числе  заголовки и подзаголовки, отдельные абзацы и колонтитулы, ячейки таблиц и прочее, позволяя изменять их содержимое так, как будто бы в обыкновенном текстовом документе. Изменения можно вносить даже в отсканированные оригиналы, даже с отсутствующим текстовым слоем.

И, наконец, о приятном дополнении в предложениях для организаций: введено лицензирование для удаленных пользователей. Отныне, с идентификацией только по имени последнего, допускается использовать ABBYY FineReader 15 совместно с продуктами для виртуализации, в том числе, с Microsoft Remote Desktop Services, Citrix XenApp, Citrix Virtual Apps and Desktops. Также расширены возможности использования групповых политик (GPO), в частности, администраторы смогут управлять максимальным количеством ядер CPU, которые могут использоваться программой на каждом компьютере и задавать лимит времени простоя, по истечении которого Concurrent-лицензия будет освобождена и доступна другим рабочим станциям.

Ну и о приятном для всех пользователей: до самого нового года, 30 декабря, купить FineReader и другие продукты можно со скидкой 40%. 

19 декабря 2019 Г.