Компания Cognitive Technologies анонсирует разработки в области Open Source. Данное направление в течение последних двух лет переживает небывалый подъем во всем мире и преимущества его очевидны:
- любой желающий может бесплатно получить программный продукт;
- любой желающий может доработать продукт в соответствии со своими желаниями и требованиями, благодаря тому, что коды программы открыты.
Необходимо отметить, что для компании Cognitive Technologies, в которой научные исследования занимают значительную долю деятельности, Open Source проект OCR CuneiForm представляет огромный научно-практический интерес. Компания предполагает получить комплекс идей и методов, который сможет значительно усилить данную систему и получить в ближайшее время ряд «прорывных» технологических решений.
Компания Cognitive Technologies планирует развивать проект в три этапа:
- OCR Cuneiform - программa Freeware.
- Подготовка web-сервиса.
- Подготовка и размещение исходных кодов OCR Cuneiform.
OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи.
- высокое качество распознавания;
- высокая скорость работы;
- распознавание текстов на русском, английском, смешанном русско-английском, украинском, немецком, французском, испанском, итальянском, шведском и других (всего более 20);
- работа в режиме автофрагментации для поиска текстовых блоков, таблиц и изображений, а также мощное средство ручной и полуавтоматической фрагментации;
- распознавание таблиц любой структуры и сложности, в том числе и без отображения линий табличной сетки;
- автоматическое сохранение иллюстраций (черно-белых и цветных) и таблиц в получаемом на выходе документе;
- полное сохранение топологии страницы;
- поддержка пакетного режима сканирования и распознавания;
- простота использования и интуитивный интерфейс, встроенные помощники по работе с программой;
- встроенный текстовый редактор для работы с распознанным текстом;
- совмещенный показ изображений и результатов распознавания.
В системе используется целый ряд уникальных технологий, среди которых адаптивное распознавание, нейронные сети, когнитивный анализ альтернатив распознавания и другие.