OCR CuneiForm – первый Open Source проект в области распознавания

1174

Компания Cognitive Technologies анонсирует разработки в области Open Source. Данное направление в течение последних двух лет переживает небывалый подъем во всем мире и преимущества его очевидны:

  • любой желающий может бесплатно получить программный продукт;
  • любой желающий может доработать продукт в соответствии со своими желаниями и требованиями, благодаря тому, что коды программы открыты.

Необходимо отметить, что для компании Cognitive Technologies, в которой научные исследования занимают значительную долю деятельности, Open Source проект OCR CuneiForm представляет огромный научно-практический интерес. Компания предполагает получить комплекс идей и методов, который сможет значительно усилить данную систему и получить в ближайшее время ряд «прорывных» технологических решений.

Компания Cognitive Technologies планирует развивать проект в три этапа:

  • OCR Cuneiform - программa Freeware.
  • Подготовка web-сервиса.
  • Подготовка и размещение исходных кодов OCR Cuneiform.

OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи.

  • высокое качество распознавания;
  • высокая скорость работы;
  • распознавание текстов на русском, английском, смешанном русско-английском, украинском, немецком, французском, испанском, итальянском, шведском и других (всего более 20);
  • работа в режиме автофрагментации для поиска текстовых блоков, таблиц и изображений, а также мощное средство ручной и полуавтоматической фрагментации;
  • распознавание таблиц любой структуры и сложности, в том числе и без отображения линий табличной сетки;
  • автоматическое сохранение иллюстраций (черно-белых и цветных) и таблиц в получаемом на выходе документе;
  • полное сохранение топологии страницы;
  • поддержка пакетного режима сканирования и распознавания;
  • простота использования и интуитивный интерфейс, встроенные помощники по работе с программой;
  • встроенный текстовый редактор для работы с распознанным текстом;
  • совмещенный показ изображений и результатов распознавания.

В системе используется целый ряд уникальных технологий, среди которых адаптивное распознавание, нейронные сети, когнитивный анализ альтернатив распознавания и другие.

15 декабря 2007

10:15

Ctrl
ПредыдущаяСледующая

Все новости за сегодня

Появились изображения упаковок настольных процессоров Intel Core i5 и Core i7 восьмого поколения. Core i3 пока ждать не стоит: CPU Intel Core i5 и Core i7 восьмого поколения будут оснащены GPU UHD Graphics 6302

На передней панели корпуса Gigabyte Aorus AC300W разместилось шесть разъёмов : Gigabyte представила корпус Aorus AC300W с подсветкой

Представлена операционная система Android 8.0 Oreo : Google представила Android Oreo26

Nikon сосредоточится на поддержке в камерах видео 8K : Другой приоритет — выпуск медицинского оборудования20

В конфигурацию ноутбука Acer Nitro 5 Spin входит процессор Intel Core восьмого поколения: Продажи новинки должны начаться в октябре, по цене $9995

Серия массивов твердотельных накопителей IntelliFlash N пополнила каталог Tegile Systems: Производитель называет IntelliFlash N первым унифицированным массивом NVMe корпоративного класса

TowerJazz и Tacoma Semiconductor Technology договорились построить фабрику в Китае: Израильская компания поделится опытом, Tacoma Semiconductor Technology возьмет на себя расходы2

Новому смартфону Apple iPhone приписывают способность распознать лицо пользователя «за миллионные доли секунды»: Кроме того, 3D-сканер будет использоваться в приложениях дополненной реальности37

DockCase — чехол и стыковочная станция для ноутбука Apple MacBook Pro: Минимальный взнос, позволяющий надеяться на получение DockCase в ноябре 2017 года, равен $794

1318

iXBT TV

  • Обзор легкой, компактной и дешевой мясорубки Kitfort KT-2101 Carnivora

  • Обзор беззеркальной фотокамеры Fujifilm X-T20

  • Обзор кинотеатрального DLP-проектора BenQ W11000 с эмуляцией разрешения 4К

  • AMD Ryzen Threadripper 1920Х и 1950X — тестирование 12-ядерного и 16-ядерного процессоров

  • Обзор мини-ПК ECS Liva Z на базе процессора Apollo Lake

  • Самый лучший процессор, неудачи Microsoft, гибкие наушники Samsung

  • Обзор цветного МФУ Xerox VersaLink C405 для малых и средних офисов

  • Обзор умного чайника Redmond SkyKettle RK-G200S с подсветкой и нагревом воды до нужной температуры

  • Конфигурируем мини-ПК: изучаем влияние памяти и накопителя на быстродействие системы

  • 3D-карты AMD Radeon RX Vega, цены, спецификации, смартфон Meizu Pro 7

  • Обзор лазерного цветного МФУ Canon imageRunner Advance C3520i, младшего в новой линейке

  • Обзор робота-пылесоса iBoto Aqua V710 с функцией влажной уборки

1212

Календарь

декабрь
Пн
Вт
Ср
Чт
Пт
Сб
Вс

Рекомендуем почитать