Cognitive Translator — система машинного перевода текста нового поколения

1174

Компания Cognitive Technologies представила систему машинного перевода текстов нового поколения Cognitive Translator, в основу которой легло более глубокое представление знания о языке. Процесс разработки системы занял около 60 человеко/лет и длился более 8 лет.

Проект по созданию данной версии Cognitive Translator начался в 2000 году. Его участниками, помимо специалистов Cognitive Technologies, стала группа профессиональных лингвистов из МГУ, Института Русского Языка РАН и других организаций. Группой были разработаны уникальные алгоритмы синтаксического разбора и правила машинного перевода. На их основе была построена новая более совершенная — структурная модель представления знания о языке, которая включает, помимо описания морфологии и синтаксиса, еще и элементы анализа структурных связей. За счет этого система добивается глубокого «понимания» текста, и даже претендует на разрешение смысловых неоднозначностей («ключ» дверной и «ключ» - источник воды).

Принципы построения модели языка, заложенные в Cognitive Translator, основаны на технологии анализа — понимания текста, что позволило в рамках исследовательского проекта при участии относительно небольшой группы разработчиков создать систему, дающую качество перевода, сравнимое с современными промышленными системами. Стоит отметить, что существующие сегодня на рынке системы машинного перевода используют подход, разработанный еще в 70-х годах прошлого века, подразумевающий непрерывное ручное наполнения базы словоформ. Для достижения высокого качества перевода и добавления новых языков этот подход требует подключения огромных ресурсов (сотен специалистов), что, естественно, ограничивает число коллективов, занятых в этой области.

Предложенная компанией Cognitive Technologies модель описания «языка» практически инвариантна (по отношению к языкам) и позволяет на порядок снизить трудозатраты при описании морфологии и синтаксиса различных языков мира. Построенные на ее базе системы перевода нового поколения позволят разрешать смысловые неоднозначности не только для двух языков, но и для всего межъязыкового пространства. В настоящее время ядро системы — анализатор текста, предназначенный для описания новых языков, находится в открытом доступе.

Технологии анализа информации, разработанные в рамках проекта Cognitive Translator, находят свое применение в создаваемых компанией информационных системах, в частности для решения задач распознавания и «понимания» документов.

9 декабря Cognitive Translator (включая описание системы) был выложен в открытый доступ в сети Интернет на сайте www.cognitive.ru в разделе «Научные исследования», что является подарком посетителям сайта к Новому году. Система представляет собой интерактивную среду, обеспечивающую возможность перевода, редактирования и синхронного просмотра оригинала текста, перевода и дополнительных вариантов перевода. Ограничение по размеру переводимого текста составляет 32 КБ (примерно 32 000 знаков). Система поддерживает два направления перевода англо-русский и русско-английский.

Необходимо отметить, что представляемый проект находился в течение последних пяти лет в режиме альфа–тестирования. За это время система сделала порядка 20 млн. переводов (около 15 000 переводов в день).

В ближайших планах по развитию проекта Cognitive Translator: добавление новых языков перевода, создание и подключение новых правил перевода, совершенствование технологий «понимания».

9 декабря 2008

18:57

Ctrl
ПредыдущаяСледующая

Все новости за сегодня

Анонс смартфона Google Pixel 2, оснащенного SoC Snapdragon 836, запланирован на 5 октября: Snapdragon 836 будет отличаться от Snapdragon 835 повышенной частотой работы ядер

Массив AccelStor NeoSapphire H710 включает 48 твердотельных накопителей: К областям применения NeoSapphire H710 производитель относит облачные и суперкомпьютерные вычисления

Поставки смартфонов Xiaomi в третьем квартале 2017 могут достигнуть 30 млн единиц: Активный выпуск новых моделей смартфонов позволит Xiaomi в третьем квартале отгрузить от 25 до 30 млн мобильных устройств

Система воздушного охлаждения Arctic Freezer 33 Penta оценена производителем в 46 евро: Через основание Freezer 33 Penta проходят четыре медные тепловые трубки

Поставки настольных ПК HP за год сократились на 3%: Компания HP опубликовала отчет за третий квартал 2017 финансового года

Представлен смартфон YotaPhone 3 стоимостью 21 500 руб.: Объем оперативной памяти составляет 4 ГБ, флэш-памяти может быть 64 или 128 ГБ6

Мобильные операторы сообщают, что анонс iPhone 8 состоится 12 сентября: Apple должна подтвердить дату проведения пресс-конференции в ближайшие дни9

Смартфон Lamborghini Alpha-One оценен в $2450 : Lamborghini Alpha-One оснащен усилителем и ЦАП, а также двумя громкоговорителями и поддержкой Dolby Atmos6

Представлена камера Nikon D850: Рекомендованная производителем цена новинки примерно равна $330013

Опубликовано изображение, на котором сравниваются Xiaomi Mi Mix, Xiaomi Mi Mix 2 и Samsung Galaxy S8: Анонс Xiaomi Mi Mix 2 может состояться в сентябре3

Беспроводная гарнитура Meizu EP52 оценена в $45: Гарнитура защищена от попадания влаги в соответствии с требованиями класса IPX5

Надписи на клавишах клавиатуры Cherry MX Board 5.0 выполнены эксклюзивным шрифтом: Цена новинки — 159 евро6

Предыдущие владельцы Galaxy Note7 могут сэкономить при покупке Note8 до $425: Акция ограничена онлайновым магазином Samsung в США17

Описание умного браслета Samsung Gear Fit2 Pro замечено на сайте производителя: О цене официальной информации пока нет

1318

iXBT TV

  • Обзор изогнутого монитора Samsung C24FG70FQI с поддержкой AMD FreeSync и частоты 144 Гц

  • Электро-Maybach, топовая Nokia и действительно оригинальный смартфон

  • Обзор видеоускорителя AMD Radeon RX Vega 64

  • Обзор легкой, компактной и дешевой мясорубки Kitfort KT-2101 Carnivora

  • Обзор беззеркальной фотокамеры Fujifilm X-T20

  • Обзор кинотеатрального DLP-проектора BenQ W11000 с эмуляцией разрешения 4К

  • AMD Ryzen Threadripper 1920Х и 1950X — тестирование 12-ядерного и 16-ядерного процессоров

  • Обзор мини-ПК ECS Liva Z на базе процессора Apollo Lake

  • Самый лучший процессор, неудачи Microsoft, гибкие наушники Samsung

  • Обзор цветного МФУ Xerox VersaLink C405 для малых и средних офисов

  • Обзор умного чайника Redmond SkyKettle RK-G200S с подсветкой и нагревом воды до нужной температуры

  • Конфигурируем мини-ПК: изучаем влияние памяти и накопителя на быстродействие системы

1212

Календарь

декабрь
Пн
Вт
Ср
Чт
Пт
Сб
Вс

Рекомендуем почитать