Для людей, увлечённых языками. Tatoeba: база предложений на 422 языках

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Обзор | ИИ, сервисы и приложения

Must-have ресурс для преподавателей, переводчиков, разработчиков и людей, увлечённых иностранными языками.

Tatoeba — это некоммерческий open-source проект, основанный в 2006 году и направленный на коллекционирование предложений и их переводов на разные языки мира. Ключевым плюсом проекта, в противовес классическим словарям, является обращение к содержательной части речи, а не буквальным переводам. Сохранение контекста позволяет раскрывать идиоматику переводимого языка, переносное значение слов и образ работы различных грамматических конструкций, например, фразовых глаголов или времён. Согласно разработчикам, участие в проекте вызывает своего рода зависимость!

Разумеется, поскольку любой пользователь может свободно переводить предложения на свой родной язык, в большинстве случаев можно обнаружить современную живую речь, что часто оказывается нехарактерно для учебников по иностранным языкам. На сайте встречается большое количество предложений с интересной лексикой из области права, политики и экономики.

Перечень основных языков в базе Tatoeba
Автор: Tatoeba Источник: tatoeba.org

Человеческий фактор

Поскольку база предложений формируется доброжелателями, изредка попадаются бредовые оригинальные предложения или плохие переводы. Чуть чаще встречаются неоптимальные варианты в разделе «переводы переводов». Здесь нет ничего удивительного: как правило, пользователи работают в одной языковой паре — «родной язык — изучаемый иностранный», поэтому могут пропустить неточность, сделанную до них.

Пример неоптимального перевода
Автор: Tatoeba Источник: tatoeba.org

Пример избыточного перевода с картинки: английское предложение перевели на немецкий с добавлением слова der Geschmack (вкус), которого не было в оригинале. Русские варианты, предложенные пользователями, повторяют эту неточность и выглядят немного неестественно, поскольку слово «вкус» в переносном значении у нас ассоциируется с вещами положительными, а не с тоской. Обратите внимание, что структура предложения тоже изменилась: английский вариант более «активный», немецкий и русский здесь тяготеют к пассиву (оригинальное подлежащее «я» стало дополнением «мне»).

Более оптимально было бы: «Я не знаю, что значит тосковать по Родине» или «Мне неведомо чувство тоски по Родине.»

Этот случай тем более нагляден, что раскрывает потенциал Tatoeba. Всего в один клик можно найти большое количество переводов и проследить т. н. переводческие трансформации. Пример сверху — это классическая ситуация смены подлежащего из разряда «I like apples — мне нравятся яблоки». При необходимости также можно воспользоваться поиском по словам и найти только те предложения, которые содержат нужное слово. Это очень удобно для нахождения примеров употребления редких грамматических конструкций.

Форматы работы с ресурсом

Количество применений зависит только от фантазии пользователя. Представляю те, которые пригодились лично мне.

1. Предлагать или корректировать переводы

Собственно, функция, из-за которой был создан проект. Алгоритм работы простой: выбираем тот язык, который изучаем, и пытаемся сделать наиболее естественный перевод предложений. Это хороший способ, чтобы запоминать новые слова в контексте. По моему мнению, время, потраченное на сверку со словарём и перевод одного предложения, окупается намного больше, чем простая зубрёжка по списку.

Плюсом является то, что за предложениями из совершенно разного контекста не нужно далеко ходить.

2. Находить редкие грамматические конструкции

При обучении английскому часто шутят, что некоторые грамматические времена практически не используются, но если всё-таки возникает необходимость объяснить ученику, что такое Future Perfect Continuous, достаточно легко подобрать хороший пример. Функция также будет полезна всем, кто составляет пособия или небольшие задания.

Future Perfect Continuous
Автор: Tatoeba Источник: tatoeba.org

3. Искать примеры употребления слова

Если возникает необходимость посмотреть или показать, как ведёт себя слово в прямом и переносном значении, как взаимодействует с другими словами, как обращается в разные части речи и т. д. Раньше подобные задачи приходилось выполнять методом активного гугления либо поиска по интернет-изданиям, что далеко не всегда было удобно.

4. Использовать базу предложений в собственных приложениях и проектах

На сайте есть отдельный раздел с материалами для разработчиков. Поскольку проект является открытым, базы предложений можно свободно скачать и использовать в коммерческих целях. Единственное, что потребуется, — это правильная ссылка-аттрибуция на Tatoeba.

С помощью баз данных создано большое количество полезных проектов. С перечнем ознакомиться можно здесь. Приведу два неплохих приложения:

10000 sentences — простенькое приложение на Android, в котором пользователю предлагается угадать перевод случайного слова в 10000 предложениях. Хороший и не очень трудозатратный способ привыкнуть к языку и узнать большое количество лексики в контексте предложений.

Clozemaster — сайт, приложение для iOS и Android. Принцип работы тот же самый, что и в предыдущем проекте, но с добавлением аркадных элементов и более удобных элементов интерфейса. К великому сожалению, в прошлом году создатели приложения поставили для обычных пользователей ограничение до 30 предложений в день. Остальное — по платной подписке в 699 руб. в месяц.

Если вас заинтересовал проект:

Сайт Tatoeba

Краткое руководство на русском

Источник: Tatoeba

Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
Пишу о полезных программах, иностранных языках и шахматах.

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Угольный фильтр в холодильнике: нужен ли он и стоит ли за него платить

Современный холодильник представляет сложную система, где воздух постоянно циркулирует для равномерного охлаждения всех продуктов. При хранении разнообразной еды в камере могут появляться...

Гидропонная ферма своими руками: создаём установку для свежей зелени на подоконнике с 3D‑принтером QIDI Max4

Свежая зелень круглый год: как собрать гидропонную систему с помощью 3D‑печати на примере QIDI Max4. Свежая зелень в доме круглый год — об этом, пожалуй, мечтают многие, и не имеет...

Роботы научились «плавать» в пространстве-времени, используя формулы Эйнштейна

Благодаря научно-фантастическим фильмам мы уже привыкли, что на основе Общей теории относительности Эйнштейна мы когда-то в далёком будущем сможем покорять пространство-время. А сейчас эту теорию...

Обзор комбо-устройства Inspector Mike S Pro – возможности комбо-устройства без лишних ожиданий

Inspector Mike S Pro это комбайн, вобравший в себя функции видеорегистратора, радар-детектора и GPS-информера в одном корпусе. Модель получила рупорную антенну с LNA-усилителем, распознавание...

Мы десятилетиями недооценивали Вселенную: астрономы обнаружили водородный туман, скрывающий настоящие размеры галактик

На протяжении многих десятилетий астрономические наблюдения строились вокруг изучения звезд. Когда исследователи направляли телескопы в космос, они фиксировали свет светящихся объектов и на основе...

Почему наличие великих рек не спасает Индию от дефицита чистой воды

Индия кажется страной, где проблем с водой быть не должно по определению. Ежегодно на её территорию выпадает около 4 000 млрд кубометров осадков. Для масштаба: это примерно одна шестая объёма...