Для людей, увлечённых языками. Tatoeba: база предложений на 422 языках

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Обзор | ИИ, сервисы и приложения

Must-have ресурс для преподавателей, переводчиков, разработчиков и людей, увлечённых иностранными языками.

Tatoeba — это некоммерческий open-source проект, основанный в 2006 году и направленный на коллекционирование предложений и их переводов на разные языки мира. Ключевым плюсом проекта, в противовес классическим словарям, является обращение к содержательной части речи, а не буквальным переводам. Сохранение контекста позволяет раскрывать идиоматику переводимого языка, переносное значение слов и образ работы различных грамматических конструкций, например, фразовых глаголов или времён. Согласно разработчикам, участие в проекте вызывает своего рода зависимость!

Разумеется, поскольку любой пользователь может свободно переводить предложения на свой родной язык, в большинстве случаев можно обнаружить современную живую речь, что часто оказывается нехарактерно для учебников по иностранным языкам. На сайте встречается большое количество предложений с интересной лексикой из области права, политики и экономики.

Перечень основных языков в базе Tatoeba
Автор: Tatoeba Источник: tatoeba.org

Человеческий фактор

Поскольку база предложений формируется доброжелателями, изредка попадаются бредовые оригинальные предложения или плохие переводы. Чуть чаще встречаются неоптимальные варианты в разделе «переводы переводов». Здесь нет ничего удивительного: как правило, пользователи работают в одной языковой паре — «родной язык — изучаемый иностранный», поэтому могут пропустить неточность, сделанную до них.

Пример неоптимального перевода
Автор: Tatoeba Источник: tatoeba.org

Пример избыточного перевода с картинки: английское предложение перевели на немецкий с добавлением слова der Geschmack (вкус), которого не было в оригинале. Русские варианты, предложенные пользователями, повторяют эту неточность и выглядят немного неестественно, поскольку слово «вкус» в переносном значении у нас ассоциируется с вещами положительными, а не с тоской. Обратите внимание, что структура предложения тоже изменилась: английский вариант более «активный», немецкий и русский здесь тяготеют к пассиву (оригинальное подлежащее «я» стало дополнением «мне»).

Более оптимально было бы: «Я не знаю, что значит тосковать по Родине» или «Мне неведомо чувство тоски по Родине.»

Этот случай тем более нагляден, что раскрывает потенциал Tatoeba. Всего в один клик можно найти большое количество переводов и проследить т. н. переводческие трансформации. Пример сверху — это классическая ситуация смены подлежащего из разряда «I like apples — мне нравятся яблоки». При необходимости также можно воспользоваться поиском по словам и найти только те предложения, которые содержат нужное слово. Это очень удобно для нахождения примеров употребления редких грамматических конструкций.

Форматы работы с ресурсом

Количество применений зависит только от фантазии пользователя. Представляю те, которые пригодились лично мне.

1. Предлагать или корректировать переводы

Собственно, функция, из-за которой был создан проект. Алгоритм работы простой: выбираем тот язык, который изучаем, и пытаемся сделать наиболее естественный перевод предложений. Это хороший способ, чтобы запоминать новые слова в контексте. По моему мнению, время, потраченное на сверку со словарём и перевод одного предложения, окупается намного больше, чем простая зубрёжка по списку.

Плюсом является то, что за предложениями из совершенно разного контекста не нужно далеко ходить.

2. Находить редкие грамматические конструкции

При обучении английскому часто шутят, что некоторые грамматические времена практически не используются, но если всё-таки возникает необходимость объяснить ученику, что такое Future Perfect Continuous, достаточно легко подобрать хороший пример. Функция также будет полезна всем, кто составляет пособия или небольшие задания.

Future Perfect Continuous
Автор: Tatoeba Источник: tatoeba.org

3. Искать примеры употребления слова

Если возникает необходимость посмотреть или показать, как ведёт себя слово в прямом и переносном значении, как взаимодействует с другими словами, как обращается в разные части речи и т. д. Раньше подобные задачи приходилось выполнять методом активного гугления либо поиска по интернет-изданиям, что далеко не всегда было удобно.

4. Использовать базу предложений в собственных приложениях и проектах

На сайте есть отдельный раздел с материалами для разработчиков. Поскольку проект является открытым, базы предложений можно свободно скачать и использовать в коммерческих целях. Единственное, что потребуется, — это правильная ссылка-аттрибуция на Tatoeba.

С помощью баз данных создано большое количество полезных проектов. С перечнем ознакомиться можно здесь. Приведу два неплохих приложения:

10000 sentences — простенькое приложение на Android, в котором пользователю предлагается угадать перевод случайного слова в 10000 предложениях. Хороший и не очень трудозатратный способ привыкнуть к языку и узнать большое количество лексики в контексте предложений.

Clozemaster — сайт, приложение для iOS и Android. Принцип работы тот же самый, что и в предыдущем проекте, но с добавлением аркадных элементов и более удобных элементов интерфейса. К великому сожалению, в прошлом году создатели приложения поставили для обычных пользователей ограничение до 30 предложений в день. Остальное — по платной подписке в 699 руб. в месяц.

Если вас заинтересовал проект:

Сайт Tatoeba

Краткое руководство на русском

Источник: Tatoeba

Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
Пишу о полезных программах, иностранных языках и шахматах.

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Детальное изучение мозга чемпиона по памяти раскрыло нейробиологию его трюков

Рабочая память человека имеет свои физиологические ограничения. Исторически в когнитивной психологии этот предел описывался формулой «семь плюс-минус два элемента». Вы можете легко удержать в...

Эффект странника: как навыки ориентации в пространстве породили у человека геометрическое мышление

Со времен Платона геометрия считалась высшим проявлением абстрактного мышления. В диалоге «Менон» философ просит необразованного мальчика-раба удвоить площадь квадрата — и тот, опираясь...

Каньон Антилопы: почему он самый извилистый и фотогеничный в мире

В Аризоне, на землях индейцев навахо, находится место, любимое фотографами со всего мира. Каньон Антилопы вы наверняка хоть раз видели на заставке своего компьютера. Microsoft вносила его виды в...

Почему кофе и чай бодрят: взгляд с точки зрения науки

Вы когда-нибудь замечали, что после чашки кофе фокусировка внимания резко обостряется, но уже через полчаса ясность мысли начинает неумолимо угасать? Эти «американские горки» связаны с конкретными...

Как гора выше Эвереста остаётся невидимой: 75% высоты Мауна-Кеа скрыто океаном

Говоря о горных вершинах, достигающих наибольших высот, невозможно не вспомнить об Эвересте. Эта гора возносится в небо на 8848 метров над уровнем моря, и этот рекорд закреплён в школьных учебниках...