Как Китай уместил 50.000 иероглифов на клавиатуре? Современные методы ввода и исторический контекст

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Мнение | Оффтопик

Китайский язык с его богатством иероглифов представляет собой уникальную и сложную систему письменности. В то время как общее количество иероглифов превышает 50.000, для повседневного общения достаточно всего 3.000-4.000 символов. Это создает интересный вопрос: как же китайцы могут эффективно вводить такое огромное количество иероглифов на клавиатуре? Ответ кроется в нескольких инновационных методах ввода, которые были разработаны относительно недавно.

Пишущая машинка с поддержкой китайского шрифта с 2450 знаками
Автор: Dadiolli | Tilman Schalmey Источник: ru.wikipedia.org

Современная китайская клавиатура

Современные китайские клавиатуры обычно имеют стандартную раскладку QWERTY, что делает их похожими на клавиатуры, используемые в других странах, но они используют различные системы ввода для обработки иероглифов. Одним из самых популярных методов является «Пиньинь» — фонетическая система, позволяющая вводить звучание слова с помощью латинских букв; пользователь набирает слово в пиньине и выбирает нужный иероглиф из предложенного списка, что особенно удобно для тех, кто не знаком с графической структурой символов.

Другим важным методом является структурный ввод: здесь иероглифы разбиваются на более простые элементы — графемы; всего существует около 208 базовых графем, которые можно комбинировать для создания различных знаков; клавиши на клавиатуре соответствуют этим графемам, что позволяет пользователям вводить сложные символы путем последовательного нажатия нескольких клавиш; каждая клавиша может представлять несколько графем, что позволяет эффективно использовать пространство на клавиатуре — в среднем на одну клавишу может приходиться до восьми графем; таким образом, даже при большом количестве возможных символов пользователи могут быстро и эффективно набирать текст.

Автор: freepik Источник: ru.freepik.com

Древние истоки

Китайская письменность имеет одну из самых длинных и сложных историй среди всех существующих систем письма. Её корни уходят в глубокую древность, а процесс её эволюции был многогранным и многоступенчатым.

Согласно легендам, создание первых иероглифов приписывается мифическим фигурам, таким как Фу Си и Хуан Ди. Фу Си, по преданию, увидел знаки на спине великого дракона и создал восемь триграмм, которые стали основой для дальнейшего развития письменности. Хуан Ди, в свою очередь, поручил своему помощнику Цан Цзе создать систему иероглифов, основываясь на наблюдениях за природой.

Однако исторические данные указывают на то, что китайская письменность начала формироваться в конце II тысячелетия до н.э. во время правления династии Шан. Первые известные надписи были сделаны на черепаховых панцирях и костях животных — это так называемое цзягувэнь (甲骨文), которое считается одной из самых ранних форм китайского письма.

Этапы эволюции письменности

Китайская письменность прошла несколько ключевых этапов:

  1. Пиктографический период: На этом этапе использовались простые пиктограммы для обозначения объектов и понятий. Примеры таких знаков были найдены в археологических раскопках, датируемых 7-м тысячелетием до н.э.
  2. Архаичный период: В это время появились более сложные формы письма, такие как узелковое письмо и цзягувэнь. Эти системы начали использоваться для записи более сложной информации.
  3. Древний период: В эпоху династии Цинь (771—256 гг. до н.э.) император Цинь Шихуанди провел реформу письменности, унифицировав её и введя стиль сяо чжуань (小篆). Это стало основой для дальнейшего развития системы письма.
  4. Современный период: В XX веке была проведена реформа упрощения иероглифов, целью которой было повышение уровня грамотности населения. Упрощение коснулось более 2000 наиболее распространённых знаков.

Печатная машинка как прототип клавиатуры

В конце XIX века печатные машинки для набора китайских иероглифов работали по принципу «на каждый иероглиф — отдельный печатный элемент». Первое подобное устройство изобрёл американский проповедник Шеффилд в 1888 году. Он проанализировал частотность и выяснил, что для работы потребуется от четырёх до шести тысяч символов. В результате он выбрал 4662 иероглифа и расположил их на диске, который состоял из 30 концентрических кругов и 4 сектора.

Автор: MoRsE Источник: ru.wikipedia.org

В начале XX века китайский изобретатель Джоу Хокун разработал другую модель печатной машинки. На её барабане было размещено 3000 символов. Оператор должен был найти нужный символ на поисковой карте и установить барабан в нужное положение. Ки Фуан, который создал более простое устройство с тремя механизмами: возврата, пробела и клавиши ввода. Однако у обоих изобретений был минус: для полноценной работы требовалось больше символов, чем они могли предложить.

В 1946 году филолог Линь Юйтан предложил кардинально другой подход к печатанию иероглифов. Его машинка содержала всего 64 клавиши, но позволяла напечатать практически любой иероглиф за счёт использования составных частей (графем). В центре устройства располагался так называемый «волшебный глаз», который показывал вариант иероглифа при нажатии комбинации клавиш. Эта машинка могла печатать до 50 знаков в минуту, но её высокая цена (около 120 тыс. долларов) и ненадежность не позволили ей стать массовой.

К концу 1970-х годов инженеры начали разрабатывать новые методы ввода. В Пекинском университете была создана система, которая позволяла вводить до 7282 иероглифов с помощью клавиатуры на 256 клавиш. Эта система использовала комбинации нажатий для создания сложных символов из простых графем.

Заключение

Эволюция китайских клавиатур — это не просто история технического прогресса; это отражение культурных изменений и адаптации общества к новым условиям коммуникации. От первых громоздких печатных машинок до современных высокотехнологичных устройств.

Эволюция китайских клавиатур является ярким примером того, как технологии могут адаптироваться к культурным особенностям языка и общества в целом, обеспечивая эффективные инструменты для общения в быстро меняющемся мире.

Изображение в превью:
Автор: Dadiolli | Tilman Schalmey
Источник: ru.wikipedia.org
Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
Почта для связи — gorbov.busines@yandex.ru

13 комментариев

Добавить комментарий

m
В России не принято отделять точками нули в больших числах. Написание «50.000 иероглифов» следует понимать как «50 иероглифов, с точностью до третьего знака после запятой», да и то только если это математический контекст на тему округления. В остальных случаях надо просто писать «50000 иероглифов». Или «50 тысяч иероглифов». Исправьте, пожалуйста, этот американизм и не пишите так больше. Люди привыкают к нестандартному написанию и потом это выливается в серьёзные ошибки и разночтения в самых разных сферах.
Svarog257
Ну, если уж совсем занудничать, то в англоязычных странах для разделения разрядов в больших числах используется не точка, а запятая, точка же используется для отделения целой части числа от его десятичной дробной части. В русском языке, кстати, для этого обычно используется запятая — во всяком случае, именно так меня когда-то учили в школе.
Так что действительно, выражение «50.000 иероглифов» безграмотно с любой точки зрения, ибо иероглифы дробными не бывают.
m
Вот и я про то же. Статья на русском языке, а стандарты использованы американские, что вносит путаницу и вызывает раздражение. Раз автор взялся переводить — пусть переводит грамотно. А вообще, давно пора этот момент стандартизировать. Смогли же внедрить СИ. Смогли внедрить единое летоисчисление. А почему эти мелкие нюансы не доработали? Сколько десятилетий ещё будет эта чехарда.
Icelander
Смогли внедрить единое летоисчисление

Да, смогли! И это летоисчисление — западное! По православному Новый год будет только в ночь с 13 на 14 января (кстати, повод выпить! :).
И систему СИ придумали на гнилом Западе. Лягушатники изготовили эталоны метра и килограмма ещё в 18 веке.
Мы должны гордо отвергнуть всё западное! В аршинах и вёрстах всё мерить удобнее! :)
stalinets
Зачем отвергать всё западное? Отличия западного человека от других цивилизаций — это, кстати, тема, на которую очень недавно обратила всерьёз внимание наука. Да, получается, что западный человек — очень странный, он во многих статистических исследованиях находится на краю распределений. Он не является репрезентативным для всего человечества, не является «средним», «нормальным» человеком. То, что кажется справедливым и правильным западному человеку, часто совсем не так для человека из Африки или Азии. Но тем не менее именно западная цивилизация в последние лет 500 резко рванула вперёд в развитии и построила всё то, что мы видим из благ цивилизации. На эту тему посмотрите видео Александра Маркова в двух частях, называется «Самые странные люди на свете. Часть первая» и "… вторая". Это обзор одной недавно переведённой на русский книги по антропологии. Всё это не имеет никакого отношения к политике и русофобии отдельных правящих кланов в западных странах.
Icelander
Не горячитесь, коллега, это был сарказм по поводу нынешней моды, навязываемой с телевизора. :)
Dmitry_Sh
следует понимать как «50 иероглифов, с точностью до третьего знака после запятой»
Ваш комментарий следует понимать, как высшей степени занудство.
m
Нет, это статьи нужно писать грамотно. Иначе потом из-за такой вот неправильно введённой запятой или не такого символа падают самолёты из-за недолива топлива, проигрываются войны из-за ошибки в планировании количества амуниции, падают ракеты из-за мелкого косяка в переменной в программном коде, или умирают люди от превышенной на порядки дозы облучения на медицинском аппарате. А формируется эта халатность именно таким образом. Кто-то поставил лишнюю точку потому что ему так удобнее. Кто-то не поставил точки над буквой «ё». И так далее. А юный читатель причитал это, впитал как норму и сам стал так писать. Это всё можно простить, когда это случается редко и по случайной описке. Можно простить когда это в личной переписке и не касается посторонних. Но когда это везде вокруг, куда ни посмотри, в вывесках магазинов, в СМИ, в книгах и журналах, в школьных учебниках (!), а обратишь внимание написавшего это человека — он ещё и начинает огрызаться, — это, знаете ли, начинает бесить. Наш технологический век не допускает такого, примеры я привёл. Но вместе с тем ненаказуемость порождает вседозволенность, вплоть до бравады своей неграмотностью и агрессии на сделавшего замечание.
105813088760559308575@google
Абсолютно с Вами согласен! Хотел бы еще добавить, что в русском языке, имена собственные пишутся с прописной буквы, а не со строчной. 😁
1
Если уж докапываться, то в русском языке в качестве десятичного разделителя принята запятая, а не точка. Так что как «с точностью до третьего знака» это тоже не читается. Но разделять группы разрядов точкой тоже неверно. Для этого стоит использовать [неразрывный] пробел.
stalinets
А по-моему, вообще не должно быть никакого разделителя. По крайней мере мне ни в школе, ни в колледже, ни в ВУЗе про это не рассказывали. Может, у типографий и издателей книг свои правила. Кстати, вот удивительно: открыл сейчас наугад первую попавшуюся советскую книжку, страницу с информацией о тираже. Там читаю:
Анатолий Иванович Сорокин
Мы с атомных
Г—10009. [Пробела нет!] И всякая инфа про «сдано в набор» и пр.
Ниже:
Тираж 100 000 экз. [Пробел есть!]
И как это называется? Стандарт не устоялся?
Neironext
Надеюсь к вам не прислушиваются. С разбиением в разы проще. И о каких стандартах вы говорите, когда автор сам может использовать то, что по его мнению более удобно.
109330897214149443997@google
Внесу свою лепту в борьбу с американизмами (на самом деле с плохим переводом от нейросети, который автор не собирался проверять): «Ки Фуан, который создал более простое устройство с тремя механизмами: возврата, пробела и клавиши ввода.»
И это одно предложение от начала до конца.
А вообще статья интересная, как-то не задумывался, как они эти загогулины печатают.

Добавить комментарий

Сейчас на главной

Новости

Публикации

Почему ИИ ставит под угрозу появление новых языков программирования

Сегодня современные большие языки программирования (Python, JavaScript, Java, Go, Rust и т. д.) переживают беспрецедентный период доминирования. Их позиции укрепляются не только за счёт огромного...

5 рыб из СССР, которые раньше были в каждом магазине, а сегодня почти исчезли

Иногда такие списки кажутся чуть надуманными… пока не начинаешь разбираться, откуда вообще бралась рыба на советских прилавках. И тут внезапно всплывает целая система: океанический флот,...

Миф о вкусовых зонах языка: почему мы до сих пор верим в него, и как на самом деле работает вкус

Классическая «карта языка» — со сладким на кончике, солёным и кислым по бокам, горьким на задней части — до сих пор встречается в некоторых учебниках и популярных изданиях,...

Какого цвета инопланетная жизнь? Почему на других планетах она почти наверняка будет фиолетовой

С момента открытия первых планет за пределами Солнечной системы астрономия прошла огромный путь. На сегодняшний день ученые подтвердили существование более 5500 экзопланет, и фокус исследований...

Время можно отмотать назад: физики доказали, что квантовой необратимостью можно управлять

У фундаментальных законов физики, описывающих устройство нашей Вселенной, есть интересное свойство: они симметричны по отношению ко времени. Уравнения классической механики, электродинамики и даже...

Ошибка «Марсианина»: почему колонисты не смогут сажать картофель и чем они будут питаться на самом деле

Отправка пилотируемой миссии на Марс, которая планируется ведущими космическими агентствами уже в следующем десятилетии, открывает перед инженерами проблему обеспечения экипажа продовольствием....