Шифры и алфавиты

Кстати, известно, что для развития древней криптографии большое значение имела система письменности. Так, фонетический алфавит, состоящий из букв, позволяет конструировать шифры простой замены, которые можно эффективно использовать без всяких там вычислительных машин. (Такой шифр, например, основан на подстановке вместо буквы открытого текста буквы шифротекста из того же алфавита с использованием некоторой таблицы замены.) В фонетическом письме слово записывается несколькими буквами, при этом буквы фиксируют не смысл слова, а его звучание. По сути, фонетическое письмо – первая система кодирования звука, с целью записи для последующего воспроизведения. Отчасти поэтому, используя алфавит и сложные правила подстановки, удавалось проектировать и внедрять довольно стойкие, – ну, для докомпьютерной древности, – шифры.

А вот если у вас иероглифическое письмо, то ситуация складывается иная. Иероглифов много. Для записи сложного понятия может быть достаточно одного иероглифа. Да, в теории, подстановку по таблице можно сделать и здесь. Более того, расшифровка содержательного сообщения из трёх-пяти иероглифов без знания ключа может оказаться принципиально невозможной: из-за того, что валидных вариантов слишком много. Но при этом таблица замены должна быть огромной. Это проблема. Фонетический алфавит позволяет представить все слова соответствующего языка, и при этом содержит обозримое число знаков. А иероглифов слишком много: даже если ограничить список допустимых в сообщениях символов, таблица получится неудобной. Ну и как тут развивать криптографию?

()

Похожие записки:



Далее - мнения и дискуссии

(Сообщения ниже добавляются читателями сайта, через форму, расположенную в конце страницы.)

Комментарии читателей блога: 13

  • 1. 19th December 2011, 22:08 // Читатель зашел в гости написал:

    большие таблицы – не проблема. в “докомпьютерные” времена грамотных было по пальцам перечесть, да и торопиться было некуда. :)
    Исторический пример: на английском флоте времен Нельсона использовались книги кодов (Popham’s code) для использования с сигнальными флагами. Никто не выписывал слова по буквам: вывешивалась серия последовательностей по 3 символа, значения содержались в книгах (в свинцовом переплете, чтобы в случае чего – за борт). Таким образом, и сообщения щифровались, и место на фалах, и количество используемых флажков экономились. Метод, вроде, неудобный, но королевскому флоту он не мешал.

  • 2. 20th December 2011, 12:04 // Читатель jno написал:

    Чё-то я не ущучил, какая ПРИНЦИПИАЛЬНАЯ разница между буквенной и понятийной/иероглифической (а есть ещё, как минимум, слоговая – как у японцев) кодификацией языка с т.з. преобразований текста?

    На входе – “алфавит” (что из 26 или 33 букв, что из 20К иероглифов – берём за образец шибко грамотного китайца) и текст в том алфавите, на выходе – тоже текст в том же алфавите…

  • 3. 20th December 2011, 20:15 // Читатель зашел в гости написал:

    “какая ПРИНЦИПИАЛЬНАЯ разница между буквенной и понятийной/иероглифической”

    теоретически – разницы не должно быть. Один набор символов замещается другим. На практике дело в удобстве, скорости и доступности. Сортировка иероглифов “в алфавитном порядке” – процедура непростая: нужно найти “ключ” данного символа, посчитать из какого количества штрихов он состоит, и искать весь иероглиф в соответствуещей секции словаря (ключ/кол-во штрихов). т.е квалификация специалиста для шифрования иероглифов должна быть намного выше, чем, скажем, требуется для использования английского “кода Попхэма”.

  • 4. 20th December 2011, 22:23 // Александр Венедюхин ответил:

    Для 5 тыс. иероглифов таблица подстановок должна быть какой-то устрашающей. И, кстати, для иероглифов не выйдет изготовить хороший и простой механизм с дисками, “автоматизирующий” шифрование/расшифровку.

  • 5. 20th December 2011, 23:10 // Читатель Z.T. написал:

    Как jno написал, есть Kana. Kanji транслитерируется на Kana и шифруется обычными методами. Так работает набор на клавиатуре: набираеш Kana а компютер заменяет несколяко знаков на один Kanji.

  • 6. 21st December 2011, 18:01 // Александр Венедюхин ответил:

    Не, ну понятно ж, что если перейти от иероглифов к подобной азбуке (кана) с обозримым алфавитом, то ситуация исправляется. Об этом и речь. Проблема-то именно с иероглифической письменностью.

  • 7. 21st December 2011, 18:41 // Читатель зашел в гости написал:

    “Kanji транслитерируется на Kana”

    а как быть с иероглифами, имеющими несколько разных произношений? Или со словами, которые могут быть записаны несколькими иероглифами?

  • 8. 22nd December 2011, 15:11 // Читатель jno написал:

    Проблема не с иероглификой.
    Проблема – с алфавитом переменной/неопределённой длины.
    Как в китайском языке.

    Однако, если не ставить задачи передачи шифртекстом сочинений великих лаоши, то проблема купируется принудительным ограничением “алфавита”.

  • 9. 22nd December 2011, 19:43 // Читатель зашел в гости написал:

    “Проблема – с алфавитом переменной/неопределённой длины”

    и неоднозначной интерпретации. т.е. в русском алфавите “а” идет перед “б”, и все тут. С иероглифами не все так просто.

    “то проблема купируется принудительным ограничением “алфавита””

    кстати, должно присутствовать четко расписанное правило для символов, не входящих в алфавит. С приведенным мною ранее “кодом Попхэма” был такой курьез: перед началом Трафальгарского сражения адмирал Нельсон приказал вывесить сигнал “England confides that every man will do his duty”. Слов “confides” и “duty” в книге кодов не было. “confides” заменили синонимом “expects”, а “duty” пришлось выписывать по буквам.

  • 10. 22nd December 2011, 23:54 // Читатель Bogdan написал:

    Кстати, ведь японцы во время ВМВ использовали шифровальные машины типа Энигмы. Как решалась проблема шифрования тогда?

  • 11. 23rd December 2011, 00:08 // Читатель зашел в гости написал:

    Bogdan,

    если я правильно вас понял, то речь идет о системе “Purple”. Она работала с латинским алфавитом.

  • 12. 23rd December 2011, 11:48 // Читатель Bogdan написал:

    зашел в гости,

    Кажется так. Но тогда проблемы с иероглифами нет. Писарь при расшифровке сообщения на латинице, просто записывал его иероглифами. Понятно, что сейчас это происходит автоматически.

  • 13. 23rd December 2011, 12:42 // Читатель jno написал:

    Давайте уж определимся, что геморрой вызывает именно китайская письменность (и сходные с ней), но не японская.

    С другой стороны, язык шифрограмм и так обычно ограничен и кодифицирован (оригиналов типа Нельсона нынче, поди, академии не выпускают).

    Так, для чтения газет требуется знать около 6000 крякозябров. Их кодификация и сортировка обычно проблем не вызывают. Как и прочтение.

    ДВУМЕРНЫЕ же тексты древних лаоши (вся страница – считай, один иероглиф) один хрен ТАК не кодируются (ну, без потерь смысла, понятно). Впрочем, сейчас их и не каждый китаец прочесть сможет (в смысле, прочесть “как написано”, а не воспроизвести составляющие иероглифы).