Уважаемый
Макар.Н, давно слежу за Вашими наработками по системам ключевого ввода. Я сам давно транслировал различные существующие CJKV системы ввода под макросы MS Word.
наработки -
http://ifolder.ru/30206220Но недавно стал задумывать тоже свою собственную систему ключевого ввода, поэтому могу поделиться советами.
1. Ключевой ввод, ориентированный на множестве ключевых элементов1) Имеется таблица радикалов.
2) Иероглифический знак задается просто множеством элементов
ПРИМЕР
器=口,犬2. Ключевой ввод, ориентированный на правильную последовательность ключевых элементов1) Имеется таблица радикалов.
2) Иероглифический знак задается строкой элементов в порядке начертания
ПРИМЕР
器=口,口,犬,口,口3. Ключевой ввод, ориентированный композицию ключевых элементов в иероглифе1) Имеется таблица радикалов.
2) Иероглифический знак задается строкой элементов в порядке начертания с учетом жестко оговоренного правила декомпозиции
ПРИМЕР
澗=水⿰間=水⿰(門⿵日)В Wenlin и Юникоде CDL (Charactre Description Language) типы декомпозиции очень сильно различаются. Хотя Юникод конечно же имеет более обоснованную и продвинутую систему знаков декомпозиции и не хватает в них только типов удвоения, утроения, учетверения одного не обязательно ключевого знака - это совершенно логически самостоятельные типы декомпозиции.
Вообще возникает еще ряд сложностей.
1) Детализация ключевого знакаЕсли начать графически точно детализировать, то можно зарыться в такие таблицы ключевых знаков, который будут насчитывать и 500 и 1000 знаков. Поэтому нужны жесткие градации, которые будут определять что такое ключевой знак и его варианты, и какие из его вариантов будут самостоятельными. Это проблема, в Унихани ее частично решили путем ввода различных вариантов знака.
ПРИМЕР
Сначала так
澗=水⿰間=水⿰(門⿵日)а почему не так?
澗=氵⿰間=氵⿰(門⿵日)Т.е. встает еще одна проблема - как подробно при декомпозиции описывать варианты, которые принимает базовый ключевой знак.
2) Вымершие ключевые знакиЕсли вы просматривали 20902 знака из основного CJK-набора Юникода, то замечали что некоторые иероглифы можно объединить в очень ярко-выраженные ключи.
Вот таблица некоторых вымерших ключей.
Кстати в Wenlin4 имеется своя таблица ключей для иероглифов старого написания - СяоЧжуань, так там очень много вымерших ключей (явно намного больше 214).
А это другая таблица ключей (не помню где ее скачал)
Что касается вашей системы ввода на палладице, то вынужден признать ее пригодность, поскольку палладица вполне однозначна для систем фонетического ввода иероглифов (полная кириллическая альтернатива путнхуа пиньинь), хотя и не совсем адекватна по фонетике. Но именно для "начинающих" она необходима, через нее легче выучить пиньинь русскоязычному лицу. Да я сам много лет назад начинал изучение фонетики Путунхуа именно через палладицу. Поэтому так держать!
И еще совет. Месяц назад натыкался в сети про печатную машинку Ли ЮйТана, через нее вышел прямо на Гугле на целую "залежь" патентов по различным системам ввода иероглифов за период 40-х-80-х годов. Это именно большей частью некомпьютерные системы ввода, там много полезнного можно найти. Именнно из тех систем частично вышли современные морфологические системы иероглифического ввода: CangJie, Boshiamy, Array30 и др.
Рекомендую еще почитать про CangJie - это очень оптимальная система ввода, может у Вас появятся свои мысли по этому поводу - как скрестить ЦанЦзе и ключи.
Вообще, ключевых таблиц и принципов декомпозиции для китайских иероглифов можно создавать тысячами. Я же предпочитаю все стандартное
1) Декомпозиция - по правилам Юникода.
2) Таблица ключей - классическая КанСи 214 знаков, хотя простейший пример декомпозиции
學=?⿱子 в такой таблице уже невозможен (традиционный знак - xue2). Знак, подразумеваемый вопросиком конечно же существует, но только в четырех байтовом расширении Юникода, поддержку которого не везде еще можно встретить.