Автор Тема: Ввод иероглифов по ключам (Radical lookup)  (Прочитано 50950 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Макар Н.

  • Новичок
  • *
  • Сообщений: 39
  • Карма: 5
  • Пол: Мужской
Re: Ввод иероглифов по ключам (Radical lookup)
« Ответ #25 : 01 Мая 2010 10:41:21 »
Господа.

Спасибо всем участникам обсуждения. Особенное спасибо уважаемому модератору Papa Huhu, который его инициировал. Особенно приятно, что параллельно мы узнали и о "лучшем словаре для поиска иероглифов" :)...

В общем, деваться некуда - пошел в рукопашную.

Если кому любопытна эдакая "писалка" (ударение каждый может поставить сам) иероглифов по графам, пишите в/на личку. "Натолкаю" туда первую тысячу, буду думать о способах передачи этого "богачества" народу, если кому понадобится :-[

Удачи вам.

Оффлайн mordapauka

  • Бывалый
  • ***
  • Сообщений: 107
  • Карма: 3
Re: Ввод иероглифов по ключам (Radical lookup)
« Ответ #26 : 01 Мая 2010 19:34:34 »
В двух словах: задача заключается в том, чтобы, имея список ключей, за три-пять щелчков мыши ввести в текст
Просто мне любопытно, каков может быть "use case" для такого способа? Как я это вижу (вполне возможно, просто не понимая вашей задумки - поэтому и прошу меня просветить): три-пять мышиных кликов, но не простых кликов, а каждый клик - выбор из нескольких сотен графем. Это легко может занять минуту-две. То есть для обычного ввода текста это непригодно. Более того, за это время легко можно успеть нарисовать иероглиф в любой программе для распознавания. А для чего тогда можно пользоваться такой системой, для поиска по компонентам, как в Wenlin? Так в Wenlin, хоть и есть баги, но зато у них отработанный набор компонент, причем рекурсивный, и база в 60000+ иероглифов. И база здесь играет самую большую роль - искать по компонентам нужно будет именно редкие иероглифы. Что-то я упускаю, но не знаю, что.

Оффлайн Макар Н.

  • Новичок
  • *
  • Сообщений: 39
  • Карма: 5
  • Пол: Мужской
Re: Ввод иероглифов по ключам (Radical lookup)
« Ответ #27 : 02 Мая 2010 12:09:14 »
Уважаемый mordapauka!

Просто мне любопытно, каков может быть "use case" для такого способа?
И мне любопытно...
Это первое и главное :).

Второе.
Цитировать
три-пять мышиных кликов, но не простых кликов, а каждый клик - выбор из нескольких сотен графем. Это легко может занять минуту-две.
Может и больше. Иногда я их не вижу "в упор" :(... Но у Вас это займет времени много меньше. Если Вы столь ловко пишите иероглифы (при этом, согласитесь, стилусом быстрее, чем мышью), полагаю, ключи то Вы уж знаете.  У меня в списке 260 графов (214 ключей по номерам + их варианты), в NJStar 236 графов (некоторые "варианты" ключей спрятаны под кнопкой "основного"). "Ткнуть" в 2 кнопки из известного Вам списка (阝и 鬲), согласитесь, проще, чем нарисовать даже один из них (я уж не говорю об искомом иероглифе  隔).

Третье.
Искать редкие иероглифы? Скорее, не "искать", а "рисовать" (мы ведь говорим о системе ввода иероглифов). Тогда согласен, но по какому принципу мне отличить "редкий" иероглиф от "нередкого"? "Редкий" это который не вошел в первую тысячу, или в первые десять тысяч по частоте использования? Теперь и Вы согласитесь, что систему лучше делать сразу для ВСЕХ иероглифов, независимо от частоты их употребления (что и сделано в WenLin).

Цитировать
И база здесь играет самую большую роль
Но с чего-то нужно начинать!? Вот и вопрошаю я в форуме...

Я не намерен "конкурировать" с WenLin'ем. И мне не греет душу "рекурсивность" его компонентов. Задача другая, от обратного - с помощью минимального обозримого набора компонентов вывести на экран максимально большое количество иероглифов, в идеале все - весьма скромно, не правда ли?  :)  А вот попользоваться его (WenLin'я) возможностями для подготовки самой базы, похоже, придется.

Кстати, WenLin (так же как и Lingvo) ищет иероглифы по ключам "по старинке" (прямой перенос "бумажного" алгоритма: ключ + дополнительные черты). Это, по моему скромному разумению  :-[, как раз та часть традиции, которую смело можно "насиловать", а именно, вводить в словари поиск по комбинации ключей. В конце концов, системы управления базами данных и были придуманы умными людьми для того, чтобы легко можно было бы манипулировать данными (в том числе и комбинировать их), а не для того, чтобы водить пальцем по монитору и считать "черты"/"чертей"/"чертов"...

Тут есть еще одна "фишка". Вы же понимаете, что кроме простой комбинации ключей важно и их взаимное расположение в иероглифе:  呆 и 杏  - явно не одно и то же. Но это уже другая история. Пока мне дополнительный параметр "взаимного расположения" кажется избыточным. Оставим это для "следующей версии"  ;)...

Оффлайн mordapauka

  • Бывалый
  • ***
  • Сообщений: 107
  • Карма: 3
Re: Ввод иероглифов по ключам (Radical lookup)
« Ответ #28 : 03 Мая 2010 03:34:42 »
У меня в списке 260 графов (214 ключей по номерам + их варианты), в NJStar 236 графов (некоторые "варианты" ключей спрятаны под кнопкой "основного"). "Ткнуть" в 2 кнопки из известного Вам списка (阝и 鬲), согласитесь, проще, чем нарисовать даже один из них (я уж не говорю об искомом иероглифе  隔).
Не знаю, дело ведь не только в физическом "ткнуть", их же еще надо найти. Где они будут сидеть - в выпадающем списке? Так его еще и листать черт знает сколько придется. Возьмем, к примеру виртуальную (на экране) клавиатуру для русского. Намного меньше "графем", можно показать их все вместе на экране (т.е. листать не надо) и т.д. - все преимущества, короче. Но от руки я лично все равно пишу намного быстрее, чем могу набрать на этой виртуальной клавиатуре. Возможно, конечно, вы мыше-виртуоз и у вас все наоборот :)

Цитировать
Я не намерен "конкурировать" с WenLin'ем. И мне не греет душу "рекурсивность" его компонентов. Задача другая, от обратного - с помощью минимального обозримого набора компонентов вывести на экран максимально большое количество иероглифов, в идеале все
Мне не совсем понятно, как это должно функционировать, поэтому спрошу на примере: если я ввожу 口 и 力, то я получу только 加 и 另,  или будет и 咖, или же будут и более сложные, как  别, 拐, 架 и т.д.?


Цитировать
смело можно "насиловать", а именно, вводить в словари поиск по комбинации ключей.
Это хорошая идея. Я все хотел привести вам пример такого словаря, но, к сожалению не могу вспомнить название, помню только, что видел его на rutracker'е. Качать я его не качал, поэтому и не могу вспомнить названия, но помню, что такая вещь там была.

Цитировать
Пока мне дополнительный параметр "взаимного расположения" кажется избыточным. Оставим это для "следующей версии"  ;)...
А мне эта идея тут пришла в голову и я как раз хотел вам написать, что это было бы интересной возможностью :)

Оффлайн Макар Н.

  • Новичок
  • *
  • Сообщений: 39
  • Карма: 5
  • Пол: Мужской
Re: Ввод иероглифов по ключам (Radical lookup)
« Ответ #29 : 03 Мая 2010 10:43:55 »
Уважаемый mordapauka!

Чтобы не "мутить поганку", и не вносить дополнительную путаницу, отошлю Вас к реализации этой идеи в NJStar. Он описан в "корне" нашего форума Criptozavr'ом  (NJStar Chinese Word Processor v5.10 PRO PORTABLE « : 05 Январь 2010 06:52:50 ») с качественными картинками. Но, конечно же, если хотите понять "технологию", скачайте (думаю, Criptozavr не откажется Вам в этом помочь) и попробуйте, все станет понятно.

У NJStar'а (для меня) есть несколько недостатков:

1)  Он "закрыт" для модификаций пользователем. При сколь-нибудь длительном пользовании Вы обратите внимание на некоторые "нелогичности" в наборе "ключей", в расположении иероглифов по "ключам" (когда искомый иероглиф оказывается "не там" или его "не оказывается" там, где Вы ожидаете...) А сделать Вы ничего не в состоянии  :(...
2) Его писал не я  ;D...
3) Пользоваться приходится мышью :(.
К сожалению, этот "недостаток" неустраним. Сам я безбедно обходился без мыши вплоть до 98-го года, а теперь... руки постепенно деградируют  :(, опасаюсь, что и мозги тоже  :).

Цитировать
Я все хотел привести вам пример такого словаря, но, к сожалению не могу вспомнить название, помню только, что видел его на rutracker'е.
Конечно же поищу. Если Вы мне поможете, буду благодарен. С удовольствием посмотрю на реализацию.

Цитировать
А мне эта идея тут пришла в голову и я как раз хотел вам написать, что это было бы интересной возможностью :)
Согласен, но на известных мне 30-ти иероглифах это явно избыточно ;). Алгоритм этого "довеска" прост и не потребует сложных манипуляций. Если хочешь добиться успеха, делать все нужно последовательно и постепенно. "Культура не терпит революций"  ;)...

Оффлайн Chunky

  • Профессионал
  • ****
  • Сообщений: 380
  • Карма: 21
  • Пол: Мужской
Re: Ввод иероглифов по ключам (Radical lookup)
« Ответ #30 : 05 Мая 2010 10:03:54 »
Немного офф-топ, просто для иллюстрации. Мне нравится словарь http://www.susi.ru/yarxi/
в котором как раз предусмотрен такой способ ввода. Правда, японский  :-(
I'm hungry

Оффлайн Макар Н.

  • Новичок
  • *
  • Сообщений: 39
  • Карма: 5
  • Пол: Мужской
Re: Ввод иероглифов по ключам (Radical lookup)
« Ответ #31 : 08 Февраля 2011 23:08:11 »
Господа, простите, если не в тему (модераторы поправят). Но начиналось все в этой ветке, посему и продолжим...

В двух словах: не прошло и года, ;D как идею ввода иероглифов по элементам удалось реализовать :-[...  в виде  программы "КПП" - Китайское Правильное Писание (для ленивых). Работает. O:)

В компаунде с входящими в комплект утилитками позволяет:

1) "расчленять" иероглифы на части в соответствии с наперед заданным набором "частей-компонентов";
2) самостоятельно формировать набор (список) этих "частей-компонентов";
3) легко запомнить свой набор компонентов ("традиционалисты" могут использовать ее как училку "ключей", например);
3) находить иероглифы по содержащимся в них компонентам в любой комбинации и сбрасывать (вводить) их в текстовое поле;
4) разбить весь массив используемых иероглифов на "уроки" и учить их либо все сразу, либо в нужном порядке;
5) выгружать данные в  csv-файлы и загружать их из csv-файлов, организуя таким образом "сообщение с внешним миром".

Получилась штучка, которую можно пользовать еще и в качестве "персонального словарика" для любимых слов и выражений (вместо многими любимого Ёкселя ;D) и вводить их в текстовое поле "одним мановением мыши" ;).

Описание см. http://poutko.ru/KPP.html
Саму программу можно взять непосредственно здесь  http://poutko.ru/Gliphs.zip

Оффлайн Criptozavr

  • Бывалый
  • ***
  • Сообщений: 154
  • Карма: 7
Re: Ввод иероглифов по ключам (Radical lookup)
« Ответ #32 : 09 Февраля 2011 16:23:43 »
Макар Н.

Спасибо за полезные утилиты. Не возражаете, если я их выложу на магазета? Естественно, с указанием авторства и ссылкой на оффсайт?

Оффлайн Макар Н.

  • Новичок
  • *
  • Сообщений: 39
  • Карма: 5
  • Пол: Мужской
Re: Ввод иероглифов по ключам (Radical lookup)
« Ответ #33 : 09 Февраля 2011 18:04:37 »
Честно?
Буду рад.
Не забудьте только, пожалуйста, про лицензию. По мне, она много дороже продукта  ;D ...
(Если не затруднит, ссылочку в "личку"  :-[)

Оффлайн Criptozavr

  • Бывалый
  • ***
  • Сообщений: 154
  • Карма: 7
Re: Ввод иероглифов по ключам (Radical lookup)
« Ответ #34 : 10 Февраля 2011 03:59:32 »
Макар Н.

Спасибо, что согласились :) Ссылку обязательно вышлю завтра или послезавтра. Кстати, приглашаю Вас заодно не только посмотреть на оформление, но и поучаствовать в обсуждении программы. Наверняка ведь будут отзывы :)

Кстати, обнаружился неприятный момент: у меня почему-то ни один из модулей не запускается :( Вроде бы JAVA установлена, а ничего не происходит - даже окно не появляется...
« Последнее редактирование: 10 Февраля 2011 04:09:31 от Criptozavr »

Оффлайн Chunky

  • Профессионал
  • ****
  • Сообщений: 380
  • Карма: 21
  • Пол: Мужской
Re: Ввод иероглифов по ключам (Radical lookup)
« Ответ #35 : 10 Февраля 2011 04:46:25 »
Аналогичный случай в нашей деревне. Не запускается при установленной Java
I'm hungry

Оффлайн Макар Н.

  • Новичок
  • *
  • Сообщений: 39
  • Карма: 5
  • Пол: Мужской
Re: Ввод иероглифов по ключам (Radical lookup)
« Ответ #36 : 10 Февраля 2011 13:01:29 »
Господа, простите торопыжку :( :( :(

Задействованы ли нужные ассоциации файлов в системе (это происходит где-то при установке Явы)? Посмотрите под правой кнопкой мыши ("правый клик" на файлике, напр. G-2.jar), "Открыть с помощью...", в списке программ должна быть выбрана Java (TM) Platform SE Binary (или что-то похожее в зависимости от версии). Если нет, найти в списке, если в списке нет, то найти кнопкой "Обзор".  Поставить галочку "Использовать для всех файлов такого типа", чтобы больше не париться.

Проверить работоспособность проги без всей этой маеты можно из командной строки (Пуск/Программы/Стандартные/Командная строка). Для начала перейти в рабочий каталог командой "cd диск:\полный путь установки", куда Вы ее воткнули, например, что-нибудь такое:
> cd c:\China\Gliphs
затем набрать
>java -jar KPP- 3_3.jar   

Проверено всего на трех "чужих" машинах, не поехало на одной, но установка ассоциаций помогла.
Инструкцию по Обустройству КПП дополнил (с картинками).

Извините...  :-[
« Последнее редактирование: 10 Февраля 2011 16:39:38 от Макар Н. »

Оффлайн Chunky

  • Профессионал
  • ****
  • Сообщений: 380
  • Карма: 21
  • Пол: Мужской
Re: Ввод иероглифов по ключам (Radical lookup)
« Ответ #37 : 10 Февраля 2011 17:06:09 »
Заработало, будем осваивать.
Пожелание с ходу - размер знаков (шрифт) можно изменять? Для меня важно увеличить, зрение не очень...
А вообще спасибо, интересно как минимум.
I'm hungry

Оффлайн Criptozavr

  • Бывалый
  • ***
  • Сообщений: 154
  • Карма: 7
Re: Ввод иероглифов по ключам (Radical lookup)
« Ответ #38 : 10 Февраля 2011 18:19:52 »
Макар Н.

Как и обещал, ссылка уже у Вас в личке.


Оффлайн Макар Н.

  • Новичок
  • *
  • Сообщений: 39
  • Карма: 5
  • Пол: Мужской
Re: Ввод иероглифов по ключам (Radical lookup)
« Ответ #39 : 10 Февраля 2011 18:35:07 »
Пожелание с ходу - размер знаков (шрифт) можно изменять? Для меня важно увеличить, зрение не очень...

Увы... Озабочен был тем, чтобы эта "гребенка" влезла на экран вся.  ;D Штатный механизм не предусмотрен. Пока побалуйтесь, потом будем думать, если не надоест и надо будет ;)... В принципе, "ответ сходу" -  могу безболезненно увеличить шрифт в поле глифов и в текстовом поле writer'а, но повторяю это нужно будет подкрутить исходники, или вообще прикрутить механизм выбора шрифтов к этим полям, но это уже другая задача. Пока мне была интересна сама идея, посему реализация такая убогая. "Звоночков и свисточков" навешать много есть куда  ;D , но стоит ли "парить мозги", если это кроме меня никому не нужно?

Оффлайн Chunky

  • Профессионал
  • ****
  • Сообщений: 380
  • Карма: 21
  • Пол: Мужской
Re: Ввод иероглифов по ключам (Radical lookup)
« Ответ #40 : 10 Февраля 2011 18:48:24 »
Основная реакция - Спасибо.
I'm hungry

Оффлайн Макар Н.

  • Новичок
  • *
  • Сообщений: 39
  • Карма: 5
  • Пол: Мужской
Re: Ввод иероглифов по ключам (Radical lookup)
« Ответ #41 : 11 Февраля 2011 14:01:28 »
Господа,

в КПП обнаружена еще одна неувязка...

Возможно некорректное отображение графа "мясо слева" (изначально я рисовал его одним символом  с "луной" - 月, потом их "развел", для чего пришлось "подкрутить" шрифт). Всех заинтересованных прошу снова скачать zip-файл. Из zip'а нужно обновить только шрифт (A3.ttf).

Оффлайн WERTA

  • Зарегистрированный
  • *
  • Сообщений: 20
  • Карма: 0
  • Пол: Мужской
Re: Ввод иероглифов по ключам (Radical lookup)
« Ответ #42 : 05 Сентября 2011 00:18:13 »
Все-таки ввод по ключам не всегда удобен (особенно для программиста). Я пытался даже усовершенствовать этот процесс - вроде новый метод ввода. Взял за основу старую и надежную CangJie (к сожалению многими забываемую). И четко поставил задачу что запись иероглифа компонуется так
[Ключевая часть][Композиция][Неключевая часть]
[Композиция] из стандарта UNICODE всего 12 типов
1.LEFT_TO_RIGHT
2.UP_TO_DOWN
3.LEFT_CENTER_RIGHT
3.UP_CENTER_DOWN
......
12. OVERLAID

Иероглифы типа OVERLAID, а также иероглифы с трудно определимым ключом  в такой записи представляются просто кодом  CangJie.

Ключевая часть - не более 2 знаков  CangJie.
Композиция - символ также является разделителем, цифр не хватит, 1-9,0 + еще один.
Неключевая часть - не более 2 знаков  CangJie.
Вот пример из самого "заселенного" ключа "вода"
浇= E1JU
涴= E1JU
浣=E1JU
滵= E1JU
В общем, получилась старая ЦангЦзе на новый лад, с элементами ввода по ключам и самое главное - с информацией по композиции знака! Даже название можно легко ей придумать 部首倉頡!
А самое главное достоинство этого метода для программиста  - не нужно делать интерфейс- таблицу с 214 элементами управления. 
Я уже забил 4E00-9FA5 информацией о типе  композиции. Сейчас забиваю 3400-4DFF
Это в Экселе вбивается довольно быстро по 1000 за 2-3 часа. CangJie - легко выдрана из Унихани. Осталось только с помощью CangJie рассортировать [Ключевая часть],[Неключевая часть] и выделить знаки с труднопределяемым ключом. В общем, не знаю это перспективно? Ведь пользовтелей со знанием метода ввода CangJie - катастрофически мало. А ведь с этой системы ввода начался китайский компьютинг вообще!





Оффлайн TBopeLl,

  • Бывалый
  • ***
  • Сообщений: 101
  • Карма: 6
Ещё в Pablo
« Ответ #43 : 12 Февраля 2012 04:45:29 »
Ещё в Pablo показавыется из чего состоит каждый введённый иерог.
Прога бесплатна(т.е. плата добровольная), скачать можно на сайте производителя.

Оффлайн WERTA

  • Зарегистрированный
  • *
  • Сообщений: 20
  • Карма: 0
  • Пол: Мужской
Я долго экспериментировал, и пришел к выводу, что поиск и ввод редкого и незнакомого через таблицу радикалов можно заменить текстовым вводом в одну строку – новый вариант текстовых методов ввода. Что для этого надо. Прежде всего, информация о декомпозиции знака (если это не сложный знак).
[RADICAL]+[NON_RADICAL]
На основании такого разделения можно реализовать очень гибкий и богатый на варианты редактор ввода IME базирующийся на классической 214-ключевой классификации иероглифов.
Какие переключаемые варианты для составных знаков можно реализовать.
1)   [RAD_NUMBER].[TOTAL_STROKES] 
2)   [RAD_NUMBER].[ADD_STROKES]
3)   [RAD_NUMBER].[CJ]
4)   [RAD_NUMBER].[PINYIN]
5)   [RAD_MNEM].[TOTAL_STROKES]
6)   [RAD_ MNEM].[ADD_STROKES]
7)   [RAD_ MNEM].[CJ]
8)   [RAD_ MNEM][COMP_DIVIDER][CJ]
9)   [RAD_ MNEM].[PINYIN]
10)   [RAD_ СJ].[TOTAL_STROKES]
11)   [RAD_ СJ].[ADD_STROKES]
12)   [RAD_ СJ].[CJ]
13)   [RAD_ СJ][COMP_DIVIDER][CJ]
14)   [RAD_ СJ].[PINYIN]
===================
Пояснения
———————————————-
Ключевая часть
[RAD_NUMBER] – номер ключа 1-214 (1 Байт)
[RAD_MNEM] – англ. мнемоника ключа  (11 Байт) (hand, water, tree…)
[RAD_ СJ] – два знака CangJie (Начало-Конец)  (2 Байта)
———————————————-
Дополнительная часть
[TOTAL_STROKES] – всего черт в знаке (1 Байт)
[ADD_STROKES] – всего черт в неключевом знаке (1 Байт)
[CJ] – два знака CangJie в неключевом знаке (Начало-Конец) (2 Байта)
[COMP_DIVIDER] – разделитель, несет информацию о типе композиции знака (1 Байт)
[PINYIN] – стандартная запись иероглифа пининью (наиболее часто употребимый вариант) без тона, идентификатор займет 2 байта
===================
Для сложных неразбиваемых знаков будут работать только две дополнительные части
[TOTAL_STROKES]  или [PINYIN]
===============================================
Пример текстового кода вариантов записи составного иероглифа
鬓=髟+宾
1)   190.20 
2)   190.10
3)   190.JC
4)   190.BIN
5)   HAIR.20
6)   HAIR.10
7)   HAIR.JC
8)   HAIR2JC
9)   HAIR.BIN
10)   SH.20
11)   SH.10
12)   SH.JC
13)   SH2JC
14)   SH.BIN
===============================================
Пример текстового кода вариантов записи разбиваемого иероглифа с трудноопределимым ключом (тут уже начинаются спорные моменты)
奲=奢(大)+單
1)   37.24 
2)   37.21 хотя можно и (37.12)
3)   37.RJ
4)   37.DUO
5)   BIG.24
6)   BIG.21 (BIG.12)
7)   BIG.RJ
8)   BIG1RJ
9)   BIG.DUO
10)   K.24
11)   K.21
12)   K.RJ
13)   K1RJ (правильнее KA1RJ, но оно не совместимо с концепцией таблиц данных)
14)   K.DUO
===============================================
Пример текстового кода вариантов записи неразбиваемого иероглифа с трудноопределимым ключом (тут тоже есть спорные моменты)
戼(戶)
1)   63.3
2)    —-
3)    —-
4)   63.MAO
5)   DOOR.3
6)   —-
7)   —-
8)   —-
9)   DOOR.MAO
10)   HS.3
11)   —-
12)   NSMLS – в данном случае уместна полная запись CJ, но это другой метод и несовместимо с концепцией таблиц данных
13)   NSMLS – в данном случае уместна полная запись CJ, но это другой метод и несовместимо с концепцией таблиц данных
14)   HS.MAO

==============================================
Данный метод, прежде всего, предназначен для ввода незнакомого по произношению или редкого знака.

Кто-то скажет, ну зачем изобретать велосипед сейчас в любом IME открывай таблица радикалов и ищи, вот именно – ищи! Но если сделать доступными быстрое переключение на один из приведенных выше 14 вариантов ввода, то становится возможным очень удобно для себя вводить знаки без нудного поиска по длинному списку, к примеру  иероглифов из 15 черт в ключе «вода». Я очень точно знаю номера некоторых распространенных ключей 85 (вода), 86 (огонь), 75 (дерево), 9 (человек), далее я могу легко написать мнемоники некоторых ключей HAIR, HAND, HEART, HIGH, DRAGON, TWO, также для многих ключевых знаков я помню запись  CJ, а черты – ну это нужно уметь считать их, я по крайней мере умею. Вот так чередуя эти варианты можно быстро найти именно незнакомый нам иероглиф. Потому что для известных (по произношению)  иероглифов  фонетические методы ввода не представляют проблемы. Морфологические методы -  CJ например, как бы я хорошо не помнил концепцию CJ (а я давний фанат CJ), все-таки ввод незнакомого сложного знака на CJ представлял собой долгий путь проб и ошибок.

ДОП, ИНФОРМАЦИЯ О РЕАЛИЗАЦИИ МЕТОДА
========================================
1.   Таблицы данных
—————————————-
Таблица иероглифов
1-[UNICODE] (2 байта) – Юникод номер
2-[RAD_ID] (1 байт) – номер радикала
3-[TOTAL_STR] (1 байт) – число черт знака
4-[ADD_STR] (1 байт) – число черт неключевой части знака
5-[CJ] (2 байтa) – 2 знака  CJ для неключевой части
6-[COMP_TYPE] (1 байт) – код композиции иероглифа
7-[PINYIN_ID] (2 байта) – идентификатор около 400 бестоновых фонем
***
Итого 10 Байт (без [UNICODE] будет 8)
—————————————-
Таблица радикалов
1-[UNICODE] (2 байта) – Юникод номер, нужен для отображения радикала
2-[RAD_ID] (1 байт) – порядковый номер радикала
3-[RAD_CJ] (2 байта) – кодировка радикала двумя знаками CJ
4-[RAD_MNEM] (11 байт) – английская мнемоника радикала
Итого 16 Байт
—————————————-
Таблица фонем
1-[PINYIN_ID] (2 байта) –идентификационный номер фонемы
2-[PINYIN] (6 байт) – 6 символов бестоновой PINYIN
Итого 8 Байт
—————————————-
2.   Принцип кодирования CJ c учетом ключа и композиции знака (можем назвать его метод – 部首仓颉)
[RADICAL_CJ][COMP_DIVIDER][CJ] длина всей строки не более 5 символов (аналогично классической CJ)
Но.
Типы композиции по стандарту UNICODE и их кодирование одним символом
[COMPLEX]–нет кодирования, полная запись CJ
[LEFT_RIGHT] –1
[UP_DOWN] –2
[LEFT_CENTER_RIGHT] –3
[UP_CENTER_DOWN]–4
[SURR]–0
[SURR_UP]–5
[SURR_DOWN]–6
[SURR_LEFT]–7
[SURR_LEFT_UP]–[
[SURR_RIGHT_UP]–]
[SURR_LEFT_DOWN]–8
[OVERLAID] –нет кодирования, полная запись CJ
Примеры
戵=I1BG (обратите внимание, ключ всегда будет стоять в начале, это отличие от CJ)
扃=HS[BR
挛=Q2YC
冈=B5K
國=R0IM

Добавлены расширения и исключения
1) Если знак состоит из нагромождения 2,3,4 подобных знаков, то 
[COMP_DIVIDER]=* и  запись станет такой
[CJ]*[REPEATS]
龍=YP
龖=YP*2
龘=YP*3

2) Если знак неразбиваемый [COMPLEX] или образован наложением [OVERLAID], то запись эквивалентна полной CJ.

Надеюсь, что кого-то заинтересую своими идеями. И надеюсь реализовать задуманное. Выполнена уже значимая часть работы
1)   Взята из источников(UNIHAN, MS CHIN TRAD CJ IME), дополнительно введена и проверена вся CJ в формате старой версии 3.0 для 27 тысяч знаков (CJK_unifed+ CJK_unifed_COMPAT+ExtA)
2)   Введен тип композиции для каждого из 27 тысяч знаков
Что нужно еще сделать
1)   Отделение из CJ кода каждого знака не ключевой части (27 тысяч знаков)

Я это все планирую вставить в свои CJKV VBA IMEs для MS Word, которые я совершенствую на досуге с 2000 г.

Оффлайн Макар Н.

  • Новичок
  • *
  • Сообщений: 39
  • Карма: 5
  • Пол: Мужской
Re: Ввод иероглифов по ключам (Radical lookup)
« Ответ #45 : 29 Апреля 2012 09:44:32 »
Господа,

есть повод снова напомнить народу об "экзотическом" способе ввода иероглифов по "ключам".

У "Китайского Правильного Писания" появилось потомство, "молодое, но ранее"  ;D.  Умеет вводить 2-мя кликами мыши подавляющее большинство упрощенных иероглифов современного китайского языка  (4967 из 6683-х или 74,4%). Если учесть частоту использования этого "квалифицированного большинства" иероглифов, то это составит 89,6% "живаго великокитайского".

Вся "арифметика" в кратком введении в "структурную иероглифику": http://poutko.ru/China/Hieroglyphics.html
Описание самой программы и ссылка на скачивание здесь: http://poutko.ru/China/LazyTools.html, но рекомендую сначала прочесть таки "краткое введение".

Оффлайн WERTA

  • Зарегистрированный
  • *
  • Сообщений: 20
  • Карма: 0
  • Пол: Мужской
Re: Ввод иероглифов по ключам (Radical lookup)
« Ответ #46 : 29 Апреля 2012 17:38:31 »
Уважаемый Макар.Н, давно слежу за Вашими наработками по системам ключевого ввода. Я сам давно транслировал различные существующие CJKV системы ввода под макросы MS Word.
наработки - http://ifolder.ru/30206220

Но недавно стал задумывать тоже свою собственную систему ключевого ввода, поэтому могу поделиться советами.
1. Ключевой ввод, ориентированный на множестве ключевых элементов
1) Имеется таблица радикалов.
2) Иероглифический знак задается просто множеством элементов
ПРИМЕР
器=口,犬
2. Ключевой ввод, ориентированный на правильную последовательность ключевых элементов
1) Имеется таблица радикалов.
2) Иероглифический знак задается строкой элементов в порядке начертания
ПРИМЕР
器=口,口,犬,口,口
3. Ключевой ввод, ориентированный композицию ключевых элементов в иероглифе
1) Имеется таблица радикалов.
2) Иероглифический знак задается строкой элементов в порядке начертания с учетом жестко оговоренного правила декомпозиции
ПРИМЕР
澗=水⿰間=水⿰(門⿵日)
В Wenlin и Юникоде CDL (Charactre Description Language) типы декомпозиции очень сильно различаются. Хотя Юникод конечно же имеет более обоснованную и продвинутую систему знаков декомпозиции и не хватает в них только типов удвоения, утроения, учетверения одного не обязательно ключевого знака - это совершенно логически самостоятельные типы декомпозиции.

Вообще возникает еще ряд сложностей.
1) Детализация ключевого знака
Если начать графически точно детализировать, то можно зарыться в такие таблицы ключевых знаков, который будут насчитывать и 500 и 1000 знаков. Поэтому нужны жесткие градации, которые будут определять что такое ключевой знак и его варианты, и какие из его вариантов будут самостоятельными. Это проблема, в Унихани ее частично решили путем ввода различных вариантов знака.
ПРИМЕР
Сначала так
澗=水⿰間=水⿰(門⿵日)
а почему не так?
澗=氵⿰間=氵⿰(門⿵日)
Т.е. встает еще одна проблема  - как подробно при декомпозиции описывать варианты, которые принимает базовый ключевой знак.

2) Вымершие ключевые знаки
Если вы просматривали 20902 знака из основного CJK-набора Юникода, то замечали что некоторые иероглифы можно объединить в очень ярко-выраженные ключи.
Вот таблица некоторых вымерших ключей.


Кстати в Wenlin4 имеется своя таблица ключей для иероглифов старого написания - СяоЧжуань, так там очень много вымерших ключей (явно намного больше 214). 
А это другая таблица ключей (не помню где ее скачал)


Что касается вашей системы ввода на палладице, то вынужден признать ее пригодность, поскольку палладица вполне однозначна для систем фонетического ввода иероглифов (полная кириллическая альтернатива путнхуа пиньинь), хотя и не совсем адекватна по фонетике. Но именно для "начинающих" она необходима, через нее легче выучить пиньинь русскоязычному лицу. Да я сам много лет назад начинал изучение фонетики Путунхуа именно через палладицу. Поэтому так держать!

И еще совет. Месяц назад натыкался в сети про печатную машинку Ли ЮйТана, через нее вышел прямо на Гугле на целую "залежь" патентов по различным системам ввода иероглифов за период 40-х-80-х годов. Это именно большей частью некомпьютерные системы ввода, там много полезнного можно найти. Именнно из тех систем частично вышли современные морфологические системы иероглифического ввода: CangJie, Boshiamy, Array30 и др.

Рекомендую еще почитать про CangJie - это очень оптимальная система ввода, может у Вас  появятся свои мысли по этому поводу - как скрестить ЦанЦзе и ключи.

Вообще, ключевых таблиц и принципов декомпозиции для китайских иероглифов можно создавать тысячами. Я же предпочитаю все стандартное
1) Декомпозиция - по правилам Юникода.
2) Таблица ключей - классическая КанСи 214 знаков, хотя простейший пример декомпозиции 學=?⿱子 в такой таблице уже невозможен (традиционный знак - xue2). Знак, подразумеваемый  вопросиком конечно же существует,  но  только в четырех байтовом расширении Юникода, поддержку которого не везде еще можно встретить.

« Последнее редактирование: 29 Апреля 2012 18:15:20 от WERTA »

Оффлайн Макар Н.

  • Новичок
  • *
  • Сообщений: 39
  • Карма: 5
  • Пол: Мужской
Re: Ввод иероглифов по ключам (Radical lookup)
« Ответ #47 : 29 Апреля 2012 19:18:58 »
Уважаемый WERTA,

Спасибо за обстоятельные советы и комментарии.  Во всей этой "войне" мне мало интересны существующие "стандарты", ибо это чаще всего чей-то "произвол", пусть и "общепринятый" (кем-то принятый, не мной). Зато непоколебимы  3 принципа:

1. свобода (можете читать "произвол"),
2. простота (что вижу, то и правда),
3. эффективность ("экономность") ввода.

По первому вопросу имею сказать, что мой произвол (не спрятанный за "стандарты") остается и объявляется произволом. Поэтому любой человек может этот произвол принять или поменять на свой собственный (инструменты прилагаются).

По второму вопросу: что бы ни глаголили стандарты, "нож сбоку" и "нож сверху" графически совершенно разные элементы,  и вижу я их по-разному.

А по третьему вопросу экономность сама говорит за себя - 2 клика на 90 % иероглифов  ;).

Вам спасибо за интерес к теме.

Оффлайн aromaiink

  • Бывалый
  • ***
  • Сообщений: 131
  • Карма: 16
  • Пол: Мужской
  • Skype: -
В полупустых комнатах вы можете мыслить более свободно. - Джон Поусон)
http://asimetriadotorg3.files.wordpress.com/2013/02/johnpawsonhouseinside_0.jpg

Оффлайн Макар Н.

  • Новичок
  • *
  • Сообщений: 39
  • Карма: 5
  • Пол: Мужской
Re: Ввод иероглифов по ключам (Radical lookup)
« Ответ #49 : 29 Апреля 2012 20:30:05 »
Спасибо aromaiink за ссылки.

NJStar классная вещь и, слава богу, создатели выставляют его в свободном доступе. Держать результаты собственных интеллектуальных усилий "под спудом денежного мешка" - вещь контрпродуктивная. Но я не о том.  Я о "закрытом произволе". Откуда в списке иероглифов под ключем 木 оказался 东? Или еще лучше - 伙! У создателей были какие-то резоны на это, ясно. Но они не "ложатся мне в душу", а сделать с этим я ничего не могу... Запомнить и пользоваться?.. Конечно, свободный доступ предполагает свободу - не хочешь не качай  :). Посему, лучше я сделаю для себя сам, как моей душе угодно. Может еще кому понравится  ;) ...