Восточное Полушарие

Китайский форум => Китайский язык: письменность, изучение, диалекты, вэньянь => Китайский Язык: компьютеры, программы, шрифты => Тема начата: Papa HuHu от 29 Апреля 2010 11:37:33

Название: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Papa HuHu от 29 Апреля 2010 11:37:33
Добрый день! Меня попросили начать эту тему, потому что человек, который в ней заинтересован, новый на форуме и еще не может создавать новые темы.

Господа, помогите найти "таблицы распределения" ключей по иероглифам. Что-либо подобное:
泅 -氵, 囗, 人;
泪 - 氵, 目.
В любом виде: текстовом, графическом, "бумажном", наконец...
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Papa HuHu от 29 Апреля 2010 11:41:06
Сам же первым и отвечу.
Я знаю, что такое есть в словаре от Pleco. http://www.pleco.com/
Это самый лучший словарь с подобной функцией, который я видел.
А вот как оттуда эту информацию выдрать, я не знаю.

Алик
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: anima*** от 29 Апреля 2010 11:50:54
В WenLin в конце каждой статьи есть Contents, выделяешь, затеняя мышкой, и копируешь в буфер Ctrl+C.
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Макар Н. от 29 Апреля 2010 13:36:42
Спасибо.

Но тема не закрыта.
Pleco, если я правильно их понял, работает на мобильных устройствах, коих, увы, я не имею. Может быть есть версия для PC?
WenLin - что за штука? Стоит он свои 200 баксов? Да и неудобство, опять же, если я правильно понял, сайт www.wenlin.com предлагает купить CD, который они перешлют по почте :(... - как то уже непривычно, хочется Download'а :).
У разбалованных "достижениями ИТ" аппетит приходит во время еды - может быть кто-нибудь знает, где взять информацию пригодную для машинной обработки? Лень, знаете ли, в рукопашную...
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Fu Manchu от 29 Апреля 2010 13:44:12
Спасибо.

Но тема не закрыта.
Pleco, если я правильно их понял, работает на мобильных устройствах, коих, увы, я не имею. Может быть есть версия для PC?
WenLin - что за штука? Стоит он свои 200 баксов? Да и неудобство, опять же, если я правильно понял, сайт www.wenlin.com предлагает купить CD, который они перешлют по почте :(... - как то уже непривычно, хочется Download'а :).
У разбалованных "достижениями ИТ" аппетит приходит во время еды - может быть кто-нибудь знает, где взять информацию пригодную для машинной обработки? Лень, знаете ли, в рукопашную...
Wenlin есть на rutracker.org  и на uz-translations.su ;)
совершеннобесплатно 8-)
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: China Red Devil от 29 Апреля 2010 14:13:19
есть программа

NJStar Chinese WP

которая бесплатно скачивается с сайта разработчика http://www.njstar.com/cms/njstar-chinese-word-processor

может вам подойдет
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: anima*** от 29 Апреля 2010 14:18:36
Я скачивал старую версию WenLin по чьей-то ссылке на форуме года 2 тому, очень ей доволен. Потом скачал портабельную версию без звука (звук поленился скачать), работает так же хорошо и весит 60 Мега вместо 700. Лично я считаю WenLin лучшим словарем для того, кто копается в странных иероглифах. Наверно самый большой запас, порядка 100 000. Надежный ввод любых иероглифов пером. Поиск по части иероглифа или по сочетанию нескольких компонентов. Поиск по пиньиню. Единственный словарь (насколько я знаю), позволяющий поиск  рисованием пером для иероглифов в расширенных диапазонах SimSun. И т.д. и т.п.
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Fozzie от 29 Апреля 2010 17:25:11
Наверно самый большой запас, порядка 100 000.
Wenlin за пределы Unicode никогда не выходил - значит всяко не больше 70000.
И, вдобавок, весьма приличное количество иероглифов в Wenlin (в основном из Ext B) не имеет разложения на компоненты. Нельзя сказать, что работы в этом направлении прекратились, только вот новых версий Wenlin не видно уже довольно давно... :(
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: anima*** от 29 Апреля 2010 19:57:10
Нашел где предлагался WenLin уважаемым Criptozavrом:
Китайский Язык: компьютеры, программы, шрифты, страница 3 (WenLin 3 с апдейтом). Как скопировать ссылку, не знаю, но найти, я думаю, можно. Она есть. Конец 2008 г.
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Макар Н. от 29 Апреля 2010 20:57:08
Господа, спасибо за "наводку" на WenLin. Забавная вещица, и делу поможет, если схватиться в рукопашную, но:

1. Прав Fozzie - не для всех иероглифов есть "компоненты".
2. Копирование компонентов происходит прямо скажем, причудливо (как сказал anima***
Цитировать
выделяешь, затеняя мышкой, и копируешь в буфер Ctrl+C.
  - в результате невозможно заранее угадать, сколько "компонентов" будет скопировано и какие из показанных компонентов по непонятным причинам изменятся при на вставке :().
3. Понятие "компонентов" в WenLin'е несколько отличается от того, что я имел ввиду в вопросе темы - в компоненты в WenLin'е включены и иероглифы. Как можно представить себе систему ВВОДА иероглифов на основе других иероглифов? Мнемотехника на такой основе - вполне законная и понятная вещь. Но не более.

Вообще, господа профессионалы, надежда есть ли найти некий "стандарт" раскладки иероглифов на ключи? Как вопрошал Михал Михалыч: "Он таки есть или его нет?".  Или, как всегда - хочешь сделать хорошо, сделай сам?

Бог с ним, со "стандартом". Я согласен даже на "произвол", что надо - "поправим", лишь бы его можно было втащить в машину...
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: anima*** от 29 Апреля 2010 21:39:53
Да, поначалу раздражает способ копирования и ввода Ctrl+C и Ctrl+V, но потом привыкаешь. Зато очень удобный способ последовательного открытия окон с помощью Ctrl: при нажатии Ctrl появляется палец, если навести его на любое слово или иероглиф и щелкнуть, то появится его перевод. Например, навести так на вэнь в заставе и щелкнуть. Поэтому легко разбить любой появившийся сложный компонент хоть на атомы.
Причиной того, что компоненты исчезают может быть отсутствие у Вас нужного шрифта. Например, установлен ли расширенный SimSun? Также совершенно меняется иероглиф, если такого значка нет в Юникоде, при этом в описании указывается, что значок специально разработан для Вэньлиня. Но разбить его дальше можно, в итоге получив простые части.
Люди, делавшие Вэньлинь, явно торопились, кое-что упустили. Всегда можно найти части из соседнего похожего иероглифа, а в крайнем случае нарисовать нужные компоненты, в программе это делается просто. Зато Вэньлинь почти всегда может помочь найти нужный иероглиф, мне только изредка требовалось лезть в бумажный список всех иероглифов и искать глазами.
Вещь!
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: mordapauka от 29 Апреля 2010 23:26:49
Как можно представить себе систему ВВОДА иероглифов на основе других иероглифов?
Рекурсивно, например, как в Cangjie. Если нужно ввести 唱 и мы уже знаем, что  口=R и 昌=AA, то RAA даст 唱.
Кстати, чем ваша система ввода отличается от Cangjie/Wubi?
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: mordapauka от 29 Апреля 2010 23:29:39
иероглифов в расширенных диапазонах SimSun
SimSun - это шрифт.
Вы, наверное, имели в виду юникодовские Ext-A, Ext-B и т.д.?
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: anima*** от 29 Апреля 2010 23:59:55
У меня установлен шрифт SimSun Founder Extended, включающий в себя A и B.
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: China Red Devil от 30 Апреля 2010 12:27:34
Вообще, господа профессионалы, надежда есть ли найти некий "стандарт" раскладки иероглифов на ключи? Как вопрошал Михал Михалыч: "Он таки есть или его нет?".  Или, как всегда - хочешь сделать хорошо, сделай сам?

Бог с ним, со "стандартом". Я согласен даже на "произвол", что надо - "поправим", лишь бы его можно было втащить в машину...
не совсем понятно, что вы имеете в виду под стандартом.
но в любом случае о стандарте можно говорить только приближенно.
В разных словарях вы столкнетесь с разным количеством ключей, и с тем, что некоторые иероглифы ищутся по разным ключам.

Произвол какой- нибудь возможно и найдете. :D
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Fozzie от 30 Апреля 2010 12:44:54
Уууу!... Как всё запущено! (С)

Wenlin вообще не нуждается ни в каких китайских шрифтах - все иероглифы он или отрисовывает собственным CDL-движком, или выводит встроенным битмап-фонтом (совершенно жуткого, надо сказать, вида).

Если есть всенепременнейшее желание искать иероглифы именно как наборы ключевых знаков, то можно воспользоваться, например, таким способом:

1. Меню "List" -> B. Radicals by number 1-214. Развернуть на весь экран.
2. Меню "List" -> 4. Characters containing components.
3. Ползаем по списку ключевых знаков (курсор при этом становится чёрным кружком), левым кликом выбирая интересующие, и (обязательно!) убирая появляющийся в строчке вместе с ключевым знаком технический мусор. Выбрав, таким образом, все необходимые ключевые знаки, жмём "OK".

Правда результаты, при количестве ключей более одного, совсем не ах...

Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: China Red Devil от 30 Апреля 2010 12:57:12
3. Ползаем по списку ключевых знаков (курсор при этом становится чёрным кружком), левым кликом выбирая интересующие, и (обязательно!) убирая появляющийся в строчке вместе с ключевым знаком технический мусор. Выбрав, таким образом, все необходимые ключевые знаки, жмём "OK".

Правда результаты, при количестве ключей более одного, совсем не ах...
...и это чудо природы кто-  то считает "лучшим словарем для поиска иероглифов"?  ;D
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Fozzie от 30 Апреля 2010 13:47:49
...и это чудо природы кто-  то считает "лучшим словарем для поиска иероглифов"?  ;D
В деле поиска иероглифов с большим количеством черт и/или повреждённых ему нет не то что равных - а и даже близко ничего не лежало...  Просто приведённый мной способ, несколько искусственный, "под заказчика", реально же используются более простые и эффективные ("последовательного укрупнения компонентов" и т.п.).


Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Макар Н. от 30 Апреля 2010 13:57:57
...чем ваша система ввода отличается от Cangjie/Wubi?

"Cangjie decomposition is not based on traditional Kangxi radicals, nor is it based on standard stroke order; it is in fact a simple geometric decomposition". (http://en.wikipedia.org/wiki/Cangjie_method). Я же говорил о вводе иероглифов по ключам.

Полагаю, что китайский язык слабо восприимчив к "наскокам" варягов, подобных мне. Посему, желательно использовать способы более близкие к традиции. Существует список ключей, он ограничен (хотя и "плавает" в разных источниках). Но он есть и его можно использовать "не насилуя" традицию.

В двух словах: задача заключается в том, чтобы, имея список ключей, за три-пять щелчков мыши ввести в текстовое поле (или прямо в буфер обмена) любой иероглиф из наперед заданного списка иероглифов (в количестве 3 - 5 тыс. штук). Задача с технической стороны, прямо скажем, проще пареной репы. И была до меня реализована уже не однажды. Например, в упоминаемом уважаемым China Red Devil'ом NJStar Chinese WP. Но. Мне хотелось иметь ОТКРЫТЫЙ список как ключей, так и иероглифов, хотелось иметь возможность править под себя и то, и другое. Таким образом эта "писалка" имеет еще и некоторый дидактический смысл  ;).

Пока я соображал, отозвался China Red Devil:

Цитировать
не совсем понятно, что вы имеете в виду под стандартом.
но в любом случае о стандарте можно говорить только приближенно.

Потому то "стандарт" и закавычен.

Цитировать
В разных словарях вы столкнетесь с разным количеством ключей, и с тем, что некоторые иероглифы ищутся по разным ключам.

Вот это было бы вообще классно, если бы в словаре иероглиф можно было найти по всем его ключам. Почему 泪 я нахожу по ключу氵, а по ключу 目-  нет?. (Вопрос риторический отвечать не надо  ;D) Потому, что 氵, в данном случае, действительно "ключ", а 目 - просто "дополнительный элемент, состоящий из 5-ти черт". (Поэтому, строго говоря, систему ввода по ключам следовало бы называть "ввод по элементам" или, что мне больше нравится, "ввод по графам", а сам список "ключей" в данном случае, следовало бы называть списком "графов".) Полагаю, что причина этого кроется в "технической бедности" бумажных словарей. Невозможно представить себе на бумаге этакие "многомерные кросс-таблицы", по которым иероглиф нужно было бы искать по пересечению трех, скажем, или четырех компонентов. Поэтому умные люди и придумали поиск по ключам. Но заставить делать это (искать иероглиф по любому графу) машину - пара пустяков!

Цитировать
Произвол какой- нибудь возможно и найдете. :D

"Произвол" ведь тоже будет разумным., а значит его можно будет "мягко" подправить. Ведь никто не станет (из разумных соображений) отвергать, что 泅 состоит из 氵, 囗 и 人.  И что эти три графа однозначно идентифицируют иероглиф 泅 во всем массиве таковых.

Ребята, я не Катон, но «Карфаген должен быть разрушен» :).
А посему настойчиво повторяю: Кто знает, где можно найти таблицу распределения ключей по иероглифам или готов таковую набросать - отзовитесь!
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: anima*** от 30 Апреля 2010 14:06:38
Насчет того, какой лучше, а какой хуже.
В общем-то это вопрос веры, каждый имеет право верить во что угодно. Я подхожу к этому делу с точки зрения удобства лично для меня, и чтобы у меня все було (искать в сети не всегда возможно). А из того что у меня есть ВэньЛинь единственный словарь, который не подведет. NJStar, всякие словари не для Лингвы, другие программки (удобные для других целей) просто не замечают иероглифы из расширенных диапазонов и поэтому в любой момент выдадут отказ. ВэньЛинь безотказный.
Попробуйте вот найти иероглиф с картинки моего профиля. Получится только в Вэньлине.
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: China Red Devil от 30 Апреля 2010 14:32:28
В двух словах: задача заключается в том, чтобы, имея список ключей, за три-пять щелчков мыши ввести в текстовое поле (или прямо в буфер обмена) любой иероглиф из наперед заданного списка иероглифов (в количестве 3 - 5 тыс. штук). Задача с технической стороны, прямо скажем, проще пареной репы.
 Мне хотелось иметь ОТКРЫТЫЙ список как ключей, так и иероглифов, хотелось иметь возможность править под себя и то, и другое. Таким образом эта "писалка" имеет еще и некоторый дидактический смысл  ;).
Понятно, задача стала яснее.

Пока могу сказать, что видел в текстовом формате только открытый список иероглифов по одному ключу, типа:

氵:    汉 汗 涵
口:   回 阿 哦 叶

и тд и тп.

его где- то на форуме выкладывал Laotou

зы. насчет того, какой словарь лучше, пожалуй да, спорить смысла нет  :).
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Fozzie от 30 Апреля 2010 14:34:31
Ребята, я не Катон, но «Карфаген должен быть разрушен» :).
А посему настойчиво повторяю: Кто знает, где можно найти таблицу распределения ключей по иероглифам...
Насколько мне известно, нечто подобное есть только здесь: http://www.wenlin.com/cdl/
Но вот насчёт доступности - не уверен. Некоторое время назад они собирались сделать CDL частью стандарта Unicode. На настоящее время к CDL-базе иероглифов есть on-line доступ через http://www.wenlin.com/cgi-bin/wenlinSVGhelp.pl
Я попытался получить туда логин - с меня зачем-то запросили CV...  ???
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Fozzie от 30 Апреля 2010 14:56:23
Пока могу сказать, что видел в текстовом формате только открытый список иероглифов по одному ключу, типа:

氵:    汉 汗 涵
口:   回 阿 哦 叶

и тд и тп.

его где- то на форуме выкладывал Laotou
А в Wenlin такой список получается в три клика на ключ ("Radicals by number 1-214". Кликаешь на любой - получаешь список иероглифов для этого ключа. Ctrl-A, Ctrl-C - и, куда угодно (Word, Блокнот и т.п.) - Ctrl-V   :P
Понятно, что для посредственного надмозга со словарным запасом в несколько сотен иерогов этот список - просто манна небесная. Но для серьёзной научной работы он не слишком удобен.   
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: China Red Devil от 30 Апреля 2010 15:57:20
А в Wenlin такой список получается в три клика на ключ ("Radicals by number 1-214". Кликаешь на любой - получаешь список иероглифов для этого ключа. Ctrl-A, Ctrl-C - и, куда угодно (Word, Блокнот и т.п.) - Ctrl-V   :P
"Правда результаты, при количестве ключей более одного, совсем не ах..."(с)- вот с этого места можно поподробнее? ;D
Цитировать
Понятно, что для посредственного надмозга со словарным запасом в несколько сотен иерогов этот список - просто манна небесная. Но для серьёзной научной работы он не слишком удобен.
Изучением вопросов жизнедеятельности посредственных надмозгов не занимался, не знаю. ;D
А для серьезной научной работы удобней всего китаец + Ханьюй Да Цзыдянь. :P :P
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: anima*** от 30 Апреля 2010 16:36:06
Ну и Fozzie, щиро дякую!
Я такого не знал. Там при кликании ключа внизу еще есть список из ExtB. Що iще треба?!
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Макар Н. от 01 Мая 2010 10:41:21
Господа.

Спасибо всем участникам обсуждения. Особенное спасибо уважаемому модератору Papa Huhu, который его инициировал. Особенно приятно, что параллельно мы узнали и о "лучшем словаре для поиска иероглифов" :)...

В общем, деваться некуда - пошел в рукопашную.

Если кому любопытна эдакая "писалка" (ударение каждый может поставить сам) иероглифов по графам, пишите в/на личку. "Натолкаю" туда первую тысячу, буду думать о способах передачи этого "богачества" народу, если кому понадобится :-[

Удачи вам.
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: mordapauka от 01 Мая 2010 19:34:34
В двух словах: задача заключается в том, чтобы, имея список ключей, за три-пять щелчков мыши ввести в текст
Просто мне любопытно, каков может быть "use case" для такого способа? Как я это вижу (вполне возможно, просто не понимая вашей задумки - поэтому и прошу меня просветить): три-пять мышиных кликов, но не простых кликов, а каждый клик - выбор из нескольких сотен графем. Это легко может занять минуту-две. То есть для обычного ввода текста это непригодно. Более того, за это время легко можно успеть нарисовать иероглиф в любой программе для распознавания. А для чего тогда можно пользоваться такой системой, для поиска по компонентам, как в Wenlin? Так в Wenlin, хоть и есть баги, но зато у них отработанный набор компонент, причем рекурсивный, и база в 60000+ иероглифов. И база здесь играет самую большую роль - искать по компонентам нужно будет именно редкие иероглифы. Что-то я упускаю, но не знаю, что.
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Макар Н. от 02 Мая 2010 12:09:14
Уважаемый mordapauka!

Просто мне любопытно, каков может быть "use case" для такого способа?
И мне любопытно...
Это первое и главное :).

Второе.
Цитировать
три-пять мышиных кликов, но не простых кликов, а каждый клик - выбор из нескольких сотен графем. Это легко может занять минуту-две.
Может и больше. Иногда я их не вижу "в упор" :(... Но у Вас это займет времени много меньше. Если Вы столь ловко пишите иероглифы (при этом, согласитесь, стилусом быстрее, чем мышью), полагаю, ключи то Вы уж знаете.  У меня в списке 260 графов (214 ключей по номерам + их варианты), в NJStar 236 графов (некоторые "варианты" ключей спрятаны под кнопкой "основного"). "Ткнуть" в 2 кнопки из известного Вам списка (阝и 鬲), согласитесь, проще, чем нарисовать даже один из них (я уж не говорю об искомом иероглифе  隔).

Третье.
Искать редкие иероглифы? Скорее, не "искать", а "рисовать" (мы ведь говорим о системе ввода иероглифов). Тогда согласен, но по какому принципу мне отличить "редкий" иероглиф от "нередкого"? "Редкий" это который не вошел в первую тысячу, или в первые десять тысяч по частоте использования? Теперь и Вы согласитесь, что систему лучше делать сразу для ВСЕХ иероглифов, независимо от частоты их употребления (что и сделано в WenLin).

Цитировать
И база здесь играет самую большую роль
Но с чего-то нужно начинать!? Вот и вопрошаю я в форуме...

Я не намерен "конкурировать" с WenLin'ем. И мне не греет душу "рекурсивность" его компонентов. Задача другая, от обратного - с помощью минимального обозримого набора компонентов вывести на экран максимально большое количество иероглифов, в идеале все - весьма скромно, не правда ли?  :)  А вот попользоваться его (WenLin'я) возможностями для подготовки самой базы, похоже, придется.

Кстати, WenLin (так же как и Lingvo) ищет иероглифы по ключам "по старинке" (прямой перенос "бумажного" алгоритма: ключ + дополнительные черты). Это, по моему скромному разумению  :-[, как раз та часть традиции, которую смело можно "насиловать", а именно, вводить в словари поиск по комбинации ключей. В конце концов, системы управления базами данных и были придуманы умными людьми для того, чтобы легко можно было бы манипулировать данными (в том числе и комбинировать их), а не для того, чтобы водить пальцем по монитору и считать "черты"/"чертей"/"чертов"...

Тут есть еще одна "фишка". Вы же понимаете, что кроме простой комбинации ключей важно и их взаимное расположение в иероглифе:  呆 и 杏  - явно не одно и то же. Но это уже другая история. Пока мне дополнительный параметр "взаимного расположения" кажется избыточным. Оставим это для "следующей версии"  ;)...
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: mordapauka от 03 Мая 2010 03:34:42
У меня в списке 260 графов (214 ключей по номерам + их варианты), в NJStar 236 графов (некоторые "варианты" ключей спрятаны под кнопкой "основного"). "Ткнуть" в 2 кнопки из известного Вам списка (阝и 鬲), согласитесь, проще, чем нарисовать даже один из них (я уж не говорю об искомом иероглифе  隔).
Не знаю, дело ведь не только в физическом "ткнуть", их же еще надо найти. Где они будут сидеть - в выпадающем списке? Так его еще и листать черт знает сколько придется. Возьмем, к примеру виртуальную (на экране) клавиатуру для русского. Намного меньше "графем", можно показать их все вместе на экране (т.е. листать не надо) и т.д. - все преимущества, короче. Но от руки я лично все равно пишу намного быстрее, чем могу набрать на этой виртуальной клавиатуре. Возможно, конечно, вы мыше-виртуоз и у вас все наоборот :)

Цитировать
Я не намерен "конкурировать" с WenLin'ем. И мне не греет душу "рекурсивность" его компонентов. Задача другая, от обратного - с помощью минимального обозримого набора компонентов вывести на экран максимально большое количество иероглифов, в идеале все
Мне не совсем понятно, как это должно функционировать, поэтому спрошу на примере: если я ввожу 口 и 力, то я получу только 加 и 另,  или будет и 咖, или же будут и более сложные, как  别, 拐, 架 и т.д.?


Цитировать
смело можно "насиловать", а именно, вводить в словари поиск по комбинации ключей.
Это хорошая идея. Я все хотел привести вам пример такого словаря, но, к сожалению не могу вспомнить название, помню только, что видел его на rutracker'е. Качать я его не качал, поэтому и не могу вспомнить названия, но помню, что такая вещь там была.

Цитировать
Пока мне дополнительный параметр "взаимного расположения" кажется избыточным. Оставим это для "следующей версии"  ;)...
А мне эта идея тут пришла в голову и я как раз хотел вам написать, что это было бы интересной возможностью :)
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Макар Н. от 03 Мая 2010 10:43:55
Уважаемый mordapauka!

Чтобы не "мутить поганку", и не вносить дополнительную путаницу, отошлю Вас к реализации этой идеи в NJStar. Он описан в "корне" нашего форума Criptozavr'ом  (NJStar Chinese Word Processor v5.10 PRO PORTABLE « : 05 Январь 2010 06:52:50 ») с качественными картинками. Но, конечно же, если хотите понять "технологию", скачайте (думаю, Criptozavr не откажется Вам в этом помочь) и попробуйте, все станет понятно.

У NJStar'а (для меня) есть несколько недостатков:

1)  Он "закрыт" для модификаций пользователем. При сколь-нибудь длительном пользовании Вы обратите внимание на некоторые "нелогичности" в наборе "ключей", в расположении иероглифов по "ключам" (когда искомый иероглиф оказывается "не там" или его "не оказывается" там, где Вы ожидаете...) А сделать Вы ничего не в состоянии  :(...
2) Его писал не я  ;D...
3) Пользоваться приходится мышью :(.
К сожалению, этот "недостаток" неустраним. Сам я безбедно обходился без мыши вплоть до 98-го года, а теперь... руки постепенно деградируют  :(, опасаюсь, что и мозги тоже  :).

Цитировать
Я все хотел привести вам пример такого словаря, но, к сожалению не могу вспомнить название, помню только, что видел его на rutracker'е.
Конечно же поищу. Если Вы мне поможете, буду благодарен. С удовольствием посмотрю на реализацию.

Цитировать
А мне эта идея тут пришла в голову и я как раз хотел вам написать, что это было бы интересной возможностью :)
Согласен, но на известных мне 30-ти иероглифах это явно избыточно ;). Алгоритм этого "довеска" прост и не потребует сложных манипуляций. Если хочешь добиться успеха, делать все нужно последовательно и постепенно. "Культура не терпит революций"  ;)...
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Chunky от 05 Мая 2010 10:03:54
Немного офф-топ, просто для иллюстрации. Мне нравится словарь http://www.susi.ru/yarxi/
в котором как раз предусмотрен такой способ ввода. Правда, японский  :-(
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Макар Н. от 08 Февраля 2011 23:08:11
Господа, простите, если не в тему (модераторы поправят). Но начиналось все в этой ветке, посему и продолжим...

В двух словах: не прошло и года, ;D как идею ввода иероглифов по элементам удалось реализовать :-[...  в виде  программы "КПП" - Китайское Правильное Писание (для ленивых). Работает. O:)

В компаунде с входящими в комплект утилитками позволяет:

1) "расчленять" иероглифы на части в соответствии с наперед заданным набором "частей-компонентов";
2) самостоятельно формировать набор (список) этих "частей-компонентов";
3) легко запомнить свой набор компонентов ("традиционалисты" могут использовать ее как училку "ключей", например);
3) находить иероглифы по содержащимся в них компонентам в любой комбинации и сбрасывать (вводить) их в текстовое поле;
4) разбить весь массив используемых иероглифов на "уроки" и учить их либо все сразу, либо в нужном порядке;
5) выгружать данные в  csv-файлы и загружать их из csv-файлов, организуя таким образом "сообщение с внешним миром".

Получилась штучка, которую можно пользовать еще и в качестве "персонального словарика" для любимых слов и выражений (вместо многими любимого Ёкселя ;D) и вводить их в текстовое поле "одним мановением мыши" ;).

Описание см. http://poutko.ru/KPP.html (http://poutko.ru/KPP.html)
Саму программу можно взять непосредственно здесь  http://poutko.ru/Gliphs.zip (http://poutko.ru/Gliphs.zip)
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Criptozavr от 09 Февраля 2011 16:23:43
Макар Н.

Спасибо за полезные утилиты. Не возражаете, если я их выложу на магазета? Естественно, с указанием авторства и ссылкой на оффсайт?
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Макар Н. от 09 Февраля 2011 18:04:37
Честно?
Буду рад.
Не забудьте только, пожалуйста, про лицензию. По мне, она много дороже продукта  ;D ...
(Если не затруднит, ссылочку в "личку"  :-[)
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Criptozavr от 10 Февраля 2011 03:59:32
Макар Н.

Спасибо, что согласились :) Ссылку обязательно вышлю завтра или послезавтра. Кстати, приглашаю Вас заодно не только посмотреть на оформление, но и поучаствовать в обсуждении программы. Наверняка ведь будут отзывы :)

Кстати, обнаружился неприятный момент: у меня почему-то ни один из модулей не запускается :( Вроде бы JAVA установлена, а ничего не происходит - даже окно не появляется...
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Chunky от 10 Февраля 2011 04:46:25
Аналогичный случай в нашей деревне. Не запускается при установленной Java
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Макар Н. от 10 Февраля 2011 13:01:29
Господа, простите торопыжку :( :( :(

Задействованы ли нужные ассоциации файлов в системе (это происходит где-то при установке Явы)? Посмотрите под правой кнопкой мыши ("правый клик" на файлике, напр. G-2.jar), "Открыть с помощью...", в списке программ должна быть выбрана Java (TM) Platform SE Binary (или что-то похожее в зависимости от версии). Если нет, найти в списке, если в списке нет, то найти кнопкой "Обзор".  Поставить галочку "Использовать для всех файлов такого типа", чтобы больше не париться.

Проверить работоспособность проги без всей этой маеты можно из командной строки (Пуск/Программы/Стандартные/Командная строка). Для начала перейти в рабочий каталог командой "cd диск:\полный путь установки", куда Вы ее воткнули, например, что-нибудь такое:
> cd c:\China\Gliphs
затем набрать
>java -jar KPP- 3_3.jar   

Проверено всего на трех "чужих" машинах, не поехало на одной, но установка ассоциаций помогла.
Инструкцию по Обустройству КПП дополнил (с картинками).

Извините...  :-[
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Chunky от 10 Февраля 2011 17:06:09
Заработало, будем осваивать.
Пожелание с ходу - размер знаков (шрифт) можно изменять? Для меня важно увеличить, зрение не очень...
А вообще спасибо, интересно как минимум.
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Criptozavr от 10 Февраля 2011 18:19:52
Макар Н.

Как и обещал, ссылка уже у Вас в личке.

Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Макар Н. от 10 Февраля 2011 18:35:07
Пожелание с ходу - размер знаков (шрифт) можно изменять? Для меня важно увеличить, зрение не очень...

Увы... Озабочен был тем, чтобы эта "гребенка" влезла на экран вся.  ;D Штатный механизм не предусмотрен. Пока побалуйтесь, потом будем думать, если не надоест и надо будет ;)... В принципе, "ответ сходу" -  могу безболезненно увеличить шрифт в поле глифов и в текстовом поле writer'а, но повторяю это нужно будет подкрутить исходники, или вообще прикрутить механизм выбора шрифтов к этим полям, но это уже другая задача. Пока мне была интересна сама идея, посему реализация такая убогая. "Звоночков и свисточков" навешать много есть куда  ;D , но стоит ли "парить мозги", если это кроме меня никому не нужно?
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Chunky от 10 Февраля 2011 18:48:24
Основная реакция - Спасибо.
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Макар Н. от 11 Февраля 2011 14:01:28
Господа,

в КПП обнаружена еще одна неувязка...

Возможно некорректное отображение графа "мясо слева" (изначально я рисовал его одним символом  с "луной" - 月, потом их "развел", для чего пришлось "подкрутить" шрифт). Всех заинтересованных прошу снова скачать zip-файл. Из zip'а нужно обновить только шрифт (A3.ttf).
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: WERTA от 05 Сентября 2011 00:18:13
Все-таки ввод по ключам не всегда удобен (особенно для программиста). Я пытался даже усовершенствовать этот процесс - вроде новый метод ввода. Взял за основу старую и надежную CangJie (к сожалению многими забываемую). И четко поставил задачу что запись иероглифа компонуется так
[Ключевая часть][Композиция][Неключевая часть]
[Композиция] из стандарта UNICODE всего 12 типов
1.LEFT_TO_RIGHT
2.UP_TO_DOWN
3.LEFT_CENTER_RIGHT
3.UP_CENTER_DOWN
......
12. OVERLAID

Иероглифы типа OVERLAID, а также иероглифы с трудно определимым ключом  в такой записи представляются просто кодом  CangJie.

Ключевая часть - не более 2 знаков  CangJie.
Композиция - символ также является разделителем, цифр не хватит, 1-9,0 + еще один.
Неключевая часть - не более 2 знаков  CangJie.
Вот пример из самого "заселенного" ключа "вода"
浇= E1JU
涴= E1JU
浣=E1JU
滵= E1JU
В общем, получилась старая ЦангЦзе на новый лад, с элементами ввода по ключам и самое главное - с информацией по композиции знака! Даже название можно легко ей придумать 部首倉頡!
А самое главное достоинство этого метода для программиста  - не нужно делать интерфейс- таблицу с 214 элементами управления. 
Я уже забил 4E00-9FA5 информацией о типе  композиции. Сейчас забиваю 3400-4DFF
Это в Экселе вбивается довольно быстро по 1000 за 2-3 часа. CangJie - легко выдрана из Унихани. Осталось только с помощью CangJie рассортировать [Ключевая часть],[Неключевая часть] и выделить знаки с труднопределяемым ключом. В общем, не знаю это перспективно? Ведь пользовтелей со знанием метода ввода CangJie - катастрофически мало. А ведь с этой системы ввода начался китайский компьютинг вообще!




Название: Ещё в Pablo
Отправлено: TBopeLl, от 12 Февраля 2012 04:45:29
Ещё в Pablo показавыется из чего состоит каждый введённый иерог.
Прога бесплатна(т.е. плата добровольная), скачать можно на сайте производителя (http://ehaton.blogspot.com/).
Название: Новые методы ввода иероглифа, основанные на ключевой декомпозиции знака
Отправлено: WERTA от 17 Марта 2012 00:23:57
Я долго экспериментировал, и пришел к выводу, что поиск и ввод редкого и незнакомого через таблицу радикалов можно заменить текстовым вводом в одну строку – новый вариант текстовых методов ввода. Что для этого надо. Прежде всего, информация о декомпозиции знака (если это не сложный знак).
[RADICAL]+[NON_RADICAL]
На основании такого разделения можно реализовать очень гибкий и богатый на варианты редактор ввода IME базирующийся на классической 214-ключевой классификации иероглифов.
Какие переключаемые варианты для составных знаков можно реализовать.
1)   [RAD_NUMBER].[TOTAL_STROKES] 
2)   [RAD_NUMBER].[ADD_STROKES]
3)   [RAD_NUMBER].[CJ]
4)   [RAD_NUMBER].[PINYIN]
5)   [RAD_MNEM].[TOTAL_STROKES]
6)   [RAD_ MNEM].[ADD_STROKES]
7)   [RAD_ MNEM].[CJ]
8)   [RAD_ MNEM][COMP_DIVIDER][CJ]
9)   [RAD_ MNEM].[PINYIN]
10)   [RAD_ СJ].[TOTAL_STROKES]
11)   [RAD_ СJ].[ADD_STROKES]
12)   [RAD_ СJ].[CJ]
13)   [RAD_ СJ][COMP_DIVIDER][CJ]
14)   [RAD_ СJ].[PINYIN]
===================
Пояснения
———————————————-
Ключевая часть
[RAD_NUMBER] – номер ключа 1-214 (1 Байт)
[RAD_MNEM] – англ. мнемоника ключа  (11 Байт) (hand, water, tree…)
[RAD_ СJ] – два знака CangJie (Начало-Конец)  (2 Байта)
———————————————-
Дополнительная часть
[TOTAL_STROKES] – всего черт в знаке (1 Байт)
[ADD_STROKES] – всего черт в неключевом знаке (1 Байт)
[CJ] – два знака CangJie в неключевом знаке (Начало-Конец) (2 Байта)
[COMP_DIVIDER] – разделитель, несет информацию о типе композиции знака (1 Байт)
[PINYIN] – стандартная запись иероглифа пининью (наиболее часто употребимый вариант) без тона, идентификатор займет 2 байта
===================
Для сложных неразбиваемых знаков будут работать только две дополнительные части
[TOTAL_STROKES]  или [PINYIN]
===============================================
Пример текстового кода вариантов записи составного иероглифа
鬓=髟+宾
1)   190.20 
2)   190.10
3)   190.JC
4)   190.BIN
5)   HAIR.20
6)   HAIR.10
7)   HAIR.JC
8)   HAIR2JC
9)   HAIR.BIN
10)   SH.20
11)   SH.10
12)   SH.JC
13)   SH2JC
14)   SH.BIN
===============================================
Пример текстового кода вариантов записи разбиваемого иероглифа с трудноопределимым ключом (тут уже начинаются спорные моменты)
奲=奢(大)+單
1)   37.24 
2)   37.21 хотя можно и (37.12)
3)   37.RJ
4)   37.DUO
5)   BIG.24
6)   BIG.21 (BIG.12)
7)   BIG.RJ
8)   BIG1RJ
9)   BIG.DUO
10)   K.24
11)   K.21
12)   K.RJ
13)   K1RJ (правильнее KA1RJ, но оно не совместимо с концепцией таблиц данных)
14)   K.DUO
===============================================
Пример текстового кода вариантов записи неразбиваемого иероглифа с трудноопределимым ключом (тут тоже есть спорные моменты)
戼(戶)
1)   63.3
2)    —-
3)    —-
4)   63.MAO
5)   DOOR.3
6)   —-
7)   —-
8)   —-
9)   DOOR.MAO
10)   HS.3
11)   —-
12)   NSMLS – в данном случае уместна полная запись CJ, но это другой метод и несовместимо с концепцией таблиц данных
13)   NSMLS – в данном случае уместна полная запись CJ, но это другой метод и несовместимо с концепцией таблиц данных
14)   HS.MAO

==============================================
Данный метод, прежде всего, предназначен для ввода незнакомого по произношению или редкого знака.

Кто-то скажет, ну зачем изобретать велосипед сейчас в любом IME открывай таблица радикалов и ищи, вот именно – ищи! Но если сделать доступными быстрое переключение на один из приведенных выше 14 вариантов ввода, то становится возможным очень удобно для себя вводить знаки без нудного поиска по длинному списку, к примеру  иероглифов из 15 черт в ключе «вода». Я очень точно знаю номера некоторых распространенных ключей 85 (вода), 86 (огонь), 75 (дерево), 9 (человек), далее я могу легко написать мнемоники некоторых ключей HAIR, HAND, HEART, HIGH, DRAGON, TWO, также для многих ключевых знаков я помню запись  CJ, а черты – ну это нужно уметь считать их, я по крайней мере умею. Вот так чередуя эти варианты можно быстро найти именно незнакомый нам иероглиф. Потому что для известных (по произношению)  иероглифов  фонетические методы ввода не представляют проблемы. Морфологические методы -  CJ например, как бы я хорошо не помнил концепцию CJ (а я давний фанат CJ), все-таки ввод незнакомого сложного знака на CJ представлял собой долгий путь проб и ошибок.

ДОП, ИНФОРМАЦИЯ О РЕАЛИЗАЦИИ МЕТОДА
========================================
1.   Таблицы данных
—————————————-
Таблица иероглифов
1-[UNICODE] (2 байта) – Юникод номер
2-[RAD_ID] (1 байт) – номер радикала
3-[TOTAL_STR] (1 байт) – число черт знака
4-[ADD_STR] (1 байт) – число черт неключевой части знака
5-[CJ] (2 байтa) – 2 знака  CJ для неключевой части
6-[COMP_TYPE] (1 байт) – код композиции иероглифа
7-[PINYIN_ID] (2 байта) – идентификатор около 400 бестоновых фонем
***
Итого 10 Байт (без [UNICODE] будет 8)
—————————————-
Таблица радикалов
1-[UNICODE] (2 байта) – Юникод номер, нужен для отображения радикала
2-[RAD_ID] (1 байт) – порядковый номер радикала
3-[RAD_CJ] (2 байта) – кодировка радикала двумя знаками CJ
4-[RAD_MNEM] (11 байт) – английская мнемоника радикала
Итого 16 Байт
—————————————-
Таблица фонем
1-[PINYIN_ID] (2 байта) –идентификационный номер фонемы
2-[PINYIN] (6 байт) – 6 символов бестоновой PINYIN
Итого 8 Байт
—————————————-
2.   Принцип кодирования CJ c учетом ключа и композиции знака (можем назвать его метод – 部首仓颉)
[RADICAL_CJ][COMP_DIVIDER][CJ] длина всей строки не более 5 символов (аналогично классической CJ)
Но.
Типы композиции по стандарту UNICODE и их кодирование одним символом
[COMPLEX]–нет кодирования, полная запись CJ
[LEFT_RIGHT] –1
[UP_DOWN] –2
[LEFT_CENTER_RIGHT] –3
[UP_CENTER_DOWN]–4
[SURR]–0
[SURR_UP]–5
[SURR_DOWN]–6
[SURR_LEFT]–7
[SURR_LEFT_UP]–[
[SURR_RIGHT_UP]–]
[SURR_LEFT_DOWN]–8
[OVERLAID] –нет кодирования, полная запись CJ
Примеры
戵=I1BG (обратите внимание, ключ всегда будет стоять в начале, это отличие от CJ)
扃=HS[BR
挛=Q2YC
冈=B5K
國=R0IM

Добавлены расширения и исключения
1) Если знак состоит из нагромождения 2,3,4 подобных знаков, то 
[COMP_DIVIDER]=* и  запись станет такой
[CJ]*[REPEATS]
龍=YP
龖=YP*2
龘=YP*3

2) Если знак неразбиваемый [COMPLEX] или образован наложением [OVERLAID], то запись эквивалентна полной CJ.

Надеюсь, что кого-то заинтересую своими идеями. И надеюсь реализовать задуманное. Выполнена уже значимая часть работы
1)   Взята из источников(UNIHAN, MS CHIN TRAD CJ IME), дополнительно введена и проверена вся CJ в формате старой версии 3.0 для 27 тысяч знаков (CJK_unifed+ CJK_unifed_COMPAT+ExtA)
2)   Введен тип композиции для каждого из 27 тысяч знаков
Что нужно еще сделать
1)   Отделение из CJ кода каждого знака не ключевой части (27 тысяч знаков)

Я это все планирую вставить в свои CJKV VBA IMEs для MS Word, которые я совершенствую на досуге с 2000 г.
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Макар Н. от 29 Апреля 2012 09:44:32
Господа,

есть повод снова напомнить народу об "экзотическом" способе ввода иероглифов по "ключам".

У "Китайского Правильного Писания" появилось потомство, "молодое, но ранее"  ;D.  Умеет вводить 2-мя кликами мыши подавляющее большинство упрощенных иероглифов современного китайского языка  (4967 из 6683-х или 74,4%). Если учесть частоту использования этого "квалифицированного большинства" иероглифов, то это составит 89,6% "живаго великокитайского".

Вся "арифметика" в кратком введении в "структурную иероглифику": http://poutko.ru/China/Hieroglyphics.html (http://poutko.ru/China/Hieroglyphics.html)
Описание самой программы и ссылка на скачивание здесь: http://poutko.ru/China/LazyTools.html (http://poutko.ru/China/LazyTools.html), но рекомендую сначала прочесть таки "краткое введение".
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: WERTA от 29 Апреля 2012 17:38:31
Уважаемый Макар.Н, давно слежу за Вашими наработками по системам ключевого ввода. Я сам давно транслировал различные существующие CJKV системы ввода под макросы MS Word.
наработки - http://ifolder.ru/30206220 (http://ifolder.ru/30206220)

Но недавно стал задумывать тоже свою собственную систему ключевого ввода, поэтому могу поделиться советами.
1. Ключевой ввод, ориентированный на множестве ключевых элементов
1) Имеется таблица радикалов.
2) Иероглифический знак задается просто множеством элементов
ПРИМЕР
器=口,犬
2. Ключевой ввод, ориентированный на правильную последовательность ключевых элементов
1) Имеется таблица радикалов.
2) Иероглифический знак задается строкой элементов в порядке начертания
ПРИМЕР
器=口,口,犬,口,口
3. Ключевой ввод, ориентированный композицию ключевых элементов в иероглифе
1) Имеется таблица радикалов.
2) Иероглифический знак задается строкой элементов в порядке начертания с учетом жестко оговоренного правила декомпозиции
ПРИМЕР
澗=水⿰間=水⿰(門⿵日)
В Wenlin и Юникоде CDL (Charactre Description Language) типы декомпозиции очень сильно различаются. Хотя Юникод конечно же имеет более обоснованную и продвинутую систему знаков декомпозиции и не хватает в них только типов удвоения, утроения, учетверения одного не обязательно ключевого знака - это совершенно логически самостоятельные типы декомпозиции.

Вообще возникает еще ряд сложностей.
1) Детализация ключевого знака
Если начать графически точно детализировать, то можно зарыться в такие таблицы ключевых знаков, который будут насчитывать и 500 и 1000 знаков. Поэтому нужны жесткие градации, которые будут определять что такое ключевой знак и его варианты, и какие из его вариантов будут самостоятельными. Это проблема, в Унихани ее частично решили путем ввода различных вариантов знака.
ПРИМЕР
Сначала так
澗=水⿰間=水⿰(門⿵日)
а почему не так?
澗=氵⿰間=氵⿰(門⿵日)
Т.е. встает еще одна проблема  - как подробно при декомпозиции описывать варианты, которые принимает базовый ключевой знак.

2) Вымершие ключевые знаки
Если вы просматривали 20902 знака из основного CJK-набора Юникода, то замечали что некоторые иероглифы можно объединить в очень ярко-выраженные ключи.
Вот таблица некоторых вымерших ключей.
(http://i37.fastpic.ru/big/2012/0429/b4/0e3a79f13e861ecea1f5b4717446cbb4.jpg)

Кстати в Wenlin4 имеется своя таблица ключей для иероглифов старого написания - СяоЧжуань, так там очень много вымерших ключей (явно намного больше 214). 
А это другая таблица ключей (не помню где ее скачал)
(http://i36.fastpic.ru/big/2012/0429/ad/61ad4ec733180a5341356e44a144b5ad.gif)

Что касается вашей системы ввода на палладице, то вынужден признать ее пригодность, поскольку палладица вполне однозначна для систем фонетического ввода иероглифов (полная кириллическая альтернатива путнхуа пиньинь), хотя и не совсем адекватна по фонетике. Но именно для "начинающих" она необходима, через нее легче выучить пиньинь русскоязычному лицу. Да я сам много лет назад начинал изучение фонетики Путунхуа именно через палладицу. Поэтому так держать!

И еще совет. Месяц назад натыкался в сети про печатную машинку Ли ЮйТана, через нее вышел прямо на Гугле на целую "залежь" патентов по различным системам ввода иероглифов за период 40-х-80-х годов. Это именно большей частью некомпьютерные системы ввода, там много полезнного можно найти. Именнно из тех систем частично вышли современные морфологические системы иероглифического ввода: CangJie, Boshiamy, Array30 и др.

Рекомендую еще почитать про CangJie - это очень оптимальная система ввода, может у Вас  появятся свои мысли по этому поводу - как скрестить ЦанЦзе и ключи.

Вообще, ключевых таблиц и принципов декомпозиции для китайских иероглифов можно создавать тысячами. Я же предпочитаю все стандартное
1) Декомпозиция - по правилам Юникода.
2) Таблица ключей - классическая КанСи 214 знаков, хотя простейший пример декомпозиции 學=?⿱子 в такой таблице уже невозможен (традиционный знак - xue2). Знак, подразумеваемый  вопросиком конечно же существует,  но  только в четырех байтовом расширении Юникода, поддержку которого не везде еще можно встретить.

Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Макар Н. от 29 Апреля 2012 19:18:58
Уважаемый WERTA,

Спасибо за обстоятельные советы и комментарии.  Во всей этой "войне" мне мало интересны существующие "стандарты", ибо это чаще всего чей-то "произвол", пусть и "общепринятый" (кем-то принятый, не мной). Зато непоколебимы  3 принципа:

1. свобода (можете читать "произвол"),
2. простота (что вижу, то и правда),
3. эффективность ("экономность") ввода.

По первому вопросу имею сказать, что мой произвол (не спрятанный за "стандарты") остается и объявляется произволом. Поэтому любой человек может этот произвол принять или поменять на свой собственный (инструменты прилагаются).

По второму вопросу: что бы ни глаголили стандарты, "нож сбоку" и "нож сверху" графически совершенно разные элементы,  и вижу я их по-разному.

А по третьему вопросу экономность сама говорит за себя - 2 клика на 90 % иероглифов  ;).

Вам спасибо за интерес к теме.
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: aromaiink от 29 Апреля 2012 19:50:15
NJStar Chinese Word Processor Version 5.30 - Free Download
http://www.windows7download.com/win7-njstar-chinese-wp/download-dwucnelh.html

http://www.njstar.com/cms/njstar-chinese-word-processor-download
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Макар Н. от 29 Апреля 2012 20:30:05
Спасибо aromaiink за ссылки.

NJStar классная вещь и, слава богу, создатели выставляют его в свободном доступе. Держать результаты собственных интеллектуальных усилий "под спудом денежного мешка" - вещь контрпродуктивная. Но я не о том.  Я о "закрытом произволе". Откуда в списке иероглифов под ключем 木 оказался 东? Или еще лучше - 伙! У создателей были какие-то резоны на это, ясно. Но они не "ложатся мне в душу", а сделать с этим я ничего не могу... Запомнить и пользоваться?.. Конечно, свободный доступ предполагает свободу - не хочешь не качай  :). Посему, лучше я сделаю для себя сам, как моей душе угодно. Может еще кому понравится  ;) ...
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Chunky от 29 Апреля 2012 20:43:11
NJStar классная вещь и, слава богу, создатели выставляют его в свободном доступе.

Не понял. Закачка свободная, это понятно. А как с пользованием?
На странице закачки:
"This trial version is for 30 days free evaluation;
Fully registered version can be purchased securely online;"

Или я что-то не так делаю?
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Макар Н. от 29 Апреля 2012 21:00:29
Мой предыдущий (5.20) "лечился"...
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: WERTA от 30 Апреля 2012 00:07:05
Благодарю всех за ответы и участие в обсуждении.
Уважаемый Макар.Н.
Насчет произвола. Конечно, в плане унификации иероглифики без произвола не обойтись. Но для нас (тех, кто не вырабатывает стандарты), рано или поздно, придется подстроиться хотя бы частично под эти самые стандарты (их вырабатывают те, кто «рулят»). Касательно 伙(huo3) U+4F19 в Юникоде это как раз ключ (КанСи - №9) (человек). В NanJi Star это просто ляпсус. Это свидетельствует о том, что, скорее всего, в основе сортировок у них была не Юникодовская кодировка, а стандартные GB2312 и Big5. Вот уже иллюстрация удобства стандартизации – готовая сортировка по ключам и строкам. Хотя я сам лично все 20902 иероглифа CJK Unifed Ideographs проверял в плане принадлежности к ключам и числу строк – есть неоднозначности в плане принадлежности к ключам (пример – 龝) и строкам с точностью  до ±2 строк в зависимости от начертания в шрифте (Сун, Хей, Мин, Японск, Кор и т.п.) – произвол однако. В настоящее время наиболее четкая концепция стандартизации наблюдается у стандарта Юникод. Ведь мало выбрать во всяких древних словарях и закодировать по порядку кучу редчайших знаков, но они еще и выработали XYZ CJK концепцию подстановок и эквивалентности знаков. Именно отсюда идут так называемые Z-варианты – исторически разное написание одного и того же знака.

По поводу экономности ввода. Я исследовал в плане информационной емкости на разных выборках текстов кит. оригинала и русс. перевода. Так вот, получается, что один ханьцзы соответствует в среднем примерно нашим  4–4,5 буквам. Т.е. 4 нажатия клавиш ввода однобайтовых символов как раз и являются тем чисто информационным пределом. В ЦанЦзе, кстати, максимум распределения длины записей кодировки также соответствует четырем нажатиям на один иероглиф. В УБи, также пиарят ввод в 4 нажатия. Boshiamy, Array30, DaYi – тоже длина кодировки не более 4 символов.
Цитировать
А по третьему вопросу экономность сама говорит за себя - 2 клика на 90 % иероглифов
Ну, если указывать декомпозицию, то это 3 клика. И опять если 2 клика из списка (таблицы) 100-200 знаков, то это победа только для «мышиных» систем ввода, а не клавиатурных. Декомпозиция, согласен, это уже излишество в Вашем варианте системы ввода – тогда чаще 2, реже три клика без декомпозиции. Мне очень понравилось, что проблему неоднозначности декомпозиции Вы решаете просто и изящно при помощи одного модификатора. Только бы не возникло ситуаций, где надо снять неоднозначность 2-3 модификаторами подряд, но я уже вижу, это действительно будут редкие случаи. По принципу сокращения длинной цепочки кодировки «первый, второй, последний» - это та же самая ЦанЦзе, только не с алфавитом из 25 знаков, а существенно большим – более 200. У Вашего подхода действительно есть серьезные перспективы. Только может в плане сортировки таблицы «ваших» ключевых знаков нужно что-то поменять. Подойдут классическая сортировка по числу черт, сортировка по «многонаселенности» ключа (рекордсмен тут ключ «вода» - нереально много знаков, более 1000). Сортировка по частоте использования для ключевых знаков, даже не могу сказать – подходит ли она? Также стоит в таблице унифицировать варианты ключей.
Цитировать
что бы ни глаголили стандарты, "нож сбоку" и "нож сверху" графически совершенно разные элементы,  и вижу я их по-разному.
Вот тут то и нужна оптимизация. Действительно, если в Вашей системе начать объединять варианты ключей, то попрет неоднозначность декомпозиции, которую модификатором уже не выправишь. Но излишняя подробность в описании графических вариантов одного и того же «малозаселенного» ключа тоже нагружает мозг. Я кстати благодаря Wenlin4 и Вашей структурной иероглифике начинаю понимать глубокую связь между графическими вариантами, которые ранее вообще не мог связать между собой, считая их какими-то вымершими ключами. А это улучшает мнемонику запоминания иероглифа.

Вообще, проблема в том, чтобы система ввода с одной стороны не была излишне подробной – возрастает длина строки ввода (число нажатий на один знак), но с другой стороны излишнее упрощение системы приведет к неоднозначности списка выбора, состоящего в отдельных ситуациях из 10-20 знаков, что терпимо, но не совсем желательно. Именно ЦанЦзе имеет оптимальную неоднозначность списка выбора максимум в 3-4 иероглифа и то – очень редко.

С моим подходом (см. мои посты в теме выше) у меня получается с использованием элементов ЦанЦзе длина строки ввода не более 5 символов (ключ(1-2 символа), декомпозиция(1 символ-разделитель), неключевая часть (1-2 символа)). Но однозначно закодировать стандартный радикал двумя символами из алфавита ЦанЦзе не получается. Иногда неоднозначность доходит до трех. Я думаю, может подключить иную систему морфологического ввода, хотя и там не гарантируется однозначность кодирования именно радикалов. Поэтому пока я частично признаю фиаско клавиатурных методов по части реализации систем ввода на основе ключевых знаков. Тут, наверное, придется обходиться только мышкой.

Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Макар Н. от 30 Августа 2012 15:03:07
Последний "штрих" к теме.

Прикрутил "композиционный ввод" к доступному в сети словарю Котова из Lingvo (http://www.daokedao.ru/blog/wp-content/pleco/Pleco_dic.rar (http://www.daokedao.ru/blog/wp-content/pleco/Pleco_dic.rar)), слегка "поправив" оный (добавил к заголовкам статей транскрипцию по палладию).

Теперь можно смело "набрать" незнакомый иероглиф с помощью комбинации графов ("ключей") и сразу получить его перевод. Сохранен и фонетический ввод (и в пиньине, и по палладию), но, ввиду некоторых расхождений в транскрипции "по Lingvo" и "по UniHan" (см. описание http://poutko.ru/China/Dictionary.html (http://poutko.ru/China/Dictionary.html)), нахально использовал вариант UniHan. Понятно, что композиционный ввод этих "ляпов" лишен, хотя, наверное, имеет свои :).

Несколько "программистских приколов" позволяют выбирать "слова" где искомый иероглиф стоит не на первом месте, а на любом ином (включая и последнее) в сочетании таковых. Иногда это удобно. Почему в Лингве этого нет, не понятно...

Кому любопытно, может взять отсюда (http://poutko.ru/China/DownLoadsRu.html (http://poutko.ru/China/DownLoadsRu.html)) и пользовать без ограничений ;)...
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Parker от 07 Июня 2013 23:19:30
Оцените, камрады, какая вещь (http://kanji.sljfaq.org): ввод по ключам, рукописный, по четырем углам. Богато!
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: anima*** от 08 Июня 2013 01:33:27
Богато!

     Всякое даяние — благо!
     Сходу наткнулся на жесткое требование соблюдения порядка рисования черт и что этот порядок не совпадает с WenLin.
     К примеру, никак не мог нарисовать 隹, непривычный порядок. Может быть, где-нибудь есть отмена соблюдения порядка, как в WenLin?
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Parker от 08 Июня 2013 11:46:19
Меня, главным образом, multiradical и 4 угла порадовали. Рукописный в байде нормальный.
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Макар Н. от 16 Апреля 2014 01:17:01
Все течет и изменяется.
И Radical lookup тоже. После изменения порядка графов на матрице "композиционного" ввода  стало проще вводить иероглифы (особенно на сенсорном экране, если "тыкать" в него пальцем :).

Если кто-то еще не забыл об этой теме, давненько как-то притихшей, может посмотреть теперь (не разбираясь в зауми сторонников и доводах противников), как это может выглядеть в реальности  ;)
http://poutko.ru/China/Img/LazyImg/ChineseInput.mp4 (http://poutko.ru/China/Img/LazyImg/ChineseInput.mp4)
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Hanxuejia от 11 Февраля 2015 20:27:39
Добрый день!
Извините, что лезу в вашу тему)))
Не подскажите мне как можно вводить отдельные черты китайских иероглифов, вот например 一 丿 丨 есть, а остальные?
Где можно почитать по этому поводу? Мне нужно просто вводить черты из которых состоят иероглифы, но я никак не могу найти и понять как это сделать!(((
Спасибо большое и еще раз извините
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: anima*** от 12 Февраля 2015 00:11:46
     Вот такой вариант (думаю, самый простой): составить табличку из линий и вводить их куда надо через буфер обмена.
     Все линии перечислены в учебнике: Т.П. Задоенко и Хуан Шуин 基礎漢语 Основы китайского языка Вводный курс Урок 1.
     7 линий есть в символах SimSun: 一丨丿丶乛亅乚
     Их коды: 4E00, 4E28, 4E3F, 4E36, 4E5B, 4E85, 4E5A.
     Еще 5 линий есть в расширенном диапазоне шрифтов (см. картинку), их 5-значные коды:
          2010C, 200CC, 200CA, 200CB, 21FE8.
     В редакторе Word, если в конце символа поставить курсор и одновременно нажать 2 клавиши (латиница) Alt и X, то код заменится символом.
     Для недостающих линий можно создать личные символы (через кнопку Пуск в Widows). Картинки недостающих линий можно копировать при этом с иероглифов с этими линиями.
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Fozzie от 12 Февраля 2015 13:15:01
Зачем изобретать столь изощрённый велосипед?

В Unicode есть специальный раздел - CJK Strokes (U+31E0 - U+31EF):

㇀㇁㇂㇃㇄㇅㇆㇇㇈㇉㇊㇋㇌㇍㇎㇏㇐㇑㇒㇓㇔㇕㇖㇗㇘㇙㇚㇛㇜㇝㇞㇟㇠㇡㇢㇣

В полном составе присутствует в нескольких фонтах, например в Hanazono (http://sourceforge.jp/projects/hanazono-font/downloads/62072/hanazono-20141012.zip/).

А для набора гораздо проще использовать BabelMap (http://www.babelstone.co.uk/Software/BabelMap.zip)
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: anima*** от 12 Февраля 2015 15:49:26

В полном составе присутствует в нескольких фонтах, например в

Fozzie, щиро дякую!
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Hanxuejia от 16 Февраля 2015 16:08:35
Спасибо большое за ответы!
Название: Re: Ввод иероглифов по ключам (Radical lookup)
Отправлено: Макар Н. от 09 Сентября 2015 13:34:08
  Поиск иероглифов "по компонентам" потихоньку проникает на просторы интернета, что греет душу (особенно дилетанта, причастного к этой ветке форума  :)). К примеру, весьма достойный ресурс MDBG (http://www.mdbg.net/chindict/chindict.php (http://www.mdbg.net/chindict/chindict.php)), который можно рекомендовать и сам по себе, недавно к своим инструментам добавил  и такой - "Show entries containing character components: (汉字部件)" (http://www.mdbg.net/chindict/chindict.php?page=chardict (http://www.mdbg.net/chindict/chindict.php?page=chardict)). И ведь работает.
  Но, кроме поиска, по этому же принципу можно организовать и ввод иероглифов, о чем я постоянно трындел на форуме и всем предлагал инструменты для такого ввода. Не сочтите за саморекламу :-[, это скорее "авторский зуд" O:), но теперь можно посмотреть на этого "зверя" и в он-лайне (т.е. ничего не скачивая, не устанавливая) и хоть из-под андроида, хоть из-под иОС'а:
http://poutko.ru/Compositor/full.html (http://poutko.ru/Compositor/full.html) - полноэкранная версия для большого экрана,
http://poutko.ru/Compositor/compact.html (http://poutko.ru/Compositor/compact.html) - "стиснутая" версия для планшетника.
(Понятно, функционал слабее, чем в локальной версии).
Пробуйте (если это еще кому-нибудь интересно ;))...