• Welcome to Восточное Полушарие.

News:

Друзья! Форум перенесен на новый сервер, обновлено программное обеспечение, конвертированы данные. Изменений очень много, что-то могло сломаться, что-то не заработать, что-то пропасть. Если вы обнаружили проблему на форуме, пожалуйста, напишите на admin[собака]polusharie.com — постараемся исправить! 02.01.2026

Main Menu

Ввод иероглифов по ключам (Radical lookup)

Started by Papa HuHu, 29 April 2010 04:37:33

Previous topic - Next topic

0 Members and 1 Guest are viewing this topic.

Papa HuHu

Добрый день! Меня попросили начать эту тему, потому что человек, который в ней заинтересован, новый на форуме и еще не может создавать новые темы.

Господа, помогите найти "таблицы распределения" ключей по иероглифам. Что-либо подобное:
泅 -氵, 囗, 人;
泪 - 氵, 目.
В любом виде: текстовом, графическом, "бумажном", наконец...

Papa HuHu

Сам же первым и отвечу.
Я знаю, что такое есть в словаре от Pleco. http://www.pleco.com/
Это самый лучший словарь с подобной функцией, который я видел.
А вот как оттуда эту информацию выдрать, я не знаю.

Алик

anima***

В WenLin в конце каждой статьи есть Contents, выделяешь, затеняя мышкой, и копируешь в буфер Ctrl+C.

Макар Н.

Спасибо.

Но тема не закрыта.
Pleco, если я правильно их понял, работает на мобильных устройствах, коих, увы, я не имею. Может быть есть версия для PC?
WenLin - что за штука? Стоит он свои 200 баксов? Да и неудобство, опять же, если я правильно понял, сайт www.wenlin.com предлагает купить CD, который они перешлют по почте :(... - как то уже непривычно, хочется Download'а :).
У разбалованных "достижениями ИТ" аппетит приходит во время еды - может быть кто-нибудь знает, где взять информацию пригодную для машинной обработки? Лень, знаете ли, в рукопашную...

Fu Manchu

Quote from: Макар Н. on 29 April 2010 06:36:42
Спасибо.

Но тема не закрыта.
Pleco, если я правильно их понял, работает на мобильных устройствах, коих, увы, я не имею. Может быть есть версия для PC?
WenLin - что за штука? Стоит он свои 200 баксов? Да и неудобство, опять же, если я правильно понял, сайт www.wenlin.com предлагает купить CD, который они перешлют по почте :(... - как то уже непривычно, хочется Download'а :).
У разбалованных "достижениями ИТ" аппетит приходит во время еды - может быть кто-нибудь знает, где взять информацию пригодную для машинной обработки? Лень, знаете ли, в рукопашную...
Wenlin есть на rutracker.org  и на uz-translations.su ;)
совершеннобесплатно 8-)
нежен ад

China Red Devil

есть программа

NJStar Chinese WP

которая бесплатно скачивается с сайта разработчика http://www.njstar.com/cms/njstar-chinese-word-processor

может вам подойдет
不怕困难不怕死

anima***

Я скачивал старую версию WenLin по чьей-то ссылке на форуме года 2 тому, очень ей доволен. Потом скачал портабельную версию без звука (звук поленился скачать), работает так же хорошо и весит 60 Мега вместо 700. Лично я считаю WenLin лучшим словарем для того, кто копается в странных иероглифах. Наверно самый большой запас, порядка 100 000. Надежный ввод любых иероглифов пером. Поиск по части иероглифа или по сочетанию нескольких компонентов. Поиск по пиньиню. Единственный словарь (насколько я знаю), позволяющий поиск  рисованием пером для иероглифов в расширенных диапазонах SimSun. И т.д. и т.п.

Fozzie

Quote from: anima*** on 29 April 2010 07:18:36Наверно самый большой запас, порядка 100 000.
Wenlin за пределы Unicode никогда не выходил - значит всяко не больше 70000.
И, вдобавок, весьма приличное количество иероглифов в Wenlin (в основном из Ext B) не имеет разложения на компоненты. Нельзя сказать, что работы в этом направлении прекратились, только вот новых версий Wenlin не видно уже довольно давно... :(
據梧

anima***

Нашел где предлагался WenLin уважаемым Criptozavrом:
Китайский Язык: компьютеры, программы, шрифты, страница 3 (WenLin 3 с апдейтом). Как скопировать ссылку, не знаю, но найти, я думаю, можно. Она есть. Конец 2008 г.

Макар Н.

Господа, спасибо за "наводку" на WenLin. Забавная вещица, и делу поможет, если схватиться в рукопашную, но:

1. Прав Fozzie - не для всех иероглифов есть "компоненты".
2. Копирование компонентов происходит прямо скажем, причудливо (как сказал anima***
Quoteвыделяешь, затеняя мышкой, и копируешь в буфер Ctrl+C.
- в результате невозможно заранее угадать, сколько "компонентов" будет скопировано и какие из показанных компонентов по непонятным причинам изменятся при на вставке :().
3. Понятие "компонентов" в WenLin'е несколько отличается от того, что я имел ввиду в вопросе темы - в компоненты в WenLin'е включены и иероглифы. Как можно представить себе систему ВВОДА иероглифов на основе других иероглифов? Мнемотехника на такой основе - вполне законная и понятная вещь. Но не более.

Вообще, господа профессионалы, надежда есть ли найти некий "стандарт" раскладки иероглифов на ключи? Как вопрошал Михал Михалыч: "Он таки есть или его нет?".  Или, как всегда - хочешь сделать хорошо, сделай сам?

Бог с ним, со "стандартом". Я согласен даже на "произвол", что надо - "поправим", лишь бы его можно было втащить в машину...

anima***

Да, поначалу раздражает способ копирования и ввода Ctrl+C и Ctrl+V, но потом привыкаешь. Зато очень удобный способ последовательного открытия окон с помощью Ctrl: при нажатии Ctrl появляется палец, если навести его на любое слово или иероглиф и щелкнуть, то появится его перевод. Например, навести так на вэнь в заставе и щелкнуть. Поэтому легко разбить любой появившийся сложный компонент хоть на атомы.
Причиной того, что компоненты исчезают может быть отсутствие у Вас нужного шрифта. Например, установлен ли расширенный SimSun? Также совершенно меняется иероглиф, если такого значка нет в Юникоде, при этом в описании указывается, что значок специально разработан для Вэньлиня. Но разбить его дальше можно, в итоге получив простые части.
Люди, делавшие Вэньлинь, явно торопились, кое-что упустили. Всегда можно найти части из соседнего похожего иероглифа, а в крайнем случае нарисовать нужные компоненты, в программе это делается просто. Зато Вэньлинь почти всегда может помочь найти нужный иероглиф, мне только изредка требовалось лезть в бумажный список всех иероглифов и искать глазами.
Вещь!

mordapauka

Quote from: Макар Н. on 29 April 2010 13:57:08Как можно представить себе систему ВВОДА иероглифов на основе других иероглифов?
Рекурсивно, например, как в Cangjie. Если нужно ввести 唱 и мы уже знаем, что  口=R и 昌=AA, то RAA даст 唱.
Кстати, чем ваша система ввода отличается от Cangjie/Wubi?

mordapauka

Quote from: anima*** on 29 April 2010 07:18:36иероглифов в расширенных диапазонах SimSun
SimSun - это шрифт.
Вы, наверное, имели в виду юникодовские Ext-A, Ext-B и т.д.?

anima***

У меня установлен шрифт SimSun Founder Extended, включающий в себя A и B.

China Red Devil

Quote from: Макар Н. on 29 April 2010 13:57:08
Вообще, господа профессионалы, надежда есть ли найти некий "стандарт" раскладки иероглифов на ключи? Как вопрошал Михал Михалыч: "Он таки есть или его нет?".  Или, как всегда - хочешь сделать хорошо, сделай сам?

Бог с ним, со "стандартом". Я согласен даже на "произвол", что надо - "поправим", лишь бы его можно было втащить в машину...
не совсем понятно, что вы имеете в виду под стандартом.
но в любом случае о стандарте можно говорить только приближенно.
В разных словарях вы столкнетесь с разным количеством ключей, и с тем, что некоторые иероглифы ищутся по разным ключам.

Произвол какой- нибудь возможно и найдете. :D
不怕困难不怕死

Fozzie

Уууу!... Как всё запущено! (С)

Wenlin вообще не нуждается ни в каких китайских шрифтах - все иероглифы он или отрисовывает собственным CDL-движком, или выводит встроенным битмап-фонтом (совершенно жуткого, надо сказать, вида).

Если есть всенепременнейшее желание искать иероглифы именно как наборы ключевых знаков, то можно воспользоваться, например, таким способом:

1. Меню "List" -> B. Radicals by number 1-214. Развернуть на весь экран.
2. Меню "List" -> 4. Characters containing components.
3. Ползаем по списку ключевых знаков (курсор при этом становится чёрным кружком), левым кликом выбирая интересующие, и (обязательно!) убирая появляющийся в строчке вместе с ключевым знаком технический мусор. Выбрав, таким образом, все необходимые ключевые знаки, жмём "OK".

Правда результаты, при количестве ключей более одного, совсем не ах...

據梧

China Red Devil

#16
Quote from: Fozzie on 30 April 2010 05:44:54
3. Ползаем по списку ключевых знаков (курсор при этом становится чёрным кружком), левым кликом выбирая интересующие, и (обязательно!) убирая появляющийся в строчке вместе с ключевым знаком технический мусор. Выбрав, таким образом, все необходимые ключевые знаки, жмём "OK".

Правда результаты, при количестве ключей более одного, совсем не ах...
...и это чудо природы кто-  то считает "лучшим словарем для поиска иероглифов"?  ;D
不怕困难不怕死

Fozzie

Quote from: China Red Devil on 30 April 2010 05:57:12...и это чудо природы кто-  то считает "лучшим словарем для поиска иероглифов"?  ;D
В деле поиска иероглифов с большим количеством черт и/или повреждённых ему нет не то что равных - а и даже близко ничего не лежало...  Просто приведённый мной способ, несколько искусственный, "под заказчика", реально же используются более простые и эффективные ("последовательного укрупнения компонентов" и т.п.).


據梧

Макар Н.

Quote from: mordapauka on 29 April 2010 16:26:49
...чем ваша система ввода отличается от Cangjie/Wubi?

"Cangjie decomposition is not based on traditional Kangxi radicals, nor is it based on standard stroke order; it is in fact a simple geometric decomposition". (http://en.wikipedia.org/wiki/Cangjie_method). Я же говорил о вводе иероглифов по ключам.

Полагаю, что китайский язык слабо восприимчив к "наскокам" варягов, подобных мне. Посему, желательно использовать способы более близкие к традиции. Существует список ключей, он ограничен (хотя и "плавает" в разных источниках). Но он есть и его можно использовать "не насилуя" традицию.

В двух словах: задача заключается в том, чтобы, имея список ключей, за три-пять щелчков мыши ввести в текстовое поле (или прямо в буфер обмена) любой иероглиф из наперед заданного списка иероглифов (в количестве 3 - 5 тыс. штук). Задача с технической стороны, прямо скажем, проще пареной репы. И была до меня реализована уже не однажды. Например, в упоминаемом уважаемым China Red Devil'ом NJStar Chinese WP. Но. Мне хотелось иметь ОТКРЫТЫЙ список как ключей, так и иероглифов, хотелось иметь возможность править под себя и то, и другое. Таким образом эта "писалка" имеет еще и некоторый дидактический смысл  ;).

Пока я соображал, отозвался China Red Devil:

Quoteне совсем понятно, что вы имеете в виду под стандартом.
но в любом случае о стандарте можно говорить только приближенно.

Потому то "стандарт" и закавычен.

QuoteВ разных словарях вы столкнетесь с разным количеством ключей, и с тем, что некоторые иероглифы ищутся по разным ключам.

Вот это было бы вообще классно, если бы в словаре иероглиф можно было найти по всем его ключам. Почему 泪 я нахожу по ключу氵, а по ключу 目-  нет?. (Вопрос риторический отвечать не надо  ;D) Потому, что 氵, в данном случае, действительно "ключ", а 目 - просто "дополнительный элемент, состоящий из 5-ти черт". (Поэтому, строго говоря, систему ввода по ключам следовало бы называть "ввод по элементам" или, что мне больше нравится, "ввод по графам", а сам список "ключей" в данном случае, следовало бы называть списком "графов".) Полагаю, что причина этого кроется в "технической бедности" бумажных словарей. Невозможно представить себе на бумаге этакие "многомерные кросс-таблицы", по которым иероглиф нужно было бы искать по пересечению трех, скажем, или четырех компонентов. Поэтому умные люди и придумали поиск по ключам. Но заставить делать это (искать иероглиф по любому графу) машину - пара пустяков!

QuoteПроизвол какой- нибудь возможно и найдете. :D

"Произвол" ведь тоже будет разумным., а значит его можно будет "мягко" подправить. Ведь никто не станет (из разумных соображений) отвергать, что 泅 состоит из 氵, 囗 и 人.  И что эти три графа однозначно идентифицируют иероглиф 泅 во всем массиве таковых.

Ребята, я не Катон, но «Карфаген должен быть разрушен» :).
А посему настойчиво повторяю: Кто знает, где можно найти таблицу распределения ключей по иероглифам или готов таковую набросать - отзовитесь!

anima***

Насчет того, какой лучше, а какой хуже.
В общем-то это вопрос веры, каждый имеет право верить во что угодно. Я подхожу к этому делу с точки зрения удобства лично для меня, и чтобы у меня все було (искать в сети не всегда возможно). А из того что у меня есть ВэньЛинь единственный словарь, который не подведет. NJStar, всякие словари не для Лингвы, другие программки (удобные для других целей) просто не замечают иероглифы из расширенных диапазонов и поэтому в любой момент выдадут отказ. ВэньЛинь безотказный.
Попробуйте вот найти иероглиф с картинки моего профиля. Получится только в Вэньлине.

China Red Devil

Quote from: Макар Н. on 30 April 2010 06:57:57
В двух словах: задача заключается в том, чтобы, имея список ключей, за три-пять щелчков мыши ввести в текстовое поле (или прямо в буфер обмена) любой иероглиф из наперед заданного списка иероглифов (в количестве 3 - 5 тыс. штук). Задача с технической стороны, прямо скажем, проще пареной репы.
Мне хотелось иметь ОТКРЫТЫЙ список как ключей, так и иероглифов, хотелось иметь возможность править под себя и то, и другое. Таким образом эта "писалка" имеет еще и некоторый дидактический смысл  ;).
Понятно, задача стала яснее.

Пока могу сказать, что видел в текстовом формате только открытый список иероглифов по одному ключу, типа:

氵:    汉 汗 涵
口:   回 阿 哦 叶

и тд и тп.

его где- то на форуме выкладывал Laotou

зы. насчет того, какой словарь лучше, пожалуй да, спорить смысла нет  :).
不怕困难不怕死

Fozzie

Quote from: Макар Н. on 30 April 2010 06:57:57
Ребята, я не Катон, но «Карфаген должен быть разрушен» :).
А посему настойчиво повторяю: Кто знает, где можно найти таблицу распределения ключей по иероглифам...
Насколько мне известно, нечто подобное есть только здесь: http://www.wenlin.com/cdl/
Но вот насчёт доступности - не уверен. Некоторое время назад они собирались сделать CDL частью стандарта Unicode. На настоящее время к CDL-базе иероглифов есть on-line доступ через http://www.wenlin.com/cgi-bin/wenlinSVGhelp.pl
Я попытался получить туда логин - с меня зачем-то запросили CV...  ???
據梧

Fozzie

Quote from: China Red Devil on 30 April 2010 07:32:28
Пока могу сказать, что видел в текстовом формате только открытый список иероглифов по одному ключу, типа:

氵:    汉 汗 涵
口:   回 阿 哦 叶

и тд и тп.

его где- то на форуме выкладывал Laotou
А в Wenlin такой список получается в три клика на ключ ("Radicals by number 1-214". Кликаешь на любой - получаешь список иероглифов для этого ключа. Ctrl-A, Ctrl-C - и, куда угодно (Word, Блокнот и т.п.) - Ctrl-V   :P
Понятно, что для посредственного надмозга со словарным запасом в несколько сотен иерогов этот список - просто манна небесная. Но для серьёзной научной работы он не слишком удобен.   
據梧

China Red Devil

#23
Quote from: Fozzie on 30 April 2010 07:56:23
А в Wenlin такой список получается в три клика на ключ ("Radicals by number 1-214". Кликаешь на любой - получаешь список иероглифов для этого ключа. Ctrl-A, Ctrl-C - и, куда угодно (Word, Блокнот и т.п.) - Ctrl-V   :P
"Правда результаты, при количестве ключей более одного, совсем не ах..."(с)- вот с этого места можно поподробнее? ;D
QuoteПонятно, что для посредственного надмозга со словарным запасом в несколько сотен иерогов этот список - просто манна небесная. Но для серьёзной научной работы он не слишком удобен.
Изучением вопросов жизнедеятельности посредственных надмозгов не занимался, не знаю. ;D
А для серьезной научной работы удобней всего китаец + Ханьюй Да Цзыдянь. :P :P
不怕困难不怕死

anima***

Ну и Fozzie, щиро дякую!
Я такого не знал. Там при кликании ключа внизу еще есть список из ExtB. Що iще треба?!