Приветствуем! Мы запустили новую версию форума. Надеемся что вам она понравится. Если вы нашли проблему или у вас есть предложения - напишите нам :)

Ввод иероглифов по ключам (Radical lookup)

Добрый день! Меня попросили начать эту тему, потому что человек, который в ней заинтересован, новый на форуме и еще не может создавать новые темы.

Господа, помогите найти "таблицы распределения" ключей по иероглифам. Что-либо подобное:
泅 -氵, 囗, 人;
泪 - 氵, 目.
В любом виде: текстовом, графическом, "бумажном", наконец...

Написать комментарий...
Papa HuHu
11 years ago

Сам же первым и отвечу.
Я знаю, что такое есть в словаре от Pleco. http://www.pleco.com/
Это самый лучший словарь с подобной функцией, который я видел.
А вот как оттуда эту информацию выдрать, я не знаю.

Алик

Ответить
anima***
11 years ago

В WenLin в конце каждой статьи есть Contents, выделяешь, затеняя мышкой, и копируешь в буфер Ctrl+C.

Ответить
Макар Н.
11 years ago

Спасибо.

Но тема не закрыта.
Pleco, если я правильно их понял, работает на мобильных устройствах, коих, увы, я не имею. Может быть есть версия для PC?
WenLin - что за штука? Стоит он свои 200 баксов? Да и неудобство, опять же, если я правильно понял, сайт www.wenlin.com предлагает купить CD, который они перешлют по почте 😞... - как то уже непривычно, хочется Download'а 🙂.
У разбалованных "достижениями ИТ" аппетит приходит во время еды - может быть кто-нибудь знает, где взять информацию пригодную для машинной обработки? Лень, знаете ли, в рукопашную...

Ответить
Fu Manchu
11 years ago
Спасибо.

Но тема не закрыта.
Pleco, если я правильно их понял, работает на мобильных устройствах, коих, увы, я не имею. Может быть есть версия для PC?
WenLin - что за штука? Стоит он свои 200 баксов? Да и неудобство, опять же, если я правильно понял, сайт www.wenlin.com предлагает купить CD, который они перешлют по почте 😞... - как то уже непривычно, хочется Download'а 🙂.
У разбалованных "достижениями ИТ" аппетит приходит во время еды - может быть кто-нибудь знает, где взять информацию пригодную для машинной обработки? Лень, знаете ли, в рукопашную...

Wenlin есть на rutracker.org и на uz-translations.su 😉
совершеннобесплатно 😎

Ответить
China Red Devil
11 years ago

есть программа

NJStar Chinese WP

которая бесплатно скачивается с сайта разработчика http://www.njstar.com/cms/njstar-chinese-word-processor

может вам подойдет

Ответить
anima***
11 years ago

Я скачивал старую версию WenLin по чьей-то ссылке на форуме года 2 тому, очень ей доволен. Потом скачал портабельную версию без звука (звук поленился скачать), работает так же хорошо и весит 60 Мега вместо 700. Лично я считаю WenLin лучшим словарем для того, кто копается в странных иероглифах. Наверно самый большой запас, порядка 100 000. Надежный ввод любых иероглифов пером. Поиск по части иероглифа или по сочетанию нескольких компонентов. Поиск по пиньиню. Единственный словарь (насколько я знаю), позволяющий поиск рисованием пером для иероглифов в расширенных диапазонах SimSun. И т.д. и т.п.

Ответить
Fozzie
11 years ago
Наверно самый большой запас, порядка 100 000.

Wenlin за пределы Unicode никогда не выходил - значит всяко не больше 70000.
И, вдобавок, весьма приличное количество иероглифов в Wenlin (в основном из Ext B) не имеет разложения на компоненты. Нельзя сказать, что работы в этом направлении прекратились, только вот новых версий Wenlin не видно уже довольно давно... 😞

Ответить
anima***
11 years ago

Нашел где предлагался WenLin уважаемым Criptozavrом:
Китайский Язык: компьютеры, программы, шрифты, страница 3 (WenLin 3 с апдейтом). Как скопировать ссылку, не знаю, но найти, я думаю, можно. Она есть. Конец 2008 г.

Ответить
Макар Н.
11 years ago

Господа, спасибо за "наводку" на WenLin. Забавная вещица, и делу поможет, если схватиться в рукопашную, но:

1. Прав Fozzie - не для всех иероглифов есть "компоненты".
2. Копирование компонентов происходит прямо скажем, причудливо (как сказал anima***

выделяешь, затеняя мышкой, и копируешь в буфер Ctrl+C.

- в результате невозможно заранее угадать, сколько "компонентов" будет скопировано и какие из показанных компонентов по непонятным причинам изменятся при на вставке 😞).
3. Понятие "компонентов" в WenLin'е несколько отличается от того, что я имел ввиду в вопросе темы - в компоненты в WenLin'е включены и иероглифы. Как можно представить себе систему ВВОДА иероглифов на основе других иероглифов? Мнемотехника на такой основе - вполне законная и понятная вещь. Но не более.

Вообще, господа профессионалы, надежда есть ли найти некий "стандарт" раскладки иероглифов на ключи? Как вопрошал Михал Михалыч: "Он таки есть или его нет?". Или, как всегда - хочешь сделать хорошо, сделай сам?

Бог с ним, со "стандартом". Я согласен даже на "произвол", что надо - "поправим", лишь бы его можно было втащить в машину...

Ответить
anima***
11 years ago

Да, поначалу раздражает способ копирования и ввода Ctrl+C и Ctrl+V, но потом привыкаешь. Зато очень удобный способ последовательного открытия окон с помощью Ctrl: при нажатии Ctrl появляется палец, если навести его на любое слово или иероглиф и щелкнуть, то появится его перевод. Например, навести так на вэнь в заставе и щелкнуть. Поэтому легко разбить любой появившийся сложный компонент хоть на атомы.
Причиной того, что компоненты исчезают может быть отсутствие у Вас нужного шрифта. Например, установлен ли расширенный SimSun? Также совершенно меняется иероглиф, если такого значка нет в Юникоде, при этом в описании указывается, что значок специально разработан для Вэньлиня. Но разбить его дальше можно, в итоге получив простые части.
Люди, делавшие Вэньлинь, явно торопились, кое-что упустили. Всегда можно найти части из соседнего похожего иероглифа, а в крайнем случае нарисовать нужные компоненты, в программе это делается просто. Зато Вэньлинь почти всегда может помочь найти нужный иероглиф, мне только изредка требовалось лезть в бумажный список всех иероглифов и искать глазами.
Вещь!

Ответить
mordapauka
11 years ago
Как можно представить себе систему ВВОДА иероглифов на основе других иероглифов?

Рекурсивно, например, как в Cangjie. Если нужно ввести 唱 и мы уже знаем, что 口=R и 昌=AA, то RAA даст 唱.
Кстати, чем ваша система ввода отличается от Cangjie/Wubi?

Ответить
mordapauka
11 years ago
иероглифов в расширенных диапазонах SimSun

SimSun - это шрифт.
Вы, наверное, имели в виду юникодовские Ext-A, Ext-B и т.д.?

Ответить
anima***
11 years ago

У меня установлен шрифт SimSun Founder Extended, включающий в себя A и B.

Ответить
China Red Devil
11 years ago
Вообще, господа профессионалы, надежда есть ли найти некий "стандарт" раскладки иероглифов на ключи? Как вопрошал Михал Михалыч: "Он таки есть или его нет?". Или, как всегда - хочешь сделать хорошо, сделай сам?

Бог с ним, со "стандартом". Я согласен даже на "произвол", что надо - "поправим", лишь бы его можно было втащить в машину...

не совсем понятно, что вы имеете в виду под стандартом.
но в любом случае о стандарте можно говорить только приближенно.
В разных словарях вы столкнетесь с разным количеством ключей, и с тем, что некоторые иероглифы ищутся по разным ключам.

Произвол какой- нибудь возможно и найдете. 😁

Ответить
Fozzie
11 years ago

Уууу!... Как всё запущено! (С)

Wenlin вообще не нуждается ни в каких китайских шрифтах - все иероглифы он или отрисовывает собственным CDL-движком, или выводит встроенным битмап-фонтом (совершенно жуткого, надо сказать, вида).

Если есть всенепременнейшее желание искать иероглифы именно как наборы ключевых знаков, то можно воспользоваться, например, таким способом:

1. Меню "List" -> B. Radicals by number 1-214. Развернуть на весь экран.
2. Меню "List" -> 4. Characters containing components.
3. Ползаем по списку ключевых знаков (курсор при этом становится чёрным кружком), левым кликом выбирая интересующие, и (обязательно!) убирая появляющийся в строчке вместе с ключевым знаком технический мусор. Выбрав, таким образом, все необходимые ключевые знаки, жмём "OK".

Правда результаты, при количестве ключей более одного, совсем не ах...

Ответить
China Red Devil
11 years ago
3. Ползаем по списку ключевых знаков (курсор при этом становится чёрным кружком), левым кликом выбирая интересующие, и (обязательно!) убирая появляющийся в строчке вместе с ключевым знаком технический мусор. Выбрав, таким образом, все необходимые ключевые знаки, жмём "OK".

Правда результаты, при количестве ключей более одного, совсем не ах...

...и это чудо природы кто- то считает "лучшим словарем для поиска иероглифов"? 😆

Ответить
Fozzie
11 years ago
...и это чудо природы кто- то считает "лучшим словарем для поиска иероглифов"? 😆

В деле поиска иероглифов с большим количеством черт и/или повреждённых ему нет не то что равных - а и даже близко ничего не лежало... Просто приведённый мной способ, несколько искусственный, "под заказчика", реально же используются более простые и эффективные ("последовательного укрупнения компонентов" и т.п.).

Ответить
Макар Н.
11 years ago
...чем ваша система ввода отличается от Cangjie/Wubi?

"Cangjie decomposition is not based on traditional Kangxi radicals, nor is it based on standard stroke order; it is in fact a simple geometric decomposition". (http://en.wikipedia.org/wiki/Cangjie_method). Я же говорил о вводе иероглифов по ключам.

Полагаю, что китайский язык слабо восприимчив к "наскокам" варягов, подобных мне. Посему, желательно использовать способы более близкие к традиции. Существует список ключей, он ограничен (хотя и "плавает" в разных источниках). Но он есть и его можно использовать "не насилуя" традицию.

В двух словах: задача заключается в том, чтобы, имея список ключей, за три-пять щелчков мыши ввести в текстовое поле (или прямо в буфер обмена) любой иероглиф из наперед заданного списка иероглифов (в количестве 3 - 5 тыс. штук). Задача с технической стороны, прямо скажем, проще пареной репы. И была до меня реализована уже не однажды. Например, в упоминаемом уважаемымChina Red Devil'ом NJStar Chinese WP.Но.Мне хотелось иметьОТКРЫТЫЙсписок как ключей, так и иероглифов, хотелось иметь возможность править под себя и то, и другое. Таким образом эта "писалка" имеет еще и некоторый дидактический смысл 😉.

Пока я соображал, отозвалсяChina Red Devil:

не совсем понятно, что вы имеете в виду под стандартом.
но в любом случае о стандарте можно говорить только приближенно.

Потому то "стандарт" и закавычен.

В разных словарях вы столкнетесь с разным количеством ключей, и с тем, что некоторые иероглифы ищутся по разным ключам.

Вот это было бы вообще классно, если бы в словаре иероглиф можно было найтипо всемего ключам. Почему 泪 я нахожу по ключу氵, а по ключу 目- нет?. (Вопрос риторический отвечать не надо 😆) Потому, что 氵, в данном случае, действительно "ключ", а 目 - просто "дополнительный элемент, состоящий из 5-ти черт". (Поэтому, строго говоря, систему ввода по ключам следовало бы называть "ввод по элементам" или, что мне больше нравится, "ввод по графам", а сам список "ключей" в данном случае, следовало бы называть списком "графов".) Полагаю, что причина этого кроется в "технической бедности" бумажных словарей. Невозможно представить себе на бумаге этакие "многомерные кросс-таблицы", по которым иероглиф нужно было бы искать по пересечению трех, скажем, или четырех компонентов. Поэтому умные люди и придумали поиск по ключам. Но заставить делать это (искать иероглиф по любому графу) машину - пара пустяков!

Произвол какой- нибудь возможно и найдете. 😁

"Произвол" ведь тоже будет разумным., а значит его можно будет "мягко" подправить. Ведь никто не станет (из разумных соображений) отвергать, что 泅 состоит из 氵, 囗 и 人. И что эти три графаоднозначноидентифицируют иероглиф 泅 во всем массиве таковых.

Ребята, я не Катон, но «Карфаген должен быть разрушен» 🙂.
А посему настойчиво повторяю:Кто знает, где можно найти таблицу распределения ключей по иероглифам или готов таковую набросать - отзовитесь!

Ответить
anima***
11 years ago

Насчет того, какой лучше, а какой хуже.
В общем-то это вопрос веры, каждый имеет право верить во что угодно. Я подхожу к этому делу с точки зрения удобства лично для меня, и чтобы у меня все було (искать в сети не всегда возможно). А из того что у меня есть ВэньЛинь единственный словарь, который не подведет. NJStar, всякие словари не для Лингвы, другие программки (удобные для других целей) просто не замечают иероглифы из расширенных диапазонов и поэтому в любой момент выдадут отказ. ВэньЛинь безотказный.
Попробуйте вот найти иероглиф с картинки моего профиля. Получится только в Вэньлине.

Ответить
China Red Devil
11 years ago
В двух словах: задача заключается в том, чтобы, имея список ключей, за три-пять щелчков мыши ввести в текстовое поле (или прямо в буфер обмена) любой иероглиф из наперед заданного списка иероглифов (в количестве 3 - 5 тыс. штук). Задача с технической стороны, прямо скажем, проще пареной репы.
Мне хотелось иметь ОТКРЫТЫЙ список как ключей, так и иероглифов, хотелось иметь возможность править под себя и то, и другое. Таким образом эта "писалка" имеет еще и некоторый дидактический смысл 😉.

Понятно, задача стала яснее.

Пока могу сказать, что видел в текстовом формате только открытый список иероглифов по одному ключу, типа:

氵: 汉 汗 涵
口: 回 阿 哦 叶

и тд и тп.

его где- то на форуме выкладывал Laotou

зы. насчет того, какой словарь лучше, пожалуй да, спорить смысла нет 🙂.

Ответить
Fozzie
11 years ago
Ребята, я не Катон, но «Карфаген должен быть разрушен» 🙂.
А посему настойчиво повторяю: Кто знает, где можно найти таблицу распределения ключей по иероглифам...


Насколько мне известно, нечто подобное есть только здесь: http://www.wenlin.com/cdl/
Но вот насчёт доступности - не уверен. Некоторое время назад они собирались сделать CDL частью стандарта Unicode. На настоящее время к CDL-базе иероглифов есть on-line доступ через http://www.wenlin.com/cgi-bin/wenlinSVGhelp.pl
Я попытался получить туда логин - с меня зачем-то запросили CV... 🙄

Ответить
Fozzie
11 years ago
Пока могу сказать, что видел в текстовом формате только открытый список иероглифов по одному ключу, типа:

氵: 汉 汗 涵
口: 回 阿 哦 叶

и тд и тп.

его где- то на форуме выкладывал Laotou

А в Wenlin такой список получается в три клика на ключ ("Radicals by number 1-214". Кликаешь на любой - получаешь список иероглифов для этого ключа. Ctrl-A, Ctrl-C - и, куда угодно (Word, Блокнот и т.п.) - Ctrl-V 😋
Понятно, что для посредственного надмозга со словарным запасом в несколько сотен иерогов этот список - просто манна небесная. Но для серьёзной научной работы он не слишком удобен.

Ответить
China Red Devil
11 years ago
А в Wenlin такой список получается в три клика на ключ ("Radicals by number 1-214". Кликаешь на любой - получаешь список иероглифов для этого ключа. Ctrl-A, Ctrl-C - и, куда угодно (Word, Блокнот и т.п.) - Ctrl-V 😋

"Правда результаты, при количестве ключей более одного, совсем не ах..."(с)- вот с этого места можно поподробнее? 😆

Понятно, что для посредственного надмозга со словарным запасом в несколько сотен иерогов этот список - просто манна небесная. Но для серьёзной научной работы он не слишком удобен.

Изучением вопросов жизнедеятельности посредственных надмозгов не занимался, не знаю. 😆
А для серьезной научной работы удобней всего китаец + Ханьюй Да Цзыдянь. 😋 😋

Ответить
anima***
11 years ago

Ну и Fozzie, щиро дякую!
Я такого не знал. Там при кликании ключа внизу еще есть список из ExtB. Що iще треба?!

Ответить