Добрый день! Меня попросили начать эту тему, потому что человек, который в ней заинтересован, новый на форуме и еще не может создавать новые темы.
Господа, помогите найти "таблицы распределения" ключей по иероглифам. Что-либо подобное:
泅 -氵, 囗, 人;
泪 - 氵, 目.
В любом виде: текстовом, графическом, "бумажном", наконец...
Сам же первым и отвечу.
Я знаю, что такое есть в словаре от Pleco. http://www.pleco.com/
Это самый лучший словарь с подобной функцией, который я видел.
А вот как оттуда эту информацию выдрать, я не знаю.
Алик
В WenLin в конце каждой статьи есть Contents, выделяешь, затеняя мышкой, и копируешь в буфер Ctrl+C.
Спасибо.
Но тема не закрыта.
Pleco, если я правильно их понял, работает на мобильных устройствах, коих, увы, я не имею. Может быть есть версия для PC?
WenLin - что за штука? Стоит он свои 200 баксов? Да и неудобство, опять же, если я правильно понял, сайт www.wenlin.com предлагает купить CD, который они перешлют по почте 😞... - как то уже непривычно, хочется Download'а 🙂.
У разбалованных "достижениями ИТ" аппетит приходит во время еды - может быть кто-нибудь знает, где взять информацию пригодную для машинной обработки? Лень, знаете ли, в рукопашную...
Спасибо.Но тема не закрыта.
Pleco, если я правильно их понял, работает на мобильных устройствах, коих, увы, я не имею. Может быть есть версия для PC?
WenLin - что за штука? Стоит он свои 200 баксов? Да и неудобство, опять же, если я правильно понял, сайт www.wenlin.com предлагает купить CD, который они перешлют по почте 😞... - как то уже непривычно, хочется Download'а 🙂.
У разбалованных "достижениями ИТ" аппетит приходит во время еды - может быть кто-нибудь знает, где взять информацию пригодную для машинной обработки? Лень, знаете ли, в рукопашную...
Wenlin есть на rutracker.org и на uz-translations.su 😉
совершеннобесплатно 😎
есть программа
NJStar Chinese WP
которая бесплатно скачивается с сайта разработчика http://www.njstar.com/cms/njstar-chinese-word-processor
может вам подойдет
Я скачивал старую версию WenLin по чьей-то ссылке на форуме года 2 тому, очень ей доволен. Потом скачал портабельную версию без звука (звук поленился скачать), работает так же хорошо и весит 60 Мега вместо 700. Лично я считаю WenLin лучшим словарем для того, кто копается в странных иероглифах. Наверно самый большой запас, порядка 100 000. Надежный ввод любых иероглифов пером. Поиск по части иероглифа или по сочетанию нескольких компонентов. Поиск по пиньиню. Единственный словарь (насколько я знаю), позволяющий поиск рисованием пером для иероглифов в расширенных диапазонах SimSun. И т.д. и т.п.
Наверно самый большой запас, порядка 100 000.
Wenlin за пределы Unicode никогда не выходил - значит всяко не больше 70000.
И, вдобавок, весьма приличное количество иероглифов в Wenlin (в основном из Ext B) не имеет разложения на компоненты. Нельзя сказать, что работы в этом направлении прекратились, только вот новых версий Wenlin не видно уже довольно давно... 😞
Нашел где предлагался WenLin уважаемым Criptozavrом:
Китайский Язык: компьютеры, программы, шрифты, страница 3 (WenLin 3 с апдейтом). Как скопировать ссылку, не знаю, но найти, я думаю, можно. Она есть. Конец 2008 г.
Господа, спасибо за "наводку" на WenLin. Забавная вещица, и делу поможет, если схватиться в рукопашную, но:
1. Прав Fozzie - не для всех иероглифов есть "компоненты".
2. Копирование компонентов происходит прямо скажем, причудливо (как сказал anima***
выделяешь, затеняя мышкой, и копируешь в буфер Ctrl+C.
- в результате невозможно заранее угадать, сколько "компонентов" будет скопировано и какие из показанных компонентов по непонятным причинам изменятся при на вставке 😞).
3. Понятие "компонентов" в WenLin'е несколько отличается от того, что я имел ввиду в вопросе темы - в компоненты в WenLin'е включены и иероглифы. Как можно представить себе систему ВВОДА иероглифов на основе других иероглифов? Мнемотехника на такой основе - вполне законная и понятная вещь. Но не более.
Вообще, господа профессионалы, надежда есть ли найти некий "стандарт" раскладки иероглифов на ключи? Как вопрошал Михал Михалыч: "Он таки есть или его нет?". Или, как всегда - хочешь сделать хорошо, сделай сам?
Бог с ним, со "стандартом". Я согласен даже на "произвол", что надо - "поправим", лишь бы его можно было втащить в машину...
Да, поначалу раздражает способ копирования и ввода Ctrl+C и Ctrl+V, но потом привыкаешь. Зато очень удобный способ последовательного открытия окон с помощью Ctrl: при нажатии Ctrl появляется палец, если навести его на любое слово или иероглиф и щелкнуть, то появится его перевод. Например, навести так на вэнь в заставе и щелкнуть. Поэтому легко разбить любой появившийся сложный компонент хоть на атомы.
Причиной того, что компоненты исчезают может быть отсутствие у Вас нужного шрифта. Например, установлен ли расширенный SimSun? Также совершенно меняется иероглиф, если такого значка нет в Юникоде, при этом в описании указывается, что значок специально разработан для Вэньлиня. Но разбить его дальше можно, в итоге получив простые части.
Люди, делавшие Вэньлинь, явно торопились, кое-что упустили. Всегда можно найти части из соседнего похожего иероглифа, а в крайнем случае нарисовать нужные компоненты, в программе это делается просто. Зато Вэньлинь почти всегда может помочь найти нужный иероглиф, мне только изредка требовалось лезть в бумажный список всех иероглифов и искать глазами.
Вещь!
Как можно представить себе систему ВВОДА иероглифов на основе других иероглифов?
Рекурсивно, например, как в Cangjie. Если нужно ввести 唱 и мы уже знаем, что 口=R и 昌=AA, то RAA даст 唱.
Кстати, чем ваша система ввода отличается от Cangjie/Wubi?
иероглифов в расширенных диапазонах SimSun
SimSun - это шрифт.
Вы, наверное, имели в виду юникодовские Ext-A, Ext-B и т.д.?
У меня установлен шрифт SimSun Founder Extended, включающий в себя A и B.
Вообще, господа профессионалы, надежда есть ли найти некий "стандарт" раскладки иероглифов на ключи? Как вопрошал Михал Михалыч: "Он таки есть или его нет?". Или, как всегда - хочешь сделать хорошо, сделай сам?Бог с ним, со "стандартом". Я согласен даже на "произвол", что надо - "поправим", лишь бы его можно было втащить в машину...
не совсем понятно, что вы имеете в виду под стандартом.
но в любом случае о стандарте можно говорить только приближенно.
В разных словарях вы столкнетесь с разным количеством ключей, и с тем, что некоторые иероглифы ищутся по разным ключам.
Произвол какой- нибудь возможно и найдете. 😁
Уууу!... Как всё запущено! (С)
Wenlin вообще не нуждается ни в каких китайских шрифтах - все иероглифы он или отрисовывает собственным CDL-движком, или выводит встроенным битмап-фонтом (совершенно жуткого, надо сказать, вида).
Если есть всенепременнейшее желание искать иероглифы именно как наборы ключевых знаков, то можно воспользоваться, например, таким способом:
1. Меню "List" -> B. Radicals by number 1-214. Развернуть на весь экран.
2. Меню "List" -> 4. Characters containing components.
3. Ползаем по списку ключевых знаков (курсор при этом становится чёрным кружком), левым кликом выбирая интересующие, и (обязательно!) убирая появляющийся в строчке вместе с ключевым знаком технический мусор. Выбрав, таким образом, все необходимые ключевые знаки, жмём "OK".
Правда результаты, при количестве ключей более одного, совсем не ах...
3. Ползаем по списку ключевых знаков (курсор при этом становится чёрным кружком), левым кликом выбирая интересующие, и (обязательно!) убирая появляющийся в строчке вместе с ключевым знаком технический мусор. Выбрав, таким образом, все необходимые ключевые знаки, жмём "OK".Правда результаты, при количестве ключей более одного, совсем не ах...
...и это чудо природы кто- то считает "лучшим словарем для поиска иероглифов"? 😆
...и это чудо природы кто- то считает "лучшим словарем для поиска иероглифов"? 😆
В деле поиска иероглифов с большим количеством черт и/или повреждённых ему нет не то что равных - а и даже близко ничего не лежало... Просто приведённый мной способ, несколько искусственный, "под заказчика", реально же используются более простые и эффективные ("последовательного укрупнения компонентов" и т.п.).
...чем ваша система ввода отличается от Cangjie/Wubi?
"Cangjie decomposition is not based on traditional Kangxi radicals, nor is it based on standard stroke order; it is in fact a simple geometric decomposition". (http://en.wikipedia.org/wiki/Cangjie_method). Я же говорил о вводе иероглифов по ключам.
Полагаю, что китайский язык слабо восприимчив к "наскокам" варягов, подобных мне. Посему, желательно использовать способы более близкие к традиции. Существует список ключей, он ограничен (хотя и "плавает" в разных источниках). Но он есть и его можно использовать "не насилуя" традицию.
В двух словах: задача заключается в том, чтобы, имея список ключей, за три-пять щелчков мыши ввести в текстовое поле (или прямо в буфер обмена) любой иероглиф из наперед заданного списка иероглифов (в количестве 3 - 5 тыс. штук). Задача с технической стороны, прямо скажем, проще пареной репы. И была до меня реализована уже не однажды. Например, в упоминаемом уважаемымChina Red Devil'ом NJStar Chinese WP.Но.Мне хотелось иметьОТКРЫТЫЙсписок как ключей, так и иероглифов, хотелось иметь возможность править под себя и то, и другое. Таким образом эта "писалка" имеет еще и некоторый дидактический смысл 😉.
Пока я соображал, отозвалсяChina Red Devil:
не совсем понятно, что вы имеете в виду под стандартом.
но в любом случае о стандарте можно говорить только приближенно.
Потому то "стандарт" и закавычен.
В разных словарях вы столкнетесь с разным количеством ключей, и с тем, что некоторые иероглифы ищутся по разным ключам.
Вот это было бы вообще классно, если бы в словаре иероглиф можно было найтипо всемего ключам. Почему 泪 я нахожу по ключу氵, а по ключу 目- нет?. (Вопрос риторический отвечать не надо 😆) Потому, что 氵, в данном случае, действительно "ключ", а 目 - просто "дополнительный элемент, состоящий из 5-ти черт". (Поэтому, строго говоря, систему ввода по ключам следовало бы называть "ввод по элементам" или, что мне больше нравится, "ввод по графам", а сам список "ключей" в данном случае, следовало бы называть списком "графов".) Полагаю, что причина этого кроется в "технической бедности" бумажных словарей. Невозможно представить себе на бумаге этакие "многомерные кросс-таблицы", по которым иероглиф нужно было бы искать по пересечению трех, скажем, или четырех компонентов. Поэтому умные люди и придумали поиск по ключам. Но заставить делать это (искать иероглиф по любому графу) машину - пара пустяков!
Произвол какой- нибудь возможно и найдете. 😁
"Произвол" ведь тоже будет разумным., а значит его можно будет "мягко" подправить. Ведь никто не станет (из разумных соображений) отвергать, что 泅 состоит из 氵, 囗 и 人. И что эти три графаоднозначноидентифицируют иероглиф 泅 во всем массиве таковых.
Ребята, я не Катон, но «Карфаген должен быть разрушен» 🙂.
А посему настойчиво повторяю:Кто знает, где можно найти таблицу распределения ключей по иероглифам или готов таковую набросать - отзовитесь!
Насчет того, какой лучше, а какой хуже.
В общем-то это вопрос веры, каждый имеет право верить во что угодно. Я подхожу к этому делу с точки зрения удобства лично для меня, и чтобы у меня все було (искать в сети не всегда возможно). А из того что у меня есть ВэньЛинь единственный словарь, который не подведет. NJStar, всякие словари не для Лингвы, другие программки (удобные для других целей) просто не замечают иероглифы из расширенных диапазонов и поэтому в любой момент выдадут отказ. ВэньЛинь безотказный.
Попробуйте вот найти иероглиф с картинки моего профиля. Получится только в Вэньлине.
В двух словах: задача заключается в том, чтобы, имея список ключей, за три-пять щелчков мыши ввести в текстовое поле (или прямо в буфер обмена) любой иероглиф из наперед заданного списка иероглифов (в количестве 3 - 5 тыс. штук). Задача с технической стороны, прямо скажем, проще пареной репы.
Мне хотелось иметь ОТКРЫТЫЙ список как ключей, так и иероглифов, хотелось иметь возможность править под себя и то, и другое. Таким образом эта "писалка" имеет еще и некоторый дидактический смысл 😉.
Понятно, задача стала яснее.
Пока могу сказать, что видел в текстовом формате только открытый список иероглифов по одному ключу, типа:
氵: 汉 汗 涵
口: 回 阿 哦 叶
и тд и тп.
его где- то на форуме выкладывал Laotou
зы. насчет того, какой словарь лучше, пожалуй да, спорить смысла нет 🙂.
Ребята, я не Катон, но «Карфаген должен быть разрушен» 🙂.
А посему настойчиво повторяю: Кто знает, где можно найти таблицу распределения ключей по иероглифам...
Насколько мне известно, нечто подобное есть только здесь: http://www.wenlin.com/cdl/
Но вот насчёт доступности - не уверен. Некоторое время назад они собирались сделать CDL частью стандарта Unicode. На настоящее время к CDL-базе иероглифов есть on-line доступ через http://www.wenlin.com/cgi-bin/wenlinSVGhelp.pl
Я попытался получить туда логин - с меня зачем-то запросили CV... 🙄
Пока могу сказать, что видел в текстовом формате только открытый список иероглифов по одному ключу, типа:氵: 汉 汗 涵
口: 回 阿 哦 叶и тд и тп.
его где- то на форуме выкладывал Laotou
А в Wenlin такой список получается в три клика на ключ ("Radicals by number 1-214". Кликаешь на любой - получаешь список иероглифов для этого ключа. Ctrl-A, Ctrl-C - и, куда угодно (Word, Блокнот и т.п.) - Ctrl-V 😋
Понятно, что для посредственного надмозга со словарным запасом в несколько сотен иерогов этот список - просто манна небесная. Но для серьёзной научной работы он не слишком удобен.
А в Wenlin такой список получается в три клика на ключ ("Radicals by number 1-214". Кликаешь на любой - получаешь список иероглифов для этого ключа. Ctrl-A, Ctrl-C - и, куда угодно (Word, Блокнот и т.п.) - Ctrl-V 😋
"Правда результаты, при количестве ключей более одного, совсем не ах..."(с)- вот с этого места можно поподробнее? 😆
Понятно, что для посредственного надмозга со словарным запасом в несколько сотен иерогов этот список - просто манна небесная. Но для серьёзной научной работы он не слишком удобен.
Изучением вопросов жизнедеятельности посредственных надмозгов не занимался, не знаю. 😆
А для серьезной научной работы удобней всего китаец + Ханьюй Да Цзыдянь. 😋 😋
Ну и Fozzie, щиро дякую!
Я такого не знал. Там при кликании ключа внизу еще есть список из ExtB. Що iще треба?!