Автор Тема: Unicode 4.0.1  (Прочитано 24179 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Papa HuHu

  • Модератор
  • Заслуженный
  • *****
  • Сообщений: 6029
  • Карма: 157
  • Пол: Мужской
    • Папа ХуХу
Re: Unicode 4.0.1
« Ответ #25 : 08 Февраля 2004 00:00:24 »
1. по поводу "расписывания иерогов по чертам" - в принципе не совсем понятно, для чего это вообще нужно? только для учебных изданий, насколько я понимаю. Равно как шрифты с ударением для русских детских книг.
2. по поводу базы данных как я ее вижу.

мы имеем
а) таблицу иероглифов по его уникоду (то есть от шрифтов не зависим) (около 20,000 записей)
б) таблицу ключей и фонетиков - в общем составных частей (около 400-500 записей).
в) таблицу штрихов (около 20-30 записей)

потом просто посредством промежуточных таблиц создаем систему, где указываются какие записи из таблиц Б и В имеет каждая запись в таблице А. Плюс доп. инфо.
Таким образом, можно будет не ограницивать себя в поиске иерога по "установленным ключам" - достаточно ввести любой элемент (их совокупность), чтобы найти иерог.

то же самое для черт и их последовательности. Выбираем любой иерог и база нам говорит, какие черты и нем в какой последовательности пишутся. Чтобы она это отобразила нужет шрифт всего-то на 20-30 гнезд....(повторю, например у Мира уже такой есть). так что сделав такие мини-шрифтики для разных начертаний, можно иметь все что хошь - и не надо ваять мастодонтов.

База не сложна. Для японского языка ее делает Смоленский с Суси.ру (http://www.susi.ru/JERBDOK/) В принципе можно ее взять за основу (если автор разрешит, конечно) и дорабатывать....


Оффлайн Lunatic

  • Пионер
  • **
  • Сообщений: 76
  • Карма: 0
Re: Unicode 4.0.1
« Ответ #26 : 08 Февраля 2004 20:14:45 »
1. по поводу "расписывания иерогов по чертам" - в принципе не совсем понятно, для чего это вообще нужно? только для учебных изданий, насколько я понимаю. Равно как шрифты с ударением для русских детских книг.

Порядок черт нужен, естественно, только для учебных целей. А вот русские буквы с ударениями используются значительно шире: и в словарях, и в обычных текстах (бывает, от ударения зависит значение слова, например, бОльшим-большИм).

Ну и, между прочим, пусть каждый сам себе признается, знает ли он порядок черт! ;)
А ведь не зная правильный порядок черт, невозможно правильно писать иероглифы, особенно скорописью... Я уж молчу о том, что нельзя освоить каллиграфию...

Что касается "мастодонтов", то какой-нибудь SimSun Founder Extended или Arial MS Unicode никто таковыми не называет! Наоборот, очень полезные шрифты! Возможно, и "порядкочертовые" будут людям полезны!:)

В общем, просьба ко всем участникам и читателям: если вдруг найдете такую вещь, киньте ссылочку! :)
Заранее спасибо! :)
And if your head explodes with dark forebodings too...

Оффлайн renxy

  • Зарегистрированный
  • *
  • Сообщений: 24
  • Карма: 0
  • Пол: Мужской
Re: Unicode 4.0.1
« Ответ #27 : 14 Апреля 2004 02:15:41 »
Лунатик: где-то в другой ветки упоминался ocrat.com ;
туда же есть линк 'animated' на www.zhongwen.com

Вот интересно, как этот ократ устроен: неужели для каждого иероглифа анимированные гифы набирались вручную ?  ::)
Если там есть какая-то база данных, то черты должны храниться с каким-то масштабирующим фактором, точнее, с двумя - по вертикали и горизонтали, и с привязкой к месту  ???

Оффлайн CTAC

  • Бывалый
  • ***
  • Сообщений: 114
  • Карма: 4
  • Пол: Мужской
    • Китайско-российский центр
  • Skype: tepehtbeb
Re: Unicode 4.0.1
« Ответ #28 : 18 Апреля 2004 03:04:07 »
Да нет же, колееги, иероги на Ократе анимированы в формате гиф, анимация сделана для не более чем 2500 иероглифов - не более.
http://www.chinese-russian.com
ICQ:      339535
QQ: 139339535
Телефон: +7-9629169067

Оффлайн Fozzie

  • Заслуженный
  • *****
  • Сообщений: 702
  • Карма: 10
  • Пол: Мужской
Re: Unicode 4.0.1
« Ответ #29 : 19 Апреля 2004 17:38:10 »
A wenlin (3.1) между прочим умеет раскладывать на запчасти практически любые иероглифы!

Кто бы вскрыл механизм? :)
據梧

Оффлайн Lunatic

  • Пионер
  • **
  • Сообщений: 76
  • Карма: 0
Re: Unicode 4.0.1
« Ответ #30 : 20 Апреля 2004 07:36:34 »
A wenlin (3.1) между прочим умеет раскладывать на запчасти практически любые иероглифы!

Кто бы вскрыл механизм? :)

Папитка - нэ питка, правда, таварищ Берия? :)
Скажите, откуда скачать - попробуем вскрыть! ;)
And if your head explodes with dark forebodings too...

Оффлайн Fozzie

  • Заслуженный
  • *****
  • Сообщений: 702
  • Карма: 10
  • Пол: Мужской
Re: Unicode 4.0.1
« Ответ #31 : 20 Апреля 2004 17:03:38 »
Скажите, откуда скачать - попробуем вскрыть! ;)

Триал - понятное дело, с http://www.wenlin.com
А настоящую, собачью - либо ишачить (edonkey), либо с визитом в сераль принцесс московит или в криминальную столицу...  ;)
« Последнее редактирование: 20 Апреля 2004 17:04:34 от Fozzie »
據梧

Оффлайн roxfan

  • Новичок
  • *
  • Сообщений: 40
  • Карма: 0
Re: Unicode 4.0.1
« Ответ #32 : 09 Июня 2004 11:20:28 »
A wenlin (3.1) между прочим умеет раскладывать на запчасти практически любые иероглифы!
Кто бы вскрыл механизм? :)

Открываешь в Венлине аттач (возможно надо будет переименовать в .u8) и кликаешь на треугольник.
Дальше более-менее понятно.
« Последнее редактирование: 09 Июня 2004 11:20:59 от roxfan »

Оффлайн chamine

  • Бывалый
  • ***
  • Сообщений: 182
  • Карма: 2
  • Пол: Мужской
Re: Unicode 4.0.1
« Ответ #33 : 16 Июня 2004 15:33:55 »
А кто-нибудь знает что за иероглифы с кодами уникода 0х2хххх ??? очень они часто используются в китайском языке ???
Просто как-то из этого файла (unihan.txt) я повыдирал пиньинь, количество черт и перевод, но софт делал для КПК (Pocket PC), а там уникод только 16-ти битный, вот и интересно стало что же это за "лишние" символы ...
« Последнее редактирование: 16 Июня 2004 15:34:20 от chamine »
</life>

Оффлайн roxfan

  • Новичок
  • *
  • Сообщений: 40
  • Карма: 0
Re: Unicode 4.0.1
« Ответ #34 : 16 Июня 2004 18:30:10 »
Используй коды из колонки UTF-16, т.н. суррогаты.
Например: U+20000 = D840 DC00.
http://www.unicode.org/faq/utf_bom.html#34

Правда скорее всего на КПК они не покажутся, т.к. их нет в шрифтах.

Оффлайн Fozzie

  • Заслуженный
  • *****
  • Сообщений: 702
  • Карма: 10
  • Пол: Мужской
Re: Unicode 4.0.1
« Ответ #35 : 16 Июня 2004 20:10:48 »
Цитировать
А кто-нибудь знает что за иероглифы с кодами уникода 0х2хххх  очень они часто используются в китайском языке

В современном - крайне редко, не чаще чем "анадысь" и "хоцца" в русском :) Другое дело древнекитайский...

Цитировать
Правда скорее всего на КПК они не покажутся, т.к. их нет в шрифтах.

И в шрифтах нет и далеко не всякий софт корректно суррогаты обрабатывает, даже на обычном ПК.
據梧

Оффлайн chamine

  • Бывалый
  • ***
  • Сообщений: 182
  • Карма: 2
  • Пол: Мужской
Re: Unicode 4.0.1
« Ответ #36 : 16 Июня 2004 23:48:40 »
Насчет того что "на КПК их нет в шрифтах" это надо потестировать ...  хотя ... шрифт на 25 метров туда устанавливать конечно неохота  ;D особенно для моделей с 32Мб и меньше ОЗУ. Да и на чем тестировать? Взять где-нибудь файл с таким текстом? А какой? rtf что-ли?
Просто там (во всяком случае при программировании все (наконец-то ура! майкрософт сделал полностью уникодную операционку! при попытках использовать ansi - сильно ругается  ;D) элементы управления, то есть кнопки, надписи и самое главное - поле ввода используют 16-ти битный уникод, так что наверное кроме 16-ти бит ничего просто нельзя ввести чтобы далее программа анализировала ... Не писать же для этого свой input method  
« Последнее редактирование: 16 Июня 2004 23:58:36 от chamine »
</life>

Оффлайн Fozzie

  • Заслуженный
  • *****
  • Сообщений: 702
  • Карма: 10
  • Пол: Мужской
Re: Unicode 4.0.1
« Ответ #37 : 17 Июня 2004 04:10:30 »
хотя ... шрифт на 25 метров туда устанавливать конечно неохота
Вообще-то шрифт для интересующей нас области весит почти 42 mb...  :) и в нём еще примерно 6000 знаков недостаёт... Но полностью весь иероглифический раздел unicode не в один шрифт не влiзе - слишком много знаков.

Цитировать
Да и на чем тестировать? Взять где-нибудь файл с таким текстом? А какой? rtf что-ли?
Ежели окромя китайского знаком с программерскими наречиями - просто сгенерируй файл. Хоть rtf, хоть UTF...
« Последнее редактирование: 17 Июня 2004 04:11:59 от Fozzie »
據梧