Автор Тема: Вопросы верстки словарей  (Прочитано 27879 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн MiR

  • Модератор
  • Заслуженный
  • *****
  • Сообщений: 770
  • Карма: 10
  • Пол: Мужской
Вопросы верстки словарей
« : 09 Апреля 2002 09:56:19 »
Друзья!
Есть беда, нужен ваш совет! Вдруг кто-нибудь когда-нибудь сталкивался?..
Представляете себе, как делаются китайские словари? Когда готовы статьи, необходимо их рассортировать, сделать индекс и т. д. Интересно, какие программы делают это у китайцев... Ведь, наверняка, есть алгоритмы для сортировки слогов пиньиня, сортировки иероглифов по количеству черт  и т.д.
Если кому-нибудь попадалось что-то подобное, киньте линк, плиз!
« Последнее редактирование: 13 Июля 2003 04:41:06 от Papa_HuHu »
We play the game
With the bravery of being out of range...

Оффлайн MiR

  • Модератор
  • Заслуженный
  • *****
  • Сообщений: 770
  • Карма: 10
  • Пол: Мужской
Re: Пиньинь, количество черт и т. д.
« Ответ #1 : 13 Апреля 2002 21:54:11 »
Сат! Если можно, ко мне лучше на "ты"!:) Пожалуйста! Все-таки форум мы все вместе делали:)

Справиться с кодировками я постараюсь обязательно, мне за это деньги платят!:) Кстати говоря, я в "Муравье" работаю. Думаю, китаисту это название знакомо:)

Что касается слать или не слать, то слать обязательно! Как только появится возможность, благодарность мною будет выражена в самых достопочтительных формах.

Кстати, могу тоже поделиться скриптом, я в свое время делал под Ворд такую штуку для ввода пиньиня: вводится гласная, за ней номер тона, а потом макрос все эти гласные с цифирками заменяет на нужный символ из шрифта TonesTW. Отвечаю, это был самый быстрый способ ввода пиньиня!

Свой адрес пришлю мылом, не хочу, чтобы он в мэйлинг-листы попал...
« Последнее редактирование: 13 Апреля 2002 21:55:23 от MiR »
We play the game
With the bravery of being out of range...

Оффлайн Papa HuHu

  • Модератор
  • Заслуженный
  • *****
  • Сообщений: 6029
  • Карма: 157
  • Пол: Мужской
    • Папа ХуХу
Re: Пиньинь, количество черт и т. д.
« Ответ #2 : 13 Апреля 2002 22:36:01 »
Ильдар, прости, не совсем понимаю, что именно нужно? если проги, то опиши более детально какие (напримр верстальные или прочее) постараюсь найти в нете или на подприлавках...
если скрипты, то тоже опиши...это поиск в тексте с сортировкой? или поиск по листу значений?
в общем, сожалею, что не могу помочь, потому что не знаю....
а вот ссылка на большой .тхт файл, в котором есть многое.... посмотри....
http://users.erols.com/eepeter/chinesecomputing/data/byradical.html

или вот еще
http://users.erols.com/eepeter/chinesecomputing/data/bypinyin.html

ну и вообще, вот две общие ссылки, может ты там еще не был
http://www.chinesecomputing.com/
http://www.mandarintools.com/

Оффлайн Papa HuHu

  • Модератор
  • Заслуженный
  • *****
  • Сообщений: 6029
  • Карма: 157
  • Пол: Мужской
    • Папа ХуХу
Re: Пиньинь, количество черт и т. д.
« Ответ #3 : 14 Апреля 2002 04:33:34 »
Цитировать
автоматическим переводом упрощенного-традиционного написания

в ворде ХР с китайским add-on есть такая фича, я ей пользуюсь, потому что мой любимый ввод китайского глючит и могу писать только сложными.... потом перевожу в простые....

Оффлайн MiR

  • Модератор
  • Заслуженный
  • *****
  • Сообщений: 770
  • Карма: 10
  • Пол: Мужской
Re: Пиньинь, количество черт и т. д.
« Ответ #4 : 14 Апреля 2002 09:40:06 »
Друзья, спасибо за отклик!:)
2Алик: обязательно гляну, сегодня уже не получается - глаза слипаются... Только вернулся с дачи - устал... Вы еще помните, господа-заграничники, что в России есть такая странная привычка - выезжать на выходные за город?:)
2Сат: Спасибо огроменное! Особенно за теплые слова про контору:) Открою маленький производственный секрет, сейчас начинается работа над новым словарем. Правда, он ориентирован будет больше на студентов, но, я думаю, окажется довольно интересным и для зубров китаеведения:) Дело в том, что в нем будут действительно новые слова, которые в словари еще не успели попасть, но в жизни очень нужны...
« Последнее редактирование: 14 Апреля 2002 09:46:48 от MiR »
We play the game
With the bravery of being out of range...

Оффлайн Papa HuHu

  • Модератор
  • Заслуженный
  • *****
  • Сообщений: 6029
  • Карма: 157
  • Пол: Мужской
    • Папа ХуХу
Re: Пиньинь, количество черт и т. д.
« Ответ #5 : 14 Апреля 2002 17:59:05 »
типа?

Оффлайн MiR

  • Модератор
  • Заслуженный
  • *****
  • Сообщений: 770
  • Карма: 10
  • Пол: Мужской
Re: Пиньинь, количество черт и т. д.
« Ответ #6 : 14 Апреля 2002 22:59:55 »
Цитировать
типа?

Ээээ... Не понял, это к чему относилось?:)
Хорошо, что нас китайцы не читают, а то бы сейчас встрепенулись от знакомого слова:)
We play the game
With the bravery of being out of range...

Оффлайн Papa HuHu

  • Модератор
  • Заслуженный
  • *****
  • Сообщений: 6029
  • Карма: 157
  • Пол: Мужской
    • Папа ХуХу
Re: Пиньинь, количество черт и т. д.
« Ответ #7 : 07 Мая 2002 16:51:47 »
МиР, пож, подкинь мне макрос для пинииня!
Sat Abhava, пож, подкинь мне мысль, каким шрифтом лучше писать пининь, чтобы он отражался и в ворде и чтобы легко можно было его переносить в ХТМЛ!
Спасибо!

SVA

  • Гость
Re: Пиньинь, количество черт и т. д.
« Ответ #8 : 11 Июня 2002 20:24:01 »
Сначала о пиньине:

Слишком глубоко я этот вопрос не копал, но для себя нашел простой способ ввода пиньинь в Word без всяких скриптов, шрифтов и дополнительных программ. Подробнее на моей страничке ruanjian.by.ru. Неплохой также способ воспользоваться макросом для Word, который бы перегонял цифры в знак тона. Готовый макрос я брал на http://www.mandarintools.com/. (Правда в нем мне 3-й тон не понравился, плоский какой-то). Что касается html, то я на своей странице просто вводил конкретный код буквы с соответствующим знаком тона. Коды смотрел, по-моему, в таблице символов из того же Ворда. Наверное, где-то можно и полный список кодов найти.

Теперь о словаре:

Если набор идет в Ворде, то, по-моему, проще всего это делать в виде таблицы. А уж отсортировать таблицу по любому из полей это раз плюнуть. Правда я не знаю, как поведет себя Ворд если словарь на несколько тысяч статей. Я когда диплом писал, у меня в приложении словарь был на 1000 слов. Так в то время я прекрасно сделал все на русской Windows 3.11 и Word 6.0. А современные версии Ворда поддерживают сортировку китайского текста и по алфавиту и по чертам (даже русская версия Ворд 2000, не говоря уже о ХР и китайских версиях). Конечно специальные программы сделали бы это лучше, но о них я ничего не слышал.
Если набор идет не в Ворде, то сначала нужно узнать в чем.

И вопрос:

Кто-нибудь знает, где можно взять Microsoft Office XP Proofing Tools или хотя бы Китайский MUI для Office XP (Office Multilingual User Interface Pack), в нем те же средства для китайского языка должны быть, что и в Proofing Tools? Или может еще чего присоветуете, чтобы, не устанавливая китайский Офис, пользоваться всеми его приимуществами?

Оффлайн Papa HuHu

  • Модератор
  • Заслуженный
  • *****
  • Сообщений: 6029
  • Карма: 157
  • Пол: Мужской
    • Папа ХуХу
Re: Пиньинь, количество черт и т. д.
« Ответ #9 : 12 Июня 2002 12:50:28 »
Кстати, то что я видел продается всегда такой пачкой - Оффис ХР английский + диск Профинг Тулс (там китайские шрифты, интерфейс, справка на китайском, ввод УБиДзы, перевод с Упр на Трад и обратно и немного прочего). Так что в поднебесной такое купить можно запросто.... а в других местах не знаю.....

SVA

  • Гость
Proofing Tools (Chinese)
« Ответ #10 : 13 Июня 2002 18:35:25 »
  В том то и дело, что я не в Китае... А отечественные пираты не удосужились это дело выпустить... (Кому они нужны эти иностранные языки :-/?)
  Я думал, может кто подскажет, где это в интернете можно взять.
  Ладно что-нибудь придумаю, например, попробую из китайского офиса вытащить. Где-то диск валялся...

Оффлайн Papa HuHu

  • Модератор
  • Заслуженный
  • *****
  • Сообщений: 6029
  • Карма: 157
  • Пол: Мужской
    • Папа ХуХу
Re: Пиньинь, количество черт и т. д.
« Ответ #11 : 14 Июня 2002 13:07:00 »
ну, если хош, то я по мылу перешлю....или на сервер какой закачаю....
только ежли ты на дайл-апе, то долговато сие будет....

SVA

  • Гость
Re: Пиньинь, количество черт и т. д.
« Ответ #12 : 14 Июня 2002 19:11:30 »
Цитировать
ну, если хош, то я по мылу перешлю....или на сервер какой закачаю....
только ежли ты на дайл-апе, то долговато сие будет....


За предложение спасибо. Но пока погодим. Знакомый в Китай поехал. Может привезет. А вообще у нас LAN. Но это сколько писем то получится? Полный Proofing Tools (для всех языков) целый компакт занимает. Или у тебя только китайский?
Если что, я на мэйл напишу.


Оффлайн Papa HuHu

  • Модератор
  • Заслуженный
  • *****
  • Сообщений: 6029
  • Карма: 157
  • Пол: Мужской
    • Папа ХуХу
Re: Пиньинь, количество черт и т. д.
« Ответ #13 : 15 Июня 2002 18:41:08 »
только китайский....  мегов 300.... у тебя есть какой-либо фтп сервер? я тебе закачаю....

SVA

  • Гость
Re: Пиньинь, количество черт и т. д.
« Ответ #14 : 15 Июня 2002 19:24:22 »
Нету. Подожду пока. Может из Китая привезут.

Оффлайн Silvester

  • Профессионал
  • ****
  • Сообщений: 369
  • Карма: 2
  • Пол: Мужской
Re: Пиньинь, количество черт и т. д.
« Ответ #15 : 09 Июля 2002 12:13:04 »
Цитировать
Кстати говоря, я в "Муравье" работаю.

У вас отличная брошюрка вышла - "Китайский фольклор". Есть ли возможность выложить её куда-нибудь на сайт?

Цитировать
 
Кстати, могу тоже поделиться скриптом, я в свое время делал под Ворд такую штуку для ввода пиньиня: вводится гласная, за ней номер тона, а потом макрос все эти гласные с цифирками заменяет на нужный символ из шрифта TonesTW. Отвечаю, это был самый быстрый способ ввода пиньиня!

Да всё гораздо проще. В отдельный шаблон Ворда для каждой гласной устанавливаются по 4 "быстрые клавиши", вводящие её с нужной диакритикой. Потом к нужному документу этот шаблон прикрепляется - и вперёд! Никаких макросов.
Реальность - лишь частный случай абстракции!

Оффлайн MiR

  • Модератор
  • Заслуженный
  • *****
  • Сообщений: 770
  • Карма: 10
  • Пол: Мужской
Re: Пиньинь, количество черт и т. д.
« Ответ #16 : 10 Июля 2002 07:21:43 »
Цитировать

У вас отличная брошюрка вышла - "Китайский фольклор". Есть ли возможность выложить её куда-нибудь на сайт?


Целиком выложить вряд ли получится... Авторские права всякие-разные:) Но идея создания библиотечки на муравьином сайте витает уже давно...

Цитировать

Да всё гораздо проще. В отдельный шаблон Ворда для каждой гласной устанавливаются по 4 "быстрые клавиши", вводящие её с нужной диакритикой. Потом к нужному документу этот шаблон прикрепляется - и вперёд! Никаких макросов.


Сейчас самой большой проблемой является сортировка слогов... Ну, чтобы корректно сортировались гласные с тонами, а самое главное - различались слоги разной длины... В общем, когда-нибудь я все-таки сам напишу такую прогу:)
We play the game
With the bravery of being out of range...

Оффлайн Silvester

  • Профессионал
  • ****
  • Сообщений: 369
  • Карма: 2
  • Пол: Мужской
Re: Пиньинь, количество черт и т. д.
« Ответ #17 : 14 Июля 2002 11:47:26 »
Цитировать
Сейчас самой большой проблемой является сортировка слогов... Ну, чтобы корректно сортировались гласные с тонами, а самое главное - различались слоги разной длины...

А может, ну их - слога-то, академизм всё это? И сортировать просто по буквам?
Реальность - лишь частный случай абстракции!

Оффлайн Papa HuHu

  • Модератор
  • Заслуженный
  • *****
  • Сообщений: 6029
  • Карма: 157
  • Пол: Мужской
    • Папа ХуХу
Re: Пиньинь, количество черт и т. д.
« Ответ #18 : 14 Июля 2002 13:33:52 »
МиР, ты имел ввиду чтобы прога сама знала, над какой буквой в слоге mian ставить знак тона, над "i" или над "a"? так в принципе просто макрос сделать... какую сортировку ты имеешь в виду?

Оффлайн MiR

  • Модератор
  • Заслуженный
  • *****
  • Сообщений: 770
  • Карма: 10
  • Пол: Мужской
Re: Пиньинь, количество черт и т. д.
« Ответ #19 : 15 Июля 2002 07:38:39 »
Цитировать
МиР, ты имел ввиду чтобы прога сама знала, над какой буквой в слоге mian ставить знак тона, над "i" или над "a"? так в принципе просто макрос сделать... какую сортировку ты имеешь в виду?


Ну, представь: у тебя есть учебник, в каждом уроке учебника дается словарь новых слов, в конце надо сделать сводный словарь... Теперь представь, стандартный алгоритм сортировки расставит слова так: mang, manmanchi
А должно быть наоборот, потому что слог man должен стоять раньше mang...
We play the game
With the bravery of being out of range...

Оффлайн SVA

  • Новичок
  • *
  • Сообщений: 47
  • Карма: 0
  • Пол: Мужской
Re: Пиньинь, количество черт и т. д.
« Ответ #20 : 19 Июля 2002 19:46:46 »
Цитировать

Сейчас самой большой проблемой является сортировка слогов... Ну, чтобы корректно сортировались гласные с тонами, а самое главное - различались слоги разной длины... В общем, когда-нибудь я все-таки сам напишу такую прогу:)

Цитировать
стандартный алгоритм сортировки расставит слова так: mang, manmanchi
А должно быть наоборот, потому что слог man должен стоять раньше mang


По-моему я уже об этом писал, но, тем не менее … Совет такой:
А зачем сортировать по транскрипции?  ???
Кто мешает отсортировать по иероглифам?
Такая сортировка работает даже в русских версиях Word 2000 и XP. Сортировать можно как по чертам, так и по ЧТЕНИЮ.

Сделай словарь в виде таблицы, а затем отсортируй ее по колонке с иероглифами. Правда, если в словарь включены иероглифы с двумя или более вариантами чтения, и эти иероглифы идут сами по себе, а не в составе слов, то тут возможны ошибки. Но это, думаю, можно будет и руками поправить. Или как-нибудь иначе выкрутится.
« Последнее редактирование: 19 Июля 2002 19:57:57 от SVA »

Оффлайн MiR

  • Модератор
  • Заслуженный
  • *****
  • Сообщений: 770
  • Карма: 10
  • Пол: Мужской
Re: Пиньинь, количество черт и т. д.
« Ответ #21 : 19 Июля 2002 19:49:43 »
Цитировать
Совет такой:
А зачем сортировать по транскрипции?  ???
Кто мешает отсортировать по иероглифам?


Спасибо! Попробую!
We play the game
With the bravery of being out of range...

Оффлайн Papa HuHu

  • Модератор
  • Заслуженный
  • *****
  • Сообщений: 6029
  • Карма: 157
  • Пол: Мужской
    • Папа ХуХу
Re: Пиньинь, количество черт и т. д.
« Ответ #22 : 28 Июля 2002 04:37:14 »
для тех в кого есть Оффис ХР с китайской надстройкой... все ли знают что там есть СУПЕР ФИЧА - пин-ин для иероглифов. То есть он вам подсказывает чтение и тон иероглифа (в словарь не надо смотреть), а также пишет иероглифы прямо с пин-инем сверху... причем все интеллигентно - узнает слова и выдает варианты если прочтений больше одного!
Фича эта вот здесь: Format - Asian Layout - Phonetic Guide

выделяете иероглиф и жмете туда - и, о чудо, появляется пин-ин!

xander

  • Гость
Re: Proofing Tools (Chinese)
« Ответ #23 : 31 Августа 2002 10:12:15 »
SVA: Насчет Office XP Proofing Tools в Интернете; видел завлекаловку по адресу: http://www.3dcenter.ru/perl/magiks/news/zcomment.cgi?article=EpEuyZpyZVzptMZKyo. Обещают в скором времени сделать скачиваемым, правда обещание это давно уже пылью покрылось.
Есть вопрос: словари навроде TransWhiz, и им подобных на пиратских дисках где-либо существуют?

Герман Дудченко

  • Гость
Re: Пиньинь, количество черт и т. д.
« Ответ #24 : 08 Сентября 2002 17:01:57 »
Я все делаю в ручную. Конечно, так дольше, но зато как надо!