Восточное Полушарие
Китайский форум => Китайский язык: письменность, изучение, диалекты, вэньянь => Китайский Язык: компьютеры, программы, шрифты => Тема начата: pnkv от 13 Августа 2004 00:22:53
-
Или возьмите бесплатную программу Wakan. Она тоже использует словарь CEDICT + в ней имеется куча разных других полезных features (например, хороший поиск иероглифов по основному набору Unicode :) Самое лучшее из того, что мне приходилось видеть.
Все здесь
http://wakan.manga.cz
-
А можно ее русифицировать, не интерфейс, конечно, а сам механизм всплывающих подсказок? Я смотрю там текстовые файлы.
-
Хотя и русификация интерфейса , судя по папке «LNG» не должна представлять труда для знающих людей.
-
Угу, русифицировать довольно просто. А что в механизме всплывающих подсказок требует русификации?
-
Угу, русифицировать довольно просто. А что в механизме всплывающих подсказок требует русификации?
Да это я просто по-идиотски выразился. Русифицировать нужно конечно английский перевод китайский иероглифов. И еще вопрос, насколько большой текст можно в этот перевод засунуть. Так как у нас есть частично распознанный БКРС, который можно было бы использовать для русификации, но статьи с переводами отдельных иероглифов у него порой достаточно большие. Если бы кто взялся за такое благое дело, то файл из БКРС я бы ему подготовил.
-
Так как у нас есть частично распознанный БКРС, который можно было бы использовать для русификации, но статьи с переводами отдельных иероглифов у него порой достаточно большие. Если бы кто взялся за такое благое дело, то файл из БКРС я бы ему подготовил.
Как понимаю, туда можно добавлять словари в EDICT формате.
Я как раз собираюсь увеличить имеющийся словарь. Дело в том, у меня есть китайско-английский словарь в текстовом формате. Он содержит около 74 000 слов (CEDICT где то 20 000). Проблема только перевести всё в EDICT формат.
Можно попытаться сделать и китайско-русский, тут нужно поэкспериментировать.
Vladas
-
Да - он затягивает файлы Edict'а причем в разных кодировках - но увы >:( разработчики по всей видимости вставили фильтрование перевода только по англ. буквам и соответственно русские (и не только) выбрасывает. Короче китайско-русский словарь в него видимо не запихать ... хм ... а жаль
И еще у этой программы есть некоторый недостаток - если в виндузе локаль не китайская - то он не позволяет набрать слово на китайском ... хотя позволяет вставлять из буфера ... нехорошо ...
2Олег: я так понял вы делаете КРС в файлы которые понимает лингво ... а чем плох лингво? он что-то не позволяет что позволяет wakan?
-
2Олег: я так понял вы делаете КРС в файлы которые понимает лингво ... а чем плох лингво? он что-то не позволяет что позволяет wakan?
От wakan у меня пока чисто поверхностные впечатления от тыканья кнопками в течение десяти минут, но мне показалось, что ее возможности одновременно и шире и уже, чем у лингво. Поэтому не готов еще говорить о ее достоинствах и недостатках.
-
Дело в том, у меня есть китайско-английский словарь в текстовом формате. Он содержит около 74 000 слов (CEDICT где то 20 000). Проблема только перевести всё в EDICT формат.
Vladas
А не поделишься? (перевести-то оно как раз не такая сложная вещь ;D ... главное достать :-/)
-
Да - он затягивает файлы Edict'а причем в разных кодировках - но увы >:( разработчики по всей видимости вставили фильтрование перевода только по англ. буквам и соответственно русские (и не только) выбрасывает.
А вот если поменять шрифт в Complete Unicode Font на Arial Unicode, тогда русские буквы показывает в окне буфера обмена. Возможно, удастся и импортировать файл. А MingLiu не имеет кирилицы.
Vladas
-
Об этом я что-то не подумал ;D
Осталось самое трудное - разжиться электронной словарной базой кит.-рус. словаря ...
Но подумав - а стоит оно вообще это делать ... Если есть под рукой эл. база словарная и еще в понятном формате - можно и свой простой словарь вроде цибы написать а не мучать чужой софт ... вот только где бы стянуть большую такую базу ... например с гэ-софтовского (www.ge-soft.com) расковырять бы ее, где-то у меня он валялся раньше - вроде там и база очень даже немаленькая, боюсь правда что расковырять ее будет трудно (таки ценой он в 270 реньменьбей, наверное и защита кое-какая есть...)
-
Об этом я что-то не подумал ;D
Так получилось импортировать файл с русским текстом?
Мне пока нет. Правда локаль не русская стоит, может это тоже мешает. Попробую позднее под русской локалью.
Vladas
-
Осталось самое трудное - разжиться электронной словарной базой кит.-рус. словаря ...
Могу вам для экспериментов скинут на мыло вордовский файл первых 50 страниц БКРС. Если удастся его использовать, не вижу причин предоставить все, на данный момент вычитанные файлы.
-
А не поделишься? (перевести-то оно как раз не такая сложная вещь ;D ... главное достать :-/)
Могу поделиться. Весит в архиве 2 Мб. Напиши мне приватно, куда скинуть. Может что нибудь придумаем насчёт формата.
Vladas
-
Не ... при импорте файла с русскими буковками wakan теряет эти самые русские буквы ... так что похоже облом ...
2Олег: у вас БКРС электронизируется полностью? остается только текст без сканеных изображений? кинь одну страницу ради интереса ...
2Vladas: что-то небольшой файл ... но кинь если не жалко трафика ...
caa@rosenergo.com
-
Не ... при импорте файла с русскими буковками wakan теряет эти самые русские буквы ... так что похоже облом ...
2Vladas: что-то небольшой файл ... но кинь если не жалко трафика ...
Я искал на WaKan форуме решения, но пока не нашёл. Напишу запрос автору, может добавит поддержку русского языка.
Файл отправлю. Он не такой малый :-). Тот самый CEDICT в архиве занимает только 500 кб.
Vladas
-
:o неплохой вполне файл ... ну спасибо большое :) ... я его переделаю в CEDICT уникодный формат ... ::) и тогда можно будет его скормить либо wakan'у либо CQuickTrans'у либо каким другим программам понимающим такой формат
-
Не ... при импорте файла с русскими буковками wakan теряет эти самые русские буквы ... так что похоже облом ...
А вы видели этот совет перед подключением словаря в формате Edict?
For encodings different than "Unicode 16-bit" you need the UNICONV utility in the current directory.
This utility can be downloaded from
ftp.cc.monash.edu.au/pub/nihongo/uniconv.zip.
Сначала конвертируете файл, потом попробуйте подключить.
-
For encodings different than "Unicode 16-bit" you need the UNICONV utility in the current directory.
This utility can be downloaded from
ftp.cc.monash.edu.au/pub/nihongo/uniconv.zip.
Сначала конвертируете файл, потом попробуйте подключить.
Это я сделал - не помогает.
Vladas
-
:o неплохой вполне файл ... ну спасибо большое :) ... я его переделаю в CEDICT уникодный формат ... ::) и тогда можно будет его скормить либо wakan'у либо CQuickTrans'у либо каким другим программам понимающим такой формат
Как собираешься его обрабатывать, если не секрет?
Когда сделаешь, скин мне пожалуйста результат.
Vladas
-
2Олег: у вас БКРС электронизируется полностью? остается только текст без сканеных изображений? кинь одну
Точно.
Отправляю.
-
Как собираешься его обрабатывать, если не секрет?
Когда сделаешь, скин мне пожалуйста результат.
На следующей неделе будет (дома на выходных нет желания что-либо делать на компе). Скину конечно результат.
2Олег: :o Ого ... Качественно однако! ... Просто хочу сделать такой маленький кит.-англ. словарик на Pocket PC (уже есть первый вариант, надо ему базы только расширить по полной) ... а то почему-то меня не удовлетворяет по некоторым параметрам то что имеется из бесплатного для этой платформы ... ну и заодно интересно попробовать туда засунуть кит.-рус. базу ... а то все английский да английский :-/
-
Ну вот собственно результаты такие ... С помощью Vladas'а удалось конвертировать пару китайско-английск. словарей в формат edict'a и дать покушать wakan'у ... Словарей было несколько и результаты тоже разные
1) кит.-англ. словарик с ~74000 терминами и транскрипция со значками тонов - он скушал, но обнаружилось что такую транскрипцию он не понял и выводилось все в вопросительных знаках
2) кит.-англ. словарик с 74000 (такой же как выше), только транскрипция с циферным обозначением тонов - вроде скушал и даже заработал, но некоторые переводы слов, там где в переводе встречались "неанглийские" символы и уникод - испортились
3) кит.-англ. словарик с 200000 терминами ::) ... :'( wakan конвертировал его целый час и благополучно помер так ничего и не сконвертировав ...
4) кит.-рус. БКРС от Олега - конвертируется, но не отображается по причине того что wakan игнорирует "неанглийские" символы (уникод) в полях транскрипции и перевода
2Vladas: еще немного потестирую и подправлю кое-где сконвертированные твои словари и тебе отошлю
-
Wakan обновился. :D
Все качаем новую версию.
1.60 (9/24/04)
Список изменений
http://wakan.manga.cz/?page=history&lang=en
-
Wakan обновился
1.61 (10/16/04)
-
Доброго времени суток.
Прежде всего хочу сказать что Вакан обновился до 1.67.
И хочу спросить как его заставить печатать упрощенные иероглифы, при распечатке карточек?
Спасибо за внимание :)