Автор Тема: Простой конвертер для корейского алфавита.  (Прочитано 34766 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Anatoli

  • Заслуженный
  • *****
  • Сообщений: 1481
  • Карма: 41
  • Пол: Мужской
    • Studying Chinese Language and Chinese Culture
Anatoli
Спасибо за исходник преобразующей функции! У меня такой чисто технический вопрос - в C++ как вы работаете с Юникодом - наверное есть готовые библиотеки для этого дела?  :)  Мне это тоже сейчас вдруг неожиданно сильно понадобилось, а на Жабе я писать по разным причинам не хочу, да и знаю я её весьма плохо - хотелось чтобы на C++, но не знаю как там с юникодом работать... Хотя может уже есть встроенные средства.


Это C#, а не C++. Юникод там просто работает, только файл кода надо сохранить как юникод.
千里の道も一歩より始まる (senri-no michi-mo ippo-yori hajimaru)
千里之行, 始于足下 (qian li zhi xing, shi yu zu xia)
رحلة الألف ميل تبدأ بخطوة واحدة (riHlatu l-'alfi miili tabda'u bi-khaTwati waaHidati)

Оффлайн Anatoli

  • Заслуженный
  • *****
  • Сообщений: 1481
  • Карма: 41
  • Пол: Мужской
    • Studying Chinese Language and Chinese Culture
Ksen, а вы добились обратной конверсии, например из латиницы в хангыль, если разделитель символов использовать? Если да то как попробовать. Кстати, ваш JavaScript только в MS Internet Explorer работает, Mozilla Fierfox почему-то его не берет.
rom_syl={};
for(var i=44032; i<=44032+11171; i++) {
var ch=String.fromCharCode(i);
rom_syl[han2rom(ch)]=ch
}

—"перевод" всех символов Хангыль сохраняется в ассоциативном массиве rom_syl, так, что
rom_syl["guk"]=='국'
(или rom_syl_ru["кук"]=='국')

Этот массив и используется для перекодировки.

Спасибо, попробую  :)
千里の道も一歩より始まる (senri-no michi-mo ippo-yori hajimaru)
千里之行, 始于足下 (qian li zhi xing, shi yu zu xia)
رحلة الألف ميل تبدأ بخطوة واحدة (riHlatu l-'alfi miili tabda'u bi-khaTwati waaHidati)

Оффлайн ksen

  • Бывалый
  • ***
  • Сообщений: 221
  • Карма: 6
Да, а в мозилле мой скрипт не работает, потому что он зашифрован для IE:

<SCRIPT LANGUAGE="JScript.Encode">
han_cons=['g','kk','n','d','tt','r','m','b','pp','s','ss','','j','jj','ch','k','t','p','h'];

...

//**Start Encode**#@~^[email protected]#@&0;   mDkW   PkODyNnmv/O.*   @#@&7\mDPm..'][email protected]#@&dWGM`-lM~
etc.

Я большой поклонник скриптовых языков типа JavaScript и PHP: будучи в тысячи раз медленнее С(++), они имеют мощный набор откомпилированных подпрограмм для разботы со строками и регулярными выражениями, так что JScript под силу, скажем, загрузить за 5 с. 30Мб словарь, за 30 с. построить к нему индекс, и делать подстрочники _с морфопарсингом_ корейских предложений со скоростью ~300 слов в секунду.

Оффлайн ksen

  • Бывалый
  • ***
  • Сообщений: 221
  • Карма: 6
Вообще, у меня мечта сделать вьюер основных текстовых форматов словарей - Lingvo, Cebit, Shoebox, DML (их., оказывается, несколько). И, все-таки, не на JavaScript.
Но сам освоить чего-то типа С++/Java/С# я, скорее всего, не смогу - слишком крутая там learning curve.
Вот если бы были уже продвинутые кодеры, ответственные за GUI etc., можно было бы заделать какой-нибудь opensource :)
Мои наработки:
--морфологический анализатор корейского
--морфологический анализатор языка лакота
--простой синтаксический парсер
--перекодировщики "на лету" из DSL в HTML

Я делал и "движки" на основе Flash-ActionScript-PHP-MySQL: http://iyapi.net/search/dictionary.html
(логин/пароль там не действует, нажимайте кнопку Let me in)
начните печатать в что-нибудь типа wahachanka (или вахачханка)- флеш-ролик связывается с серверной MySQL через PHP и выдает результат.
Что-то типа новомодного AJAX, но я это сделал еще до появления термина :)

А вот вариант со связкаой HTML-JavaScript-PHP-MySQL (можно проверить на "ma" )
http://lol.iyapi.net/dictionary.html

--А вот пример публикации текста:
http://lol.iyapi.net/bomd.php
Обратите внимание на разнообразие форм презентации текста (Format:), орфографии итп.

Это я все к тому, что подобное можно "забацать" и для CJK...
Константин Виолован
« Последнее редактирование: 03 Мая 2006 18:50:11 от ksen »

Оффлайн Anatoli

  • Заслуженный
  • *****
  • Сообщений: 1481
  • Карма: 41
  • Пол: Мужской
    • Studying Chinese Language and Chinese Culture
Мне иногда JavaScript сложнее мощных языков программирования кажутся. Поэтому ваш код не сильно понимаю. Просто не присле разобраться еще.

Константин, извините не по теме, а почему у вас в профиле женский пол стоит? Еще и аватар женский. Извините, в начале думал, что вы женщина.

Приятно познакомиться. Вы где находитесь-то?
千里の道も一歩より始まる (senri-no michi-mo ippo-yori hajimaru)
千里之行, 始于足下 (qian li zhi xing, shi yu zu xia)
رحلة الألف ميل تبدأ بخطوة واحدة (riHlatu l-'alfi miili tabda'u bi-khaTwati waaHidati)

Оффлайн ksen

  • Бывалый
  • ***
  • Сообщений: 221
  • Карма: 6
Мне иногда JavaScript сложнее мощных языков программирования кажутся. Поэтому ваш код не сильно понимаю. Просто не присле разобраться еще.
--Ну, вообще-то "ядро" JavaScript - упрощенный, нетипизированный C++/Java. Вы, например, чтобы проверить наличие элемента асс. массива "ловите исключение":

try { t = rTails[expression]; }
catch (IndexOutOfRangeException ex) { t = ""; }

на JavaScript это можно записать так:

t = rTails[expression] || ""

--Что сложнее? :)


Константин, извините не по теме, а почему у вас в профиле женский пол стоит? Еще и аватар женский. Извините, в начале думал, что вы женщина.
Приятно познакомиться. Вы где находитесь-то?

--Ну, этот вход - моей жены, вообще-то :) А так, очень удобно оказалось - женщин ведь не бьют на форумах :)
Я нахожусь в Москве и Московской области :)

Оффлайн CTAC

  • Бывалый
  • ***
  • Сообщений: 114
  • Карма: 4
  • Пол: Мужской
    • Китайско-российский центр
  • Skype: tepehtbeb
Re: Простой конвертер для корейского алфавита.
« Ответ #31 : 04 Февраля 2010 08:48:31 »
Всем доброго дня!
Я работаю над китайско-русским словарём, в словарные статьи для иероглифов которого в настоящее время пытаюсь внедрить корейские чтения иероглифов в записи хангылем, латиницей и кириллицей. В деле автоматической конвертации латинских записей в кириллические мне и требуется помощь специалистов. Буду признателен за любое содействие.

Формат таблицы:
Юникод иероглифаИероглифРомадзяHun/EumКириллица для Hun/EumEum (romaja)Eum hangulКириллица для Eum
4E00IL한 일пустоilпусто
И так далее.
Готов отправить файл любому, кто выразит желание помочь.

http://www.chinese-russian.com
ICQ:      339535
QQ: 139339535
Телефон: +7-9629169067

Оффлайн Anatoli

  • Заслуженный
  • *****
  • Сообщений: 1481
  • Карма: 41
  • Пол: Мужской
    • Studying Chinese Language and Chinese Culture
Re: Простой конвертер для корейского алфавита.
« Ответ #32 : 04 Февраля 2010 09:24:04 »
Всем доброго дня!
Я работаю над китайско-русским словарём, в словарные статьи для иероглифов которого в настоящее время пытаюсь внедрить корейские чтения иероглифов в записи хангылем, латиницей и кириллицей. В деле автоматической конвертации латинских записей в кириллические мне и требуется помощь специалистов. Буду признателен за любое содействие.

Формат таблицы:
Юникод иероглифаИероглифРомадзяHun/EumКириллица для Hun/EumEum (romaja)Eum hangulКириллица для Eum
4E00IL한 일пустоilпусто
И так далее.
Готов отправить файл любому, кто выразит желание помочь.
Чтения на корейском можно найти в английском Викисловаре (просто ставьте в поиск, ищите корейский раздел)):
http://en.wiktionary.org/wiki/Wiktionary:Main_Page

В кириллицу:
http://ru.wikipedia.org/wiki/Система_Концевича
千里の道も一歩より始まる (senri-no michi-mo ippo-yori hajimaru)
千里之行, 始于足下 (qian li zhi xing, shi yu zu xia)
رحلة الألف ميل تبدأ بخطوة واحدة (riHlatu l-'alfi miili tabda'u bi-khaTwati waaHidati)

Оффлайн CTAC

  • Бывалый
  • ***
  • Сообщений: 114
  • Карма: 4
  • Пол: Мужской
    • Китайско-российский центр
  • Skype: tepehtbeb
Всем спасибо, справился любительским способом, но при этом более-менее автоматическим, чем горжусь ужасно. Скоро выложу.
http://www.chinese-russian.com
ICQ:      339535
QQ: 139339535
Телефон: +7-9629169067

Оффлайн Mad-Rogue

  • Новичок
  • *
  • Сообщений: 32
  • Карма: 1
  • Пол: Мужской
    • Rogue-Laboratory
  • Skype: Managedark
Re: Простой конвертер для корейского алфавита.
« Ответ #34 : 20 Сентября 2011 03:42:21 »
Сегодня написал романизатор. Hangul в Русский.

http://mad-rogue.com/htor/

Транскрипция по Системе Концевича.
Пример:
가난한 나무꾼이 나무룰 하러 갔다가 신선을 만났습니다. 신선은 나무꾼의 가난한 모습에 측은한 마음이 들어 선물을 주겠다고 했습니다.
'кананхан намуккуни намуруль харо каттага синсоныль маннассымнида. синсонын намуккуный кананхан мосыбе чхыгынхан маыми тыро сонмурыль чугеттаго хэссымнида.'

Пишите свои отзывы :)

Оффлайн Mad-Rogue

  • Новичок
  • *
  • Сообщений: 32
  • Карма: 1
  • Пол: Мужской
    • Rogue-Laboratory
  • Skype: Managedark
Re: Простой конвертер для корейского алфавита.
« Ответ #35 : 22 Сентября 2011 01:20:00 »
видать никому не нужно... а жаль =(

Оффлайн e-Nicko

  • Зарегистрированный
  • *
  • Сообщений: 13
  • Карма: 1
    • Hangul.ru
Конвертер 38 языков на корейский: http://www.hangulize.org

Оффлайн Mad-Rogue

  • Новичок
  • *
  • Сообщений: 32
  • Карма: 1
  • Пол: Мужской
    • Rogue-Laboratory
  • Skype: Managedark
Re: Простой конвертер для корейского алфавита.
« Ответ #37 : 13 Декабря 2013 16:41:16 »
Исходники скрипта-конвертера Hangul to Russian
https://github.com/Mad-Rogue/HangulToRussian
Малоли кто-нибудь захочет что-нибудь улучшить и дописать :)