• Welcome to Восточное Полушарие.

News:

Друзья! Форум перенесен на новый сервер, обновлено программное обеспечение, конвертированы данные. Изменений очень много, что-то могло сломаться, что-то не заработать, что-то пропасть. Если вы обнаружили проблему на форуме, пожалуйста, напишите на admin[собака]polusharie.com — постараемся исправить! 02.01.2026

Main Menu

Простой конвертер для корейского алфавита.

Started by Anatoli, 27 April 2006 06:30:55

Previous topic - Next topic

0 Members and 1 Guest are viewing this topic.

Anatoli

Quote from: LiBeiFeng on 03 May 2006 09:59:55
Anatoli
Спасибо за исходник преобразующей функции! У меня такой чисто технический вопрос - в C++ как вы работаете с Юникодом - наверное есть готовые библиотеки для этого дела?  :)  Мне это тоже сейчас вдруг неожиданно сильно понадобилось, а на Жабе я писать по разным причинам не хочу, да и знаю я её весьма плохо - хотелось чтобы на C++, но не знаю как там с юникодом работать... Хотя может уже есть встроенные средства.


Это C#, а не C++. Юникод там просто работает, только файл кода надо сохранить как юникод.
千里の道も一歩より始まる (senri-no michi-mo ippo-yori hajimaru)
千里之行, 始于足下 (qian li zhi xing, shi yu zu xia)
رحلة الألف ميل تبدأ بخطوة واحدة (riHlatu l-'alfi miili tabda'u bi-khaTwati waaHidati)

Anatoli

Quote from: ksen on 03 May 2006 08:13:15
Quote from: Anatoli on 02 May 2006 22:57:42
Ksen, а вы добились обратной конверсии, например из латиницы в хангыль, если разделитель символов использовать? Если да то как попробовать. Кстати, ваш JavaScript только в MS Internet Explorer работает, Mozilla Fierfox почему-то его не берет.

rom_syl={};
for(var i=44032; i<=44032+11171; i++) {
var ch=String.fromCharCode(i);
rom_syl[han2rom(ch)]=ch
}


—"перевод" всех символов Хангыль сохраняется в ассоциативном массиве rom_syl, так, что
rom_syl["guk"]=='국'
(или rom_syl_ru["кук"]=='국')

Этот массив и используется для перекодировки.

Спасибо, попробую  :)
千里の道も一歩より始まる (senri-no michi-mo ippo-yori hajimaru)
千里之行, 始于足下 (qian li zhi xing, shi yu zu xia)
رحلة الألف ميل تبدأ بخطوة واحدة (riHlatu l-'alfi miili tabda'u bi-khaTwati waaHidati)

ksen

Да, а в мозилле мой скрипт не работает, потому что он зашифрован для IE:

<SCRIPT LANGUAGE="JScript.Encode">
han_cons=['g','kk','n','d','tt','r','m','b','pp','s','ss','','j','jj','ch','k','t','p','h'];

...

//**Start Encode**#@~^7xIAAA==@#@&0;   mDkW   PkODyNnmv/O.*   @#@&7\mDPm..']Tp@#@&dWGM`-lM~
etc.

Я большой поклонник скриптовых языков типа JavaScript и PHP: будучи в тысячи раз медленнее С(++), они имеют мощный набор откомпилированных подпрограмм для разботы со строками и регулярными выражениями, так что JScript под силу, скажем, загрузить за 5 с. 30Мб словарь, за 30 с. построить к нему индекс, и делать подстрочники _с морфопарсингом_ корейских предложений со скоростью ~300 слов в секунду.

ksen

Вообще, у меня мечта сделать вьюер основных текстовых форматов словарей - Lingvo, Cebit, Shoebox, DML (их., оказывается, несколько). И, все-таки, не на JavaScript.
Но сам освоить чего-то типа С++/Java/С# я, скорее всего, не смогу - слишком крутая там learning curve.
Вот если бы были уже продвинутые кодеры, ответственные за GUI etc., можно было бы заделать какой-нибудь opensource :)
Мои наработки:
--морфологический анализатор корейского
--морфологический анализатор языка лакота
--простой синтаксический парсер
--перекодировщики "на лету" из DSL в HTML

Я делал и "движки" на основе Flash-ActionScript-PHP-MySQL: http://iyapi.net/search/dictionary.html
(логин/пароль там не действует, нажимайте кнопку Let me in)
начните печатать в что-нибудь типа wahachanka (или вахачханка)- флеш-ролик связывается с серверной MySQL через PHP и выдает результат.
Что-то типа новомодного AJAX, но я это сделал еще до появления термина :)

А вот вариант со связкаой HTML-JavaScript-PHP-MySQL (можно проверить на "ma" )
http://lol.iyapi.net/dictionary.html

--А вот пример публикации текста:
http://lol.iyapi.net/bomd.php
Обратите внимание на разнообразие форм презентации текста (Format:), орфографии итп.

Это я все к тому, что подобное можно "забацать" и для CJK...
Константин Виолован

Anatoli

Мне иногда JavaScript сложнее мощных языков программирования кажутся. Поэтому ваш код не сильно понимаю. Просто не присле разобраться еще.

Константин, извините не по теме, а почему у вас в профиле женский пол стоит? Еще и аватар женский. Извините, в начале думал, что вы женщина.

Приятно познакомиться. Вы где находитесь-то?
千里の道も一歩より始まる (senri-no michi-mo ippo-yori hajimaru)
千里之行, 始于足下 (qian li zhi xing, shi yu zu xia)
رحلة الألف ميل تبدأ بخطوة واحدة (riHlatu l-'alfi miili tabda'u bi-khaTwati waaHidati)

ksen

Quote from: Anatoli on 03 May 2006 23:36:18
Мне иногда JavaScript сложнее мощных языков программирования кажутся. Поэтому ваш код не сильно понимаю. Просто не присле разобраться еще.
--Ну, вообще-то "ядро" JavaScript - упрощенный, нетипизированный C++/Java. Вы, например, чтобы проверить наличие элемента асс. массива "ловите исключение":

try { t = rTails[expression]; }
catch (IndexOutOfRangeException ex) { t = ""; }

на JavaScript это можно записать так:

t = rTails[expression] || ""

--Что сложнее? :)

Quote from: Anatoli on 03 May 2006 23:36:18

Константин, извините не по теме, а почему у вас в профиле женский пол стоит? Еще и аватар женский. Извините, в начале думал, что вы женщина.
Приятно познакомиться. Вы где находитесь-то?

--Ну, этот вход - моей жены, вообще-то :) А так, очень удобно оказалось - женщин ведь не бьют на форумах :)
Я нахожусь в Москве и Московской области :)

CTAC

Всем доброго дня!
Я работаю над китайско-русским словарём, в словарные статьи для иероглифов которого в настоящее время пытаюсь внедрить корейские чтения иероглифов в записи хангылем, латиницей и кириллицей. В деле автоматической конвертации латинских записей в кириллические мне и требуется помощь специалистов. Буду признателен за любое содействие.

Формат таблицы:



Юникод иероглифаИероглифРомадзяHun/EumКириллица для Hun/EumEum (romaja)Eum hangulКириллица для Eum
4E00IL한 일пустоilпусто
И так далее.
Готов отправить файл любому, кто выразит желание помочь.

http://www.chinese-russian.com
ICQ:      339535
QQ: 139339535
Телефон: +7-9629169067

Anatoli

Quote from: CTAC on 04 February 2010 01:48:31
Всем доброго дня!
Я работаю над китайско-русским словарём, в словарные статьи для иероглифов которого в настоящее время пытаюсь внедрить корейские чтения иероглифов в записи хангылем, латиницей и кириллицей. В деле автоматической конвертации латинских записей в кириллические мне и требуется помощь специалистов. Буду признателен за любое содействие.

Формат таблицы:



Юникод иероглифаИероглифРомадзяHun/EumКириллица для Hun/EumEum (romaja)Eum hangulКириллица для Eum
4E00IL한 일пустоilпусто
И так далее.
Готов отправить файл любому, кто выразит желание помочь.
Чтения на корейском можно найти в английском Викисловаре (просто ставьте в поиск, ищите корейский раздел)):
http://en.wiktionary.org/wiki/Wiktionary:Main_Page

В кириллицу:
http://ru.wikipedia.org/wiki/Система_Концевича
千里の道も一歩より始まる (senri-no michi-mo ippo-yori hajimaru)
千里之行, 始于足下 (qian li zhi xing, shi yu zu xia)
رحلة الألف ميل تبدأ بخطوة واحدة (riHlatu l-'alfi miili tabda'u bi-khaTwati waaHidati)

CTAC

Всем спасибо, справился любительским способом, но при этом более-менее автоматическим, чем горжусь ужасно. Скоро выложу.
http://www.chinese-russian.com
ICQ:      339535
QQ: 139339535
Телефон: +7-9629169067

Mad-Rogue

Сегодня написал романизатор. Hangul в Русский.

http://mad-rogue.com/htor/

Транскрипция по Системе Концевича.
Пример:
가난한 나무꾼이 나무룰 하러 갔다가 신선을 만났습니다. 신선은 나무꾼의 가난한 모습에 측은한 마음이 들어 선물을 주겠다고 했습니다.
'кананхан намуккуни намуруль харо каттага синсоныль маннассымнида. синсонын намуккуный кананхан мосыбе чхыгынхан маыми тыро сонмурыль чугеттаго хэссымнида.'

Пишите свои отзывы :)

Mad-Rogue


e-Nicko


Mad-Rogue

Исходники скрипта-конвертера Hangul to Russian
https://github.com/Mad-Rogue/HangulToRussian
Малоли кто-нибудь захочет что-нибудь улучшить и дописать :)