...--Поиск по -ㅌ이 дает 61 лексемы....
...поиск по ㅌ+йотир.гл. дает 4 лексемы...
Поделитесь, каким способом проводили поиск?
Здравствуйте, Echter, еще раз большое Вам спасибо за словарь!
Поиск проводился не в самом словаре, а в списке романизированных лексем. Сделан с помощью простого скрипта на JavaScript.
Список можно загрузить отсюда:
http://iyapi.net/korean/korrom.zip (341 Kb)
Сам список просматривался в TextPad'e, где кроме того, можно проводить поиск, используя язык регулярных выражений
В основе скрипта лежит регулярность расположения корейских символов в Unicode (588 символов для каждой стартовой согласной, 28 патчимов, включая "пустой, итп.)
han_cons=['g','kk','n','d','tt','r','m','b','pp','s','ss','-','j','jj','ch','k','t','p','h'];
han_vowels=['a', 'ae', 'ya', 'yae', 'eo','e','yeo','ye',
'o','wa','wae','oi','yo','u','weo','we','wi',
'yu','eu', 'eui', 'i'];
han_patchim=['','g','kk','gs','n','nj','nh','d','l','lk','lm','lb','ls','lt','lp','lp',
'm','b','bs','s','ss','ng','j','ch','k','t','p','h'];
function han2rom(char){
var code=char.charCodeAt()-44032; if(code <0 || code >11171) return(char);
var ofs = code % 588;
return han_cons[code/588 >>0]+han_vowels[ofs/28 >>0]+han_patchim[ofs % 28];
}
У меня к Вам вопрос: не собираетесь ли Вы конвертировать Ваш словарь в Lingvo11-совместимый, ведь там, говорят, возможен подстрочный перевод предложения.
Я могу сделать HTML-JavaScript страничку, которая может вести поиск по лексемам в хангыле/романизации. Можно добавить туда и дефиниции из Б.К-А.С. И тогда уже поиск будет не двухстадийный (получить список нужных слов из korrom.txt, просмотреть их по очереди в Lingvo), а по методу "write - select - copy - paste". Все это работает в оффлайне, причем будут фичи, недоступные в Lingvo - например поиск слов по окончаниям, или вообще по любой последовательности, используя wildcards и другие навороты regular expressions. Это интересный проект?