спасибо за ответы!
в общем, ситуация такая: как делать все это мне теперь понятно, но не понятно, каким же образом отобрать те иероглифы, которые мне будут нужны... в юнихане содержится информация о частоте, но ее не достаточно
использовать готовый индекс от словаря другого - малореально, так как там указание на страницы идет
в общем, теперь думаю, как наложить информацию о частотности на юнихань
по моим рассчетам 7000 должно хватить