Итак... Привожу здесь результаты первых попыток импортировать доступный на данный момент файл БКРС в WenLin.
Сразу начну с того, что мне удалось получить в ВеньЛинь около 63.5 тысяч русских словарных статей, при этом около 8.5 тысяч словарных статей были отбракованы ВеньЛинем. В основном по причине того, что написанный пиньинь не соответсвовал иероглифам (насколько я понял после сравнения со сканами БКРС - это в основном опечатки, но частично это отсутсвующий слогораздел, который ВеньЛинь хочет видеть с апострофом, т.е. mier -> mi'er). Есть и ошибки в преобразовании, так как программа не очень большая и не может охватить все вариации не очень четко структурированного словаря в DSL формате.
Я исходил из предположения, что две строчки иероглифов, идущих подряд, говорят о том, что первая - упрощенное написание, вторая - полная форма. К сожалению это не всегда так. Такие статьи ВеньЛинь тоже отказывается принимать.
К тому же мне пришлось выкинуть все словарные статьи типа "бу см. бе", потому что в них отсутствует пиньинь, который необходим в каждой записи для ВеньЛинь.
С частями речи в данный момент не все понятно. Я не понимаю, какие части речи есть в ВеньЛине и как их сопоставить с русскими названиями. В настоящее время те записи, в которых непонятно, какую часть речи приписать (нет информации в статье, например), была добавлена аббревиатура "b.f."
По этой ссылке
http://www.megaupload.com/?d=VVQIRE1Wнаходится раровский архив, в котором лежит файл "out.log". Это и есть преобразованный BKRS.dsl .
Желающим я могу выслать скрипт на Perl, с помощью которого был получен out.log. Или выложить его куда-нибудь.
Итак, как подключить этот файл в ВеньЛинь:
1. Из меню выбираем Dictionary->Show Dictionaries
2. В разделе cidian выбираем, например, create empty (если не хотим портить основной словарь)
3. Выбираем для нового словаря analyse.
4. В новом "окошке", где появилась информация о пустом словаре, включаем режим редактирования (Ctrl-E), и убираем все строчки, кроме первой.
5. На второй строчке пишем, начиная с точки
.include c:\where_I_put_this_out_log\out.log
естественно нужно поставить свой путь до файла.
6. Из меню выбираем Dictionary->Import list of entries.
7. На вопрос о том, импортировать или тестировать, жмем по желанию. Естественно тестирование только выдасть результаты того, насколько записи соответсвуют критериям ВеньЛинь (около 8.5 тысяч проколовшихся).
8. Вуаля! Теперь у вас около 64 тысяч записей в словаре на русском!
Жду ваших отзывов.