Друзья! Спасибо за стремление помочь, но вижу, что вы пока не поняли сути проблемы... Попробую разложить по полочкам...
Наверняка многие сидели на русских или английских Вин-98. В те далекие времена не было такого чуда программистской мысли как Ворд-2000, а Ворд-97 многих не устраивал по причине явной недоделанности. Как в таких условиях набирать китайский текст? Кто-то пользовался TB ChinesePartner-ом, кто-то Chinese Star-ом. Программы этого типа действовали по одному и тому же принципу: заменяли пары символов ASCII на иероглифы согласно указанной в настройках кодировки (GB/BIG5). Единственным отличием китайского текста для них был шрифт. При этом они подменяли иероглифами и те символы, которые были отображены системными шрифтами. Помните, что творилось с менюшками в русских виндоуз с запущенным CS или ТВ CP?
Так вот, это отлично работало под 95-м Вордом, т.к. можно было в одном документе использовать и китайский, и русский. Каждый иероглиф был записан двумя символами. При незапущенных Твинбридже или ЧайнизСтаре вместо иероглифов был мусор.
Особенностью этого метода было то, что для Ворда такой китайский язык мог быть совершенно любым языком. Если помните, в русском/английском 95-м Ворде в списке языков китайский не значился ни в коем виде!
Соответственно, как предлагает уважаемый Quaxter, пытаться распознать язык средствами Ворда уже не получится. Это прошло бы в 2000/ХР-ном Ворде, но не в 95-м. То же касается и попытки конвертить с помощью он-лайн скриптов: прежде чем попасть в скрипт, текст обрабатывается броузером.
В принципе, ситуация почти безвыходная. То есть нужно конвертировать по частям. Сначала перетаскиваем в юникод китайский текст (русский превращается в жуткие иероглифы) и кладем в один документ, потом перетаскиваем русский в другой документ (китайский, остается символами псевдографики). После этих манипуляций два файла надо скрестить вместе. Как вы понимаете, скрипт должен быть слишком "умным", чтобы это сделать.
Есть еще такая идея: написать под 95-м Вордом скрипт, который бы выделял иероглифы исходя из шрифта, которым символы написаны. Правда, для этого необходимо забить в скрипт всю таблицу иероглифов и их юникодовые значения и еще умудриться как-то как-то заставить не понимающий юникода Ворд сохранить это в текстовый файл.
Вся проблема решилась бы на порядок быстрее, если бы в 95-м Ворде был конвертер для HTML, но его нет.
Может быть, кто-нибудь когда-нибудь встречал такую штуку?