Автор Тема: Шрифты, Кодировки, Иероглифы (на компьютере)  (Прочитано 132626 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Роман Храпачевский

  • Профессионал
  • ****
  • Сообщений: 426
  • Карма: 0
  • Пол: Мужской
    • ROSSICA
Re: О переводе иероглифа из Ворда в ХТМЛ код
« Ответ #75 : 20 Февраля 2003 23:37:41 »
Собственно я знаю, что на сайте Сат Абхавы можно перекодировать текст в Юникод. Но есть ли независимый от хождения в сеть способ ?
Куди схоче, туди й скаче,
Нiхто за ним не заплаче

Оффлайн katull

  • Бывалый
  • ***
  • Сообщений: 139
  • Карма: -7
    • eastmania.ru - Социальная сеть для тех, кто любит Восток
Re: О переводе иероглифа из Ворда в ХТМЛ код
« Ответ #76 : 21 Февраля 2003 00:38:10 »
Попробуйте EmEditor. Можно скачать с сайта разработчика www.emurasoft.com
Он позволяет сохранять файлы в Юникоде. Есть даже подсветка хтмл кода.

Оффлайн Роман Храпачевский

  • Профессионал
  • ****
  • Сообщений: 426
  • Карма: 0
  • Пол: Мужской
    • ROSSICA
Re: О переводе иероглифа из Ворда в ХТМЛ код
« Ответ #77 : 21 Февраля 2003 01:05:26 »
Спасибо ! Щас попытаю их изделие
Куди схоче, туди й скаче,
Нiхто за ним не заплаче

Оффлайн katull

  • Бывалый
  • ***
  • Сообщений: 139
  • Карма: -7
    • eastmania.ru - Социальная сеть для тех, кто любит Восток
Re: О переводе иероглифа из Ворда в ХТМЛ код
« Ответ #78 : 21 Февраля 2003 01:17:04 »
Вроде бы к этой проге у quaxtera  есть рег. код. Или можно получить у них академическую лицензию.
Кстати, они вроде звонить в институт и проверять не будут  :D)

Sat_Abhava

  • Гость
Re: О переводе иероглифа из Ворда в ХТМЛ код
« Ответ #79 : 21 Февраля 2003 01:19:26 »
Цитировать
Собственно я знаю, что на сайте Сат Абхавы можно перекодировать текст в Юникод. Но есть ли независимый от хождения в сеть способ ?


Есть прекрасный способ. Сам им пользуюсь и другим советую. Нужно иероглифический текст перевести в вид &#_десятичный_юникод_; и, соотвественно, вставить в нужное место на html-странице. При этом все Ваши иероглифы будут отображаться даже при русской кодировке страницы.

Я под это дело даже скриптик соорудил, но только, кажется, его на сайт не выкладывал - не подумал, что еще кому-то нужен будет. Если очень надо, то можете запостить китайский текст прямо на форуме, а я его моментально "переведу" в нужный вид...

Оффлайн quaxter

  • Заслуженный
  • *****
  • Сообщений: 668
  • Карма: 8
  • Пол: Мужской
Re: О переводе иероглифа из Ворда в ХТМЛ код
« Ответ #80 : 21 Февраля 2003 02:00:09 »
Цитировать

Есть прекрасный способ. Сам им пользуюсь и другим советую. Нужно иероглифический текст перевести в вид &#_десятичный_юникод_; и, соотвественно, вставить в нужное место на html-странице. При этом все Ваши иероглифы будут отображаться даже при русской кодировке страницы.

Мысли и речения мужей просветленных вселяют радость даже в сердца профанов.

Вот знаю, что код юникода если его впаять в таком виде, как пишет почтенный Сат Абхава, дадут нужный результат (правда, не во всяком броузере), но не пользуюсь этим.

Добавляю свои две копейки: если вы знаете шестнадцатиричный код Юникода, распространенный более, нежели десятиричный, пишете то же, что указывает шифу Сат Абхава, только вместо #пишете латинское H, т.е. &H_шестнадцатиричный_юникод_;
Знаки амперсенда вначале и точки с запятой в конце абсолютно необходимы.

Но есть и обходные пути. Вот один из них.
Слхраняете в ворде хтмлом, а потом чистите Тайди (к примеру более удобной для широких кругов версией TidyGUI).
Выглядит прога так:

На предутпреждения внимания не обращайте.
Еее надо отконфигурить. Достигается это посредством такого диалога:

потом идете на следующую закладку:

а потом - на закладку

Остальное вроде бы понятно. Потом сохраняете аутпут под желательным именем (не советую сразу прибивать вордовый хтмл - вторая/третья попытка поначалу будет более удачной). Вроде все.
А еще есть Эксел, который клепает менее горбатые хтмлы. И есть фронтпейдж, для которого есть целый арсенал чистилок.
Но есть профессиональные редакторы хтмлов, из которых самый любимый программистами - банальный блокнот (Notepad)
« Последнее редактирование: 21 Февраля 2003 07:13:18 от quaxter »

Оффлайн Papa HuHu

  • Модератор
  • Заслуженный
  • *****
  • Сообщений: 6029
  • Карма: 157
  • Пол: Мужской
    • Папа ХуХу
Re: О переводе иероглифа из Ворда в ХТМЛ код
« Ответ #81 : 21 Февраля 2003 02:46:23 »
можно просто сохранить этот документ в ворде как html (file/save as webpage), потом открыть его исходник (view/html source) - и там, среди горы мусора, будет ваша фраза по русски и с иероглифами представленными в &#_десятичный_юникод_; ... а оттуда копируете (потому что пользоваться вордовским хтмл-ом ну совсем уж неудобно) и вставляете в вашу страничку....

если воспользуетесь EmEditor, то там ставите курсор у иероглифа, нажимаете Ctrl+W и он вам выдаст тот самый уникод-код иероглифа....

Sat_Abhava

  • Гость
Re: О переводе иероглифа из Ворда в ХТМЛ код
« Ответ #82 : 21 Февраля 2003 04:18:34 »
Цитировать

Мысли и речения мужей просветленных вселяют радость даже в сердца профанов.


"Подкалывать" изволите, уважаемый Quaxter?  :) Это если Я в компьютерах просветленный, то КТО же тогда профан?!  ;D

Цитировать
Вот знаю, что код юникода если его впаять в таком виде, как пишет почтенный Сат Абхава, дадут нужный результат (правда, не во всяком броузере), но не пользуюсь этим.


"Просветленные Абхавы" пишут только под IE... ;D

Цитировать
Добавляю свои две копейки: если вы знаете шестнадцатиричный код Юникода, распространенный более, нежели десятиричный, пишете то же, что указывает шифу Сат Абхава, только вместо #пишете латинское H, т.е. &H_шестнадцатиричный_юникод_;
Знаки амперсенда вначале и точки с запятой в конце абсолютно необходимы.


Хорошая мысль! Надо будет переработать скрипт, раз спецы утверждают, что так правильнее.  :) А какие броузеры десятиричный код не переваривают?

« Последнее редактирование: 21 Февраля 2003 05:58:29 от Sat_Abhava »

Sat_Abhava

  • Гость
Re: О переводе иероглифа из Ворда в ХТМЛ код
« Ответ #83 : 21 Февраля 2003 04:21:06 »
Цитировать
можно просто сохранить этот документ в ворде как html (file/save as webpage), потом открыть его исходник (view/html source) - и там, среди горы мусора, будет ваша фраза по русски и с иероглифами представленными в &#_десятичный_юникод_; ... а оттуда копируете (потому что пользоваться вордовским хтмл-ом ну совсем уж неудобно) и вставляете в вашу страничку....


Точно-точно! Я именно так и "просветлел"!  ;D

Оффлайн Роман Храпачевский

  • Профессионал
  • ****
  • Сообщений: 426
  • Карма: 0
  • Пол: Мужской
    • ROSSICA
Re: О переводе иероглифа из Ворда в ХТМЛ код
« Ответ #84 : 21 Февраля 2003 04:40:00 »
Всем огромное спасибо - я опробовал указанные уважаемыми специалистами способы и -  заработало !!!  ;D
Куди схоче, туди й скаче,
Нiхто за ним не заплаче

Sat_Abhava

  • Гость
Re: О переводе иероглифа из Ворда в ХТМЛ код
« Ответ #85 : 21 Февраля 2003 06:00:51 »
Цитировать

Вынужден убегать в редакцию, чтобы поймать дезигнера, верщущего мою статью, которую надо сдавать завтра в печать.


А про что статья, если не секрет?  :)

Оффлайн quaxter

  • Заслуженный
  • *****
  • Сообщений: 668
  • Карма: 8
  • Пол: Мужской
Re: О переводе иероглифа из Ворда в ХТМЛ код
« Ответ #86 : 21 Февраля 2003 06:12:44 »
Цитировать
А какие броузеры десятиричный код не переваривают?

Да вот нетшкаф с оперой могут вообще не переварить в таком варианте ни десятичный, ни шестнадцатиричный коды Юникода, а просто выдать все ваше изваятое выражение "как есть" безо всякого преобразования.

2Роман:
А еще самый действенный способ - запомнить в ворде хтмлом, а потом пройтись специальной чистилкой, разработанной www.unicode.org, специально для очистки от вордового мусора предназначенной.
Называется сия программка Tidy. Работает из командной строки, что может повергнуть многих непрофессионалов в уныние. Но для людей, не хотящих терпеть такую муку давно разработан вариант TidyGUI (то есть та же Tidy, но с добавкой GUI еже есть Graphical User Interface). Если надо - могу выслать атачем. Она тоже крохотная. Чистый экзешник инсталляхи - 319 КБ, зазипованный архив - вообще 150 К. И шаровая. То есть вообще получаете прогу на законных основаниях.
Опыт показывает, что вордовый мусор вылетает после тайди весь, но надо все равно чищенный файл править вручную. Желательно указать кодировку. Например, если основной текст кириллицей, но есть иероглифы - то либо windows-1251, либо koi-8r а цзыры писать юникодом, либо сразу чтоб не мучиться ставить UTF-8. Делается это в третьей-пятой строке после объявлений хедера, боди и хтмла в форме
charset="windows-1251"
или
charset="KOI-8R"
или
charset="UTF-8".
Можете рискнуть и сыграть в гобяву. Последствия для русских букв могут быть плачевны. То есть слова, состоящие из четного числа букв будут рендериться нормально. Если же слово состоит из нечетного числа букв, то броузер может воспринять последнюю букву как обломок кода иероглифа, припаять к нему код следующего символа или пробела и на выходе дать вместо сочетания буква+пробел/знак препинания левый цзыр. Пробелы, нормально отсутствующие в китайском, могут посыпаться. А еще могут русские слова отрендериться в виде знака параграфа+какая-то дребедень, и не поддаться перекодировке.
А еще есть способ, но это не всем по нутру. Берете профессиональную прогу-редактор хтмлов. И ваяете все в нем. Выбор достаточно широк. Либо Macromedia Dreamweaver (человечество пока ничего лучше не изобрело), либо какой-нибудь Spider Writer, CoffeeCup Editor, 1st Page, WinEdit Pro Pack - но это все платное и надо или честно покупать, или ставить левую копию с пиартского диска (админ, не бейте меня ногами )или крячить.
Не все крячится, например хорошо защищенный WinEdit. И еще не спутайте его с WinEdt'ом. Тот тоже помогает хтмлы клепать, но его основное назначение - верстка в TEX - LATEX - LATEX 2ε

Оффлайн quaxter

  • Заслуженный
  • *****
  • Сообщений: 668
  • Карма: 8
  • Пол: Мужской
Re: О переводе иероглифа из Ворда в ХТМЛ код
« Ответ #87 : 21 Февраля 2003 06:17:25 »
Цитировать

А про что статья, если не секрет?  :)

Да нет, не статья даже, а поденщина журнальная. Анонс гастролей балетного театра Касаткиной-Василёва. Это при моем равнодушии к театру вообще и балету в особенности - сущее мучение.
А тут еще фоты из их постановки "Спартака" выбрали для иллюстрации как назло самые эротичные. Так что пол-анонса переписать надо.

И никакой иронии я в свой текст отнюдь не влагал.
Вы знаете китайский - я владею навыками прораммирования, работы в разных правилдьных и неправильных редакторах &c. и еще невесть чего. Если бы удалось/пришлось объединить наши усилия ради достойной цели - могли бы сделать что-то значимое.
« Последнее редактирование: 21 Февраля 2003 06:29:09 от quaxter »

Оффлайн Роман Храпачевский

  • Профессионал
  • ****
  • Сообщений: 426
  • Карма: 0
  • Пол: Мужской
    • ROSSICA
Re: О переводе иероглифа из Ворда в ХТМЛ код
« Ответ #88 : 21 Февраля 2003 07:31:08 »
Цитировать


Например, если основной текст кириллицей, но есть иероглифы - то либо windows-1251, либо koi-8r а цзыры писать юникодом, либо сразу чтоб не мучиться ставить UTF-8. Делается это в третьей-пятой строке после объявлений хедера, боди и хтмла в форме
charset="windows-1251"
или
charset="KOI-8R"
или
charset="UTF-8".



О! Это очень вовремя вы мне сказали, спасибо !  :D
На самом деле я пока только учусь делать простейшие веши - мне далеко до ФронтПейджа и т.д. - я осваиваю азы языка ХТМЛ и хочу на пробу статью свою вывесить в сети  ::)
Куди схоче, туди й скаче,
Нiхто за ним не заплаче

Сат Абхава

  • Гость
Re: О переводе иероглифа из Ворда в ХТМЛ код
« Ответ #89 : 21 Февраля 2003 15:28:02 »
Цитировать

И никакой иронии я в свой текст отнюдь не влагал.
Вы знаете китайский - я владею навыками прораммирования, работы в разных правилдьных и неправильных редакторах &c. и еще невесть чего. Если бы удалось/пришлось объединить наши усилия ради достойной цели - могли бы сделать что-то значимое.


Думаю, что объединение наших усилий ради достойной цели - дело ближайшего будущего... Была бы цель, а уж усилия мы приложим!  Тут вот уважаемая Jin Jie революцию в русской транскрипции предсказывает. Ну что, "втавай, пиньнем заклейменный...?!" ;) :)

Оффлайн quaxter

  • Заслуженный
  • *****
  • Сообщений: 668
  • Карма: 8
  • Пол: Мужской
Re: О переводе иероглифа из Ворда в ХТМЛ код
« Ответ #90 : 22 Февраля 2003 08:31:35 »
2Роман
Проверьте настройки блокнота. У меня все перетаскивается и прямо из ворда, и по описанной ниже методе, и нет никаких вопросительных знаков. Но у меня в нотепаде на сей момент дефолтовым объявлен фонт Arial Unicode MS
Так что не забудьте поправить настройки блокнота. Если у вас стоит дефолтом Fixedsys, который винда ставит сама в русской локализации, то в нем только две настройки: Cyrillic и Western. Ну, сами понимаете.
С большой вероятностью, собака зарыта здесь. Но ставить системным фонтом Arial Unicode MS можно не на каждую тачку. Он 27 метров занимает, но в нем 51180 символов, в т.ч. 20903 иероглифа.

Оффлайн quaxter

  • Заслуженный
  • *****
  • Сообщений: 668
  • Карма: 8
  • Пол: Мужской
забавы ради...
« Ответ #91 : 22 Февраля 2003 08:44:20 »
2Everybody
Так сказать, дурной полноты ради...
Нашел в ворде (2000, ХР) еще нечто для конвертации в хтмл. Не требует установки софта или изуверских штучек.
Там есть функция Предварительный просмотр Web-страницы.
Пользуясь этой командой вы заставляете ворд отрендерить документ в окне броузера без сохранения. Правда, в эксплорере есть кэш :) При этом офисные приложения с инородными броузерами не интегрятся. За что спасибо билгейтсу...
Получив превьюху в окне броузера, копируете нужный текст в клипборд. Он КОРРЕКТНО вставляется в нотепад. Разумеется, объявив системным фонтом нотепада какой-нибудь увесистый юникодовкий фонт (если не жирный Эриал, то хотя бы Cyberbit или CyberCJK - по-моему они доднесь с нетшкафовского сайта разливаются, а по объему и по числу символов они вдвое "худее" Arial Unicode MS). И, что самое приятное - в профессиональные редакторы хтмл. Но не во все, а только в юникодистые. Например, Macromedia Dreamweaver 4 дает кракозябры, Macromedia Dreamweaver МХ - все нормально. Только надо сначала объявить кодировку UTF-8 и сохранить пустой файл, а потом уже редактировать.
Форма объявления (вся строка):
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
Можете объявить любую кодировку, только ради всего святого не оставляйте дефолтовую ISO-шную.
Объявление делаете в теле хедера (заголовка) после объявлений <html> и <head> но до </head> и <html> и тем более до объявления <body>. Хотя в самом окне редактора вы не увидите половины символов... Избыток вордовых красот гибнет. Рендерятся и традиционные цзыры, и упрощенные, и кириллица, и греческий, и почти вся бопомофо (нет символа нейтрального тона). Больше не глядел.
Команда находится в первой группе меню "Файл" (ворд 2000/ХР) и не имеет в попап-меню иконки. На спрятанной кнопке у нее пиктограмма: лупа поверх условной Web-страницы.
Кнопку можно вытянуть и бросить на тулбар. Это просто: Вид -> Панели инструментов -> Настройка -> Команды -> Файл. Ищете скроллом и тянете иконку команды при нажатой левой кнопке мышы на тулбар. И все.

Насчет кода Юникода в EmEditor'e, (Ctrl + W) <Papa HuHu>. Все верно. Только там шестнадцатиричные коды. Если будете брать код из EmEditor'а, пишите &H а не &#- а то получите не тот знак. Если код содержит буквы A-F, то с префиксом &#отрендерится то, что написано без конвертации. Броузер не поймет, чего вы хотели сказать.
Если у кого EmEditor выдает десятичный код - значит у нас или разные настройки, или разные версии редактора. У меня свежая 3.30 со всеми плагинами и автокомплитами. Не всегда удобно: написал ПапаХуХино имя в угловых скобках, а редактор тут же дал рядом отменный вариант со слэшем. :)

Оффлайн Xiongmao

  • Бывалый
  • ***
  • Сообщений: 144
  • Карма: 1
  • Пол: Мужской
Re: Как научить Win2000 понимать иероглифы
« Ответ #92 : 28 Марта 2003 16:16:25 »
По-моему, здесь дело не в Вин2к, а в самом Кварке. Он, негодяй, не то что иероглифы, он даже простые умлауты с трудом воспринимает. Хотя... могу и ошибаться.
歡迎來熊貓家!

Оффлайн Shuravi

  • Заслуженный
  • *****
  • Сообщений: 1260
  • Карма: 12
  • Пол: Мужской
    • Shuravi
Re: Как научить Win2000 понимать иероглифы
« Ответ #93 : 29 Марта 2003 19:10:56 »
Попробовал вчера кварк. И правда капризы какие-то. "Наилучшим результатом" было получение части иероглифов скопированного текста. Вот только по какому правилу кварк решал чего показывать, а чего вопросами обозначить - этого я так и не понял. И интересно, что несколько раз поменяв шрифт и вернувшись к первоначальному я получил несколько разных вариантов отображения (несколько кучек "мусора"). Японский текст отображался лучше, но только некоторыми шрифтами (без выкрутасов). Но может быть моя система наложила свою руку  ;D

А почему именно кварк понадобился? Что-то хвалят его, а вот за что именно не говорят  :-/
« Последнее редактирование: 29 Марта 2003 19:13:46 от Shuravi »

Оффлайн Papa HuHu

  • Модератор
  • Заслуженный
  • *****
  • Сообщений: 6029
  • Карма: 157
  • Пол: Мужской
    • Папа ХуХу
Re: QuarkXPress и иероглифы
« Ответ #94 : 21 Апреля 2003 18:13:59 »
переключите локаль на компе.... и может все заработает....
не помню, как сие делать в Вин2000, но в ХР просто...(control panel/regional and language options/advanced/select a language to match the language of the non-Unicode programs you wnat to use/)

Оффлайн quaxter

  • Заслуженный
  • *****
  • Сообщений: 668
  • Карма: 8
  • Пол: Мужской
Re: QuarkXPress и иероглифы
« Ответ #95 : 25 Апреля 2003 04:58:16 »
друзья, просто кварк - не юникодистая программа. ворд (как, впрочем, почти весь офис начиная с 2000) - это юникодистая программа с XML-based структурой.
кварк - прекрасное в своем поле изобретение. это верстально-дизайнерская программа. фонты к ней нужны постскриптовые, они же Т1 (а не трутайпные). и на шару азиатских постскриптовых фонтов вам никто не нальет. юникодовский трутайп не конвертится корректно не только в кварк на винде. а вот на макинтошах при фактическом отсутствии юникода и при наличии фонтов верстануть иероглифы можно.
на вопрос Shuravi ответ прост: кварк дает правильный постскрипт и правильное цветоделение. достаточно посмотретьт скриншот постскрипта кварковской верстки и того, что вылезает из корела после конвертации в кривые в увеличении 400%. тогда все вопросы отпадут сами собой.
кварк - это программа не для печати на домашнем или офисном принтере, а для типографского производства. она очень, даже очень-преочень хороша, но у нее и недостатки есть в достаточном количестве. как, впрочем, и у ворда . эт что! вот в иллюстраторе вообще есть японский формат файла :)

Оффлайн Shuravi

  • Заслуженный
  • *****
  • Сообщений: 1260
  • Карма: 12
  • Пол: Мужской
    • Shuravi
Re: QuarkXPress и иероглифы
« Ответ #96 : 12 Мая 2003 21:19:01 »
Цитировать
... а вот на макинтошах при фактическом отсутствии юникода и при наличии фонтов верстануть иероглифы можно.

Дык, издательства наверное именно на Маках хорошо и сидят. По крайней мере, в объявах о приеме на работу в типографию слова макинтош и кварк идут рядом  ;D

Цитировать
... кварк - это программа не для печати на домашнем или офисном принтере, а для типографского производства. она очень, даже очень-преочень хороша...

как и цена  ;)

А есть еще что-нить кроме кварка, иллюстратора и корела? У меня есть отдаленное подобие японское. Для создания презентаций простеньких самое то: имя ему Сlaris Impact.  ;D

Trulala

  • Гость
Re: QuarkXPress и иероглифы
« Ответ #97 : 13 Мая 2003 20:12:24 »
nu dla savsem prostix veshchei dumayu i Publisher sgoditsa tem boliye s unicode u nego net prablem

Оффлайн Shuravi

  • Заслуженный
  • *****
  • Сообщений: 1260
  • Карма: 12
  • Пол: Мужской
    • Shuravi
Re: QuarkXPress и иероглифы
« Ответ #98 : 14 Мая 2003 13:33:42 »
Цитировать
nu dla savsem prostix veshchei dumayu i Publisher sgoditsa tem boliye s unicode u nego net prablem

Сколь "простые" вещи возможны в Publisher ?

Оффлайн Shuravi

  • Заслуженный
  • *****
  • Сообщений: 1260
  • Карма: 12
  • Пол: Мужской
    • Shuravi
Re: QuarkXPress и иероглифы
« Ответ #99 : 14 Мая 2003 14:01:59 »
Publisher? Не встречал такого. Может Publish It?
Где-то в запасние есть у меня Canvas-8. Тоже "паблишер", но он как-то на "корэл" смахивает и не помню как он уживается с канжами. Качество, как я понимаю, тоже не на бытовой принтере сравнивать нужно ;D