Автор Тема: Распознать вэньянь.  (Прочитано 5371 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн MAMOHT

  • Бывалый
  • ***
  • Сообщений: 157
  • Карма: 0
  • Пол: Мужской
Распознать вэньянь.
« : 02 Февраля 2010 01:00:23 »
Приношу извинения за свои глупые вопросы, но хотелось бы узнать существует ли программы распознающие пдф с вэньянем? Упрощенный я распознаю с CAJViewer, но он не предназначен для вэньяня, или же я им еще не умею полностью пользоваться.
Заранее спасибо
I'll be back!

Оффлайн cicero

  • Профессионал
  • ****
  • Сообщений: 424
  • Карма: 30
    • klausnick
Re: Распознать вэньянь.
« Ответ #1 : 26 Октября 2010 18:01:48 »
По названию темы понял так: как отличить, написан ли текст на вэньяне или на путунхуа.

Оффлайн anima***

  • Заслуженный
  • *****
  • Сообщений: 715
  • Карма: 36
  • Пол: Мужской
Re: Распознать вэньянь.
« Ответ #2 : 26 Октября 2010 21:06:03 »
Судя по описанию, хорошая вещь, кто бы дал ссылку на download. Наверняка там все есть, шрифт SimSun это мощный шрифт. Наверняка есть переключатель традиционный-упрощенный.

Оффлайн LiBeiFeng

  • Заслуженный
  • *****
  • Сообщений: 773
  • Карма: 15
  • Пол: Мужской
Re: Распознать вэньянь.
« Ответ #3 : 01 Ноября 2010 18:52:08 »
Большинство нормальных китайских "распознавалок" понимают как упрощенное так и традиционное кит. письмо. Кстати и Файнридер тоже, он нормально работает с пдф. Не ясно в чем проблема? Попробуйте ту же Tsinghua например. Где-то здесь были ссылки. Что касается проверки правильности распознавания через проверку правописания, то не думаю что есть что-то специально "заточенное" под вэньянь (да и не думаю что это сильно нужно), хотя может я ошибаюсь.
Не всё стриги, что растет... (Козьма Прутков)

Оффлайн Chu

  • Заслуженный
  • *****
  • Сообщений: 1332
  • Карма: 54
  • Пол: Мужской
Re: Распознать вэньянь.
« Ответ #4 : 01 Ноября 2010 19:29:49 »
Акробат тоже прекрасно читает полные иероглифы...

Важность CAJViewer совсем не в том, какие иероглифы он распознаёт ,а то, что  он распознаёт  формат  caj,которым закодировано большинство текстов  в базе данных CNKI (China National Knowledge Infrastructure).