Автор Тема: Как вычленить иероглифы в PDF-файле.  (Прочитано 20312 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Cosmopolit

  • Пионер
  • **
  • Сообщений: 80
  • Карма: 6
  • Пол: Мужской
Вот PDF-файл (урок chinesepod)
http://www.hotlinkfiles.com/files/2627405_zkuib/B0057-TheTrafficJam.pdf

Никак не получается в PDF-файле делать поиск по иероглифу. А мне это очень надо.  никакая программа по чтению PDF не видит эти иероглифы, они напечатаны каким-то невидимым способом.
Пробовал конвертировать в Word и в другие форматы, но при конвертации иероглифы пропадают

Попробуйте, может у вас получится?


Оффлайн Sinoeducator

  • Глобал-модератор
  • Заслуженный
  • *****
  • Сообщений: 4768
  • Карма: 208
  • Пол: Мужской
Re: Как вычленить иероглифы в PDF-файле.
« Ответ #1 : 22 Июня 2009 17:00:11 »
Проще посадить рядом знакомого китаиста, он за пять минут наберёт эти фразы и слова Вам вручную :)

Оффлайн HATAIIIA

  • Бывалый
  • ***
  • Сообщений: 112
  • Карма: 3
  • Пол: Женский
Re: Как вычленить иероглифы в PDF-файле.
« Ответ #2 : 22 Июня 2009 17:11:14 »
А Вам именно поиск нужен? Или просто фразу из pdf вычленить, чтобы потом ее в другом месте вставить?

Оффлайн Cosmopolit

  • Пионер
  • **
  • Сообщений: 80
  • Карма: 6
  • Пол: Мужской
Re: Как вычленить иероглифы в PDF-файле.
« Ответ #3 : 22 Июня 2009 17:13:34 »
Наташа, я прошу обращаться ко мне на ты.

Мне либо поиск, либо вставить (в зависимости от то, что проще).

Оффлайн HATAIIIA

  • Бывалый
  • ***
  • Сообщений: 112
  • Карма: 3
  • Пол: Женский
Re: Как вычленить иероглифы в PDF-файле.
« Ответ #4 : 22 Июня 2009 17:21:47 »
Хорошо, на ты так на ты :)
Там скорее всего защита какая-то стоит в этих файлах. Поэтому насчет поиска ничего не могу подсказать. Скорее всего есть программы специальные.
А если просто нужно фразу куда-то вставить, то проще через ПиньИнь самому набрать. Установи у себя на компьютере помимо русского и английского языков еще китайский, и проблем не будет. Просто придется самому нужные фразы набирать. Ну зато запомнится лучше :).
Китайский язык в языковую панель устанавливается очень легко. Я где-то на форуме писала, как это сделать в Висте. Там даже перезагружаться не придется.
« Последнее редактирование: 22 Июня 2009 17:32:28 от HATAIIIA »

Оффлайн Cosmopolit

  • Пионер
  • **
  • Сообщений: 80
  • Карма: 6
  • Пол: Мужской
Re: Как вычленить иероглифы в PDF-файле.
« Ответ #5 : 22 Июня 2009 17:34:21 »
я поясню зачем мне это надо.

Например, я хочу послушать предложение с каким-то конкретным иероглифом. Я хочу найти уроки в которых он встречался.
для этого мне надо набрать вручную все тексты? )))

Оффлайн HATAIIIA

  • Бывалый
  • ***
  • Сообщений: 112
  • Карма: 3
  • Пол: Женский
Re: Как вычленить иероглифы в PDF-файле.
« Ответ #6 : 22 Июня 2009 17:55:33 »
А, теперь понятно для чего это нужно)
Набирать вручную здесь наверно сложно будет  ;D
Как вариант могу предложить распознать пдф-ки. finereader китайский по-моему не поддерживает (у меня 8-ка, не знаю может в новых версиях китайский распознается), но где-то читала что если порыться в реестре, то можно заставить его это сделать. Ну или другой программой, распознающей иероглифы. Больше ничего подсказать не могу.
« Последнее редактирование: 22 Июня 2009 18:01:04 от HATAIIIA »

Оффлайн qleap

  • Заслуженный
  • *****
  • Сообщений: 724
  • Карма: 39
Re: Как вычленить иероглифы в PDF-файле.
« Ответ #7 : 22 Июня 2009 19:05:39 »
я поясню зачем мне это надо.

Например, я хочу послушать предложение с каким-то конкретным иероглифом. Я хочу найти уроки в которых он встречался.
для этого мне надо набрать вручную все тексты? )))

Рекомендую вам не бороться с этими PDF-ками: в них иероглифы записаны в особой кодировке, поэтому их не удается скопировать в читаемый вид.

В принципе вы можете искать иероглифы по тексту. Скопируйте, например, вашу страничку в какой-нибудь хороший текстовый редактор (рекомендую BabelPad) и сопоставьте полученную белиберду написанным иероглифам. Для вашей странички, например, буква w соответствует иероглифу .

Но особого смысла я в вашем упражнении (поиске определенных иероглифов во всех уроках) не вижу, вы уж извините.
« Последнее редактирование: 22 Июня 2009 19:11:02 от qleap »

Оффлайн qleap

  • Заслуженный
  • *****
  • Сообщений: 724
  • Карма: 39
Re: Как вычленить иероглифы в PDF-файле.
« Ответ #8 : 22 Июня 2009 19:07:28 »
Как вариант могу предложить распознать пдф-ки. finereader китайский по-моему не поддерживает (у меня 8-ка, не знаю может в новых версиях китайский распознается),
Да, таки распознается. В 9-ой версии.
Цитировать
но где-то читала что если порыться в реестре, то можно заставить его это сделать.
Это миф.

Оффлайн Cosmopolit

  • Пионер
  • **
  • Сообщений: 80
  • Карма: 6
  • Пол: Мужской
Re: Как вычленить иероглифы в PDF-файле.
« Ответ #9 : 26 Июня 2009 20:17:18 »
Вот в этом топике
http://polusharie.com/index.php?topic=96194

один добрый человек выложил файнридер 9-й версии, который распознает в т.ч. pdf, в т.ч. китайский текст. Я попробовал, получилрсь.