Приветствуем! Мы запустили новую версию форума. Надеемся что вам она понравится. Если вы нашли проблему или у вас есть предложения - напишите нам :)

сканирование и распознавание китайского язка - проблема

есть проблема : при сканировании Fine readerом китайские тексты не распознаются. заходил на сайт АВВУ в языках есть все кроме китайского корейского и японского.
где можно скачать китайский для файн реадера или другую программу для сканированя китайскйих текстов в ворд, что бы установить на русскую винду

Написать комментарий...
IgOriOk
13 years ago
есть проблема : при сканировании Fine readerом китайские тексты не распознаются. заходил на сайт АВВУ в языках есть все кроме китайского корейского и японского.
где можно скачать китайский для файн реадера или другую программу для сканированя китайскйих текстов в ворд, что бы установить на русскую винду

Fine Reader не умеет распознавать иероглифическое письмо, на сегодняшний момент он предназначен для распознавания азбучного письма.
Для распознавания китайских текстов советую использовать китайское ПО. Таких программ масса: Danqing OCR (丹青文件辨識系統), 清華紫光, Penpower Chinese OCR и т.п
На компьютере под управлением русской версии Windows НЕрусский софт ставится при помощи Microsoft AppLocale Utility (http://www.microsoft.com/globaldev/tools/apploc.mspx)

Ответить
JUPITER
13 years ago
есть проблема : при сканировании Fine readerом китайские тексты не распознаются. заходил на сайт АВВУ в языках есть все кроме китайского корейского и японского.
где можно скачать китайский для файн реадера или другую программу для сканированя китайскйих текстов в ворд, что бы установить на русскую винду

Fine Reader не умеет распознавать иероглифическое письмо, на сегодняшний момент он предназначен для распознавания азбучного письма.
Для распознавания китайских текстов советую использовать китайское ПО. Таких программ масса: Danqing OCR (丹青文件辨識系統), 清華紫光, Penpower Chinese OCR и т.п
На компьютере под управлением русской версии Windows НЕрусский софт ставится при помощи Microsoft AppLocale Utility (http://www.microsoft.com/globaldev/tools/apploc.mspx)

Уважаемый IgOriOk!

А не подскажете -где можно скачать указанные Вами программы?

Спасибо!

Ответить
Bayan
13 years ago

Есть еще в китайском офисе встроенная OCR-программа, но не уверен, что китайский офис на русскоязычную ОС встанет (не пробовал).

Ответить
IgOriOk
13 years ago

Если Вы находитесь в Китае - то это не проблема. Продаются диски везде: от компьютерных рынков до книжных магазинов.
Скачать можно попробовать при помощи программы Emule, по крайней мере программу Danqing OCR (丹青文件辨識系統) там найти точно можно.

Ответить
Fajh
13 years ago

а эта прога распознает из
ПДФ? а то скачал книгу.ХОЧУ ПЕРЕВЕСТИ, А ВРУЧНУЮ ДОЛГО И ДОЛГО. ХОТЕЛОСЬ БЫ НЕАНОГО УСКОРИТЬ ПРОЦЕСС.

Ответить
alef65
13 years ago

Привет всем!
1. А нельзя ли тупо кинуть в Файнридер 6.0 какие нить файлы чтобы он начал сканировать иероглифы. Винда ХР, мультиязычная.
2. Какая кодировка здесь на форуме? Набираю иероглифы, а в сообщении кракозябры...

Ответить
qleap
13 years ago
Привет всем!
1. А нельзя ли тупо кинуть в Файнридер 6.0 какие нить файлы чтобы он начал сканировать иероглифы. Винда ХР, мультиязычная.

Можно. Только смысл? Если только другой программы для сканирования нет... Распознать он их все равно не сможет.

2. Какая кодировка здесь на форуме? Набираю иероглифы, а в сообщении кракозябры...

Кодировка - Windows CP1251.

Ответить
alef65
13 years ago

Спасибо конечно за ответ, ... ,ээ, но я собственно вот о чём: Файнридер 6.0 распознаёт, к примеру, чешский, захожу C:\program files\ABBYY Finerider 6.0 и вижу там файлы Czech, Czech.amm, Czech.amt. Так вот если положить в эту папку, japan, japan.amm, japan.amt, будет ли Файнридер сканировать японский? Если нет, то может кто нить дать ссылку на Файнридер с чисто азиатским OCR (японск., кит., корейск.), или какой нить сканер азиатского текста, небольшого веса. (Вопрос трафика имеет значение)

Ответить
qleap
13 years ago
Спасибо конечно за ответ, ... ,ээ, но я собственно вот о чём: Файнридер 6.0 распознаёт, к примеру, чешский, захожу C:\program files\ABBYY Finerider 6.0 и вижу там файлы Czech, Czech.amm, Czech.amt. Так вот если положить в эту папку, japan, japan.amm, japan.amt, будет ли Файнридер сканировать японский? Если нет, то может кто нить дать ссылку на Файнридер с чисто азиатским OCR (японск., кит., корейск.), или какой нить сканер азиатского текста, небольшого веса. (Вопрос трафика имеет значение)

Собственно Файнридер не поддерживает иероглифические языки. Совсем. Так что никакими файлами это не исправить (кроме как "отвинтить крышку бензобака и заменить машину в сборе"). Можно конечно попробовать его натренировать на часть символов, но овчинка не стоит выделки.
Лучше посмотрите в этом разделе довольно много ссылок как раз-таки на распознавалки для иероглифов. Банальный поиск поможет.

Ответить
alef65
13 years ago

Аа, понятно, а я то думал последние версии Файнридера поддерживают азиатские языки. Спасибо за ответы.

Ответить
alef65
13 years ago

Привет всем!
Ну вот поюзал я Гугл, на русском и английском на данную тему и ... ничего не нашёл :-( Тогда сделал запрос на китайском в поисковик Байду и нашёл прямую ссылку на DanQing 4.0 Gold (Maxreader) (21 мб). Мож кто юзает сие чудо, поделимся опытом (про Shangshu, Readiris и т.п. сканерах я знаю-много весят)

Ответить
vikleto
13 years ago

Всем благ. Может я ни туда пишу - перенаправте. Видел некоторую информацию, что набирать китайские иероглифы на компьютере можно не только через пининь как в винде, а и непосредственно собирая их из знаков, есть мол такие проги. Т.е. не обязательно произношениее знать - а собрал, записал, электронным словарем отсканировал и вот тебе значение и произношение. Помогите подскажите кто что знает, а может и пользуется.

Ответить
qleap
13 years ago
Всем благ. Может я ни туда пишу - перенаправте. Видел некоторую информацию, что набирать китайские иероглифы на компьютере можно не только через пининь как в винде, а и непосредственно собирая их из знаков, есть мол такие проги. Т.е. не обязательно произношениее знать - а собрал, записал, электронным словарем отсканировал и вот тебе значение и произношение. Помогите подскажите кто что знает, а может и пользуется.

http://forum.vostokopedia.ru/index.php?showtopic=13
Вот тут много чего описано.
Если включить поддержку Тайваньского китайского, то можно рисовать мышкой.
Сканирование тут действительно ни при чем.

Ответить
paveleon
13 years ago

Я такой распознавалкой пользуюсь:
http://forum.vostokopedia.ru/index.php?showtopic=2344
Кстати, может кто знает OCR для китайских субтитров?

Ответить
Victor_V_V
13 years ago
Собственно Файнридер не поддерживает иероглифические языки. Совсем. Так что никакими файлами это не исправить (кроме как "отвинтить крышку бензобака и заменить машину в сборе"). Можно конечно попробовать его натренировать на часть символов, но овчинка не стоит выделки.
Лучше посмотрите в этом разделе довольно много ссылок как раз-таки на распознавалки для иероглифов. Банальный поиск поможет.

Зато есть ABBYY FineReader Engine 8.0

http://www.ocr.sk/default_Engine_Engine_80.htm
It also has additional recognition functions specifically designed for international conversion or capturing projects, such as Fast Mode Recognition, Document Analysis for Invoices, CJK OCR (Recognition of Chinese, Japanese, and Korean), etc.

Никто не пробовал?

Ответить
qleap
13 years ago
....
Зато есть ABBYY FineReader Engine 8.0

http://www.ocr.sk/default_Engine_Engine_80.htm
It also has additional recognition functions specifically designed for international conversion or capturing projects, such as Fast Mode Recognition, Document Analysis for Invoices, CJK OCR (Recognition of Chinese, Japanese, and Korean), etc.

Никто не пробовал?

В каком смысле? Программировал ли кто-нибудь здесь под этот SDK? Который стоит к тому же как фотошоп (в смысле лицензионный).
Вот если бы в ABBYY не поленились и включили все эти возможности в сам FineReader, то было бы дело. А так...

Ответить
nogakota
11 years ago

ABBYY Finereader 9.0.0.1019 Professional Edition - начиная с этой новой версии, добавлена поддержка распознавания традиционного и упрощенного китайских языков.

http://magazeta.com/soft/2010/01/08/readiris-corporate-asian-12-0-5702-portable/

Так же слышал про Readiris Pro — OCR-система, пакeт для распознавания текста. O🙂

Ответить
nogakota
11 years ago

А ещё http://magazeta.com/soft/2010/02/13/han-wang-7600/

Han Wang 7600

Но мне кажется это фигня...так же как и Readiris Pro!

Сегодня-завтра постараюсь ABBYY Finereader 9 или 10 установить... что и как получилось отпишусь....

Ответить
Cubana
11 years ago
Так же слышал про Readiris Pro — OCR-система, пакeт для распознавания текста. O🙂

ставил я этот Readiris.
ИМХО- полнейший маразм, для использования не пригодно. Пришлось стереть.

Ответить
Marishka06
10 years ago

здравствуйте, может я ни туда пишу, но из всего вышеизложенного не поняла ничего, просто подскажите мне, что нужно установить на компьютер, чтобы он видел иероглифы, а не квадратики вместо иероглифоф. спасибо за ответ!

Ответить
Criptozavr
10 years ago
здравствуйте, может я ни туда пишу, но из всего вышеизложенного не поняла ничего, просто подскажите мне, что нужно установить на компьютер, чтобы он видел иероглифы, а не квадратики вместо иероглифоф. спасибо за ответ!

Обычно это делается так: Панель управления — Язык и региональные стандарты — Языки — Установить поддержку языков с письмом иероглифами — Применить — ОК. Дальше все может происходить по двум сценариям: 1) система найдет нужную папку (i386), скопирует из нее нужные шрифты, установит их и попросит перезагрузку 2) система попросит вставить инсталяционный диск с Windows, с которого будет скопирована и установлена вся необходимая информация. Есть еще и третий вариант, при котором у Вас отсутствует папка i386 или на компакт-диске с Windows отсутствует (вырезана) папка с восточными языками. В этом случае Вам придется ее скачать:

http://rapidshare.com/files/153892608/LANG.rar

... распаковать и проделать все шаги, указанные в первом сценарии. После того, как установка прервется и система попросит Вас вставить компакт-диск, нажать ОК — Обзор, указать папку i386, найти в папке LANG файл CPEEXE.EX, нажать Открыть — ОК. Начнется копирование файлов, которое прервется на определенном моменте, и Вас попросят еще раз вставить компакт-диск. Опять находите папку i386, а в ней файл XJIS.NL_ Жмете Открыть — ОК и ждете окончания копирования и установки. Когда все закончится, система попросит перезагрузку — соглашаетесь. После перезагрузки Пуск - Панель управления - Языки и региональные стандарты - Языки - Подробнее - Добавить - Жмете на ПЕРВУЮ стрелку, показывающую вниз и выбираете из выпадающего списка Китайский (КНР) - ОК - Применить - ОК. После этого попробуйте клавишами переключения языков поменять раскладку клавиатуры. Среди прочих там теперь должен присутствовать CHN или CN - это и есть китайский 🙂

Ответить
Marishka06
10 years ago

Спасибо, все получилось! Теперь мой комп видит иероглифы ёхууууу

Ответить
maresin
10 years ago

Говоря о различных OCR-программах, никто не упомянул об Adobe Acrobat. А он очень неплохо сканирует и иерогифику, в том числе. Конечно долго, но в результате получаешь распознанный PDF-документ, который и расшивать не пришлось. Распознается естественно не все, но жизнь сильно облегчает. Я так распознавал некоторые китайские словари.

А что касается сканирования отдельных страниц и их частей в ручном режиме, то HanWang, по моему, удобнее всех. Однако, при работе с ней надо учитывать следующее: 1) копирование текста возможно только в китайских кодировках (РЕШЕНИЕ: из HanWang текст сначала копируется в NJStar WP, а оттуда в любой текстовый редактор, поддерживающий уникод); 2) для удобства работы вам потребляться делать снимок части экрана (РЕШЕНИЕ: небольшие программки, вроде SnippingTool от Александра Коурова); 3) Снимок должен быть в максимальном увеличении, выделены в HanWang должны быть только необходимые иероглифы и в максимальном увеличении;4) Не помню точно, но HanWang кажется требует установки локали? (РЕШЕНИЕ: Microsoft AppLocale).

Ну вот кажется все...

Ответить
timpor
6 years ago

Китайский язык нормально поддерживается finereader-ом http://geek-nose.com/5-programm-raspoznavaniya-teksta-chto-skachat-besplatno/
только нужно системную поддержку соответствующих языков включить в систему
CuneiForm тоже поможет.
из списка программ, указанного выше можно еще попробовать freemore ocr, помоему там поддержка китайского есть.

Ответить