Восточное Полушарие

Китайский форум => Китайский язык: письменность, изучение, диалекты, вэньянь => Китайский Язык: компьютеры, программы, шрифты => Тема начата: Dannisi от 23 Июля 2007 16:47:53

Название: сканирование и распознавание китайского язка - проблема
Отправлено: Dannisi от 23 Июля 2007 16:47:53
есть проблема : при сканировании Fine readerом китайские тексты не распознаются. заходил на сайт АВВУ в языках есть все кроме китайского корейского и японского.
где можно скачать китайский для файн реадера или другую программу для сканированя китайскйих текстов в ворд, что бы установить на русскую винду
Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: IgOriOk от 30 Июля 2007 04:48:25
есть проблема : при сканировании Fine readerом китайские тексты не распознаются. заходил на сайт АВВУ в языках есть все кроме китайского корейского и японского.
где можно скачать китайский для файн реадера или другую программу для сканированя китайскйих текстов в ворд, что бы установить на русскую винду

Fine Reader не умеет распознавать иероглифическое письмо, на сегодняшний момент он предназначен для распознавания азбучного письма.
Для распознавания китайских текстов советую использовать китайское ПО. Таких программ масса: Danqing OCR (丹青文件辨識系統), 清華紫光, Penpower Chinese OCR и т.п
На компьютере под управлением русской версии Windows НЕрусский софт ставится при помощи Microsoft AppLocale Utility (http://www.microsoft.com/globaldev/tools/apploc.mspx)

Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: JUPITER от 23 Августа 2007 19:06:27
есть проблема : при сканировании Fine readerом китайские тексты не распознаются. заходил на сайт АВВУ в языках есть все кроме китайского корейского и японского.
где можно скачать китайский для файн реадера или другую программу для сканированя китайскйих текстов в ворд, что бы установить на русскую винду

Fine Reader не умеет распознавать иероглифическое письмо, на сегодняшний момент он предназначен для распознавания азбучного письма.
Для распознавания китайских текстов советую использовать китайское ПО. Таких программ масса: Danqing OCR (丹青文件辨識系統), 清華紫光, Penpower Chinese OCR и т.п
На компьютере под управлением русской версии Windows НЕрусский софт ставится при помощи Microsoft AppLocale Utility (http://www.microsoft.com/globaldev/tools/apploc.mspx)

Уважаемый IgOriOk!

А не подскажете -где можно скачать указанные Вами программы?

Спасибо!
Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: Bayan от 29 Августа 2007 22:33:54
Есть еще в китайском офисе встроенная OCR-программа, но не уверен, что китайский офис на русскоязычную ОС встанет (не пробовал).
Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: IgOriOk от 29 Августа 2007 23:28:49
Если Вы находитесь в Китае - то это не проблема. Продаются диски везде: от компьютерных рынков до книжных магазинов.
Скачать можно попробовать при помощи программы Emule, по крайней мере программу Danqing OCR (丹青文件辨識系統) там найти точно можно.
Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: Fajh от 14 Сентября 2007 17:56:06
а эта прога распознает из
ПДФ? а то скачал книгу.ХОЧУ ПЕРЕВЕСТИ, А ВРУЧНУЮ ДОЛГО И ДОЛГО. ХОТЕЛОСЬ БЫ НЕАНОГО УСКОРИТЬ ПРОЦЕСС.
Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: alef65 от 19 Ноября 2007 19:21:06
Привет всем!
1. А нельзя ли тупо кинуть в Файнридер 6.0 какие нить файлы чтобы он начал сканировать иероглифы. Винда ХР, мультиязычная.
2. Какая кодировка здесь на форуме? Набираю иероглифы, а в сообщении кракозябры...
Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: qleap от 19 Ноября 2007 20:24:24
Привет всем!
1. А нельзя ли тупо кинуть в Файнридер 6.0 какие нить файлы чтобы он начал сканировать иероглифы. Винда ХР, мультиязычная.
Можно. Только смысл? Если только другой программы для сканирования нет... Распознать он их все равно не сможет.
Цитировать
2. Какая кодировка здесь на форуме? Набираю иероглифы, а в сообщении кракозябры...
Кодировка - Windows CP1251.
Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: alef65 от 20 Ноября 2007 20:03:34
Спасибо конечно за ответ, ... ,ээ, но я собственно вот о чём: Файнридер 6.0 распознаёт, к примеру, чешский, захожу C:\program files\ABBYY Finerider 6.0 и вижу там файлы Czech, Czech.amm, Czech.amt. Так вот если положить в эту папку, japan, japan.amm, japan.amt, будет ли Файнридер сканировать японский? Если нет, то может кто нить дать ссылку на Файнридер с чисто азиатским OCR (японск., кит., корейск.), или какой нить сканер азиатского текста, небольшого веса. (Вопрос трафика имеет значение)
Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: qleap от 21 Ноября 2007 03:06:38
Спасибо конечно за ответ, ... ,ээ, но я собственно вот о чём: Файнридер 6.0 распознаёт, к примеру, чешский, захожу C:\program files\ABBYY Finerider 6.0 и вижу там файлы Czech, Czech.amm, Czech.amt. Так вот если положить в эту папку, japan, japan.amm, japan.amt, будет ли Файнридер сканировать японский? Если нет, то может кто нить дать ссылку на Файнридер с чисто азиатским OCR (японск., кит., корейск.), или какой нить сканер азиатского текста, небольшого веса. (Вопрос трафика имеет значение)
Собственно Файнридер не поддерживает иероглифические языки. Совсем. Так что никакими файлами это не исправить (кроме как "отвинтить крышку бензобака и заменить машину в сборе"). Можно конечно попробовать его натренировать на часть символов, но овчинка не стоит выделки.
Лучше посмотрите в этом разделе довольно много ссылок как раз-таки на распознавалки для иероглифов. Банальный поиск поможет.
Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: alef65 от 23 Ноября 2007 19:13:54
Аа, понятно, а я то думал последние версии Файнридера поддерживают азиатские языки. Спасибо за ответы.
Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: alef65 от 26 Ноября 2007 10:14:48
Привет всем!
Ну вот поюзал я Гугл, на русском и английском на данную тему и ... ничего не нашёл :-( Тогда сделал запрос на китайском в поисковик Байду и нашёл прямую ссылку на DanQing 4.0 Gold (Maxreader) (21 мб). Мож кто юзает сие чудо, поделимся опытом (про Shangshu, Readiris и т.п. сканерах я знаю-много весят)
Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: vikleto от 05 Декабря 2007 06:09:41
Всем благ. Может я ни туда пишу - перенаправте. Видел некоторую информацию, что набирать китайские иероглифы на компьютере можно не только через пининь как в винде, а и непосредственно собирая их из знаков, есть мол такие проги. Т.е. не обязательно произношениее знать - а собрал, записал, электронным словарем отсканировал и вот тебе значение и произношение. Помогите подскажите кто что знает, а может и пользуется.
Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: qleap от 05 Декабря 2007 14:58:11
Всем благ. Может я ни туда пишу - перенаправте. Видел некоторую информацию, что набирать китайские иероглифы на компьютере можно не только через пининь как в винде, а и непосредственно собирая их из знаков, есть мол такие проги. Т.е. не обязательно произношениее знать - а собрал, записал, электронным словарем отсканировал и вот тебе значение и произношение. Помогите подскажите кто что знает, а может и пользуется.
http://forum.vostokopedia.ru/index.php?showtopic=13
Вот тут много чего описано.
Если включить поддержку Тайваньского китайского, то можно рисовать мышкой.
Сканирование тут действительно ни при чем.
Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: paveleon от 23 Декабря 2007 10:38:06
Я такой распознавалкой пользуюсь:
http://forum.vostokopedia.ru/index.php?showtopic=2344
Кстати, может кто  знает OCR для китайских субтитров?
Название: Re: сканирование и распознавание китайског
Отправлено: Victor_V_V от 01 Апреля 2008 00:14:20
Собственно Файнридер не поддерживает иероглифические языки. Совсем. Так что никакими файлами это не исправить (кроме как "отвинтить крышку бензобака и заменить машину в сборе"). Можно конечно попробовать его натренировать на часть символов, но овчинка не стоит выделки.
Лучше посмотрите в этом разделе довольно много ссылок как раз-таки на распознавалки для иероглифов. Банальный поиск поможет.
Зато есть  ABBYY FineReader Engine 8.0

http://www.ocr.sk/default_Engine_Engine_80.htm
It also has additional recognition functions specifically designed for international conversion or capturing projects, such as Fast Mode Recognition, Document Analysis for Invoices, CJK OCR (Recognition of Chinese, Japanese, and Korean), etc.

Никто не пробовал?
Название: Re: сканирование и распознавание китайског
Отправлено: qleap от 01 Апреля 2008 03:44:39
....
Зато есть  ABBYY FineReader Engine 8.0

http://www.ocr.sk/default_Engine_Engine_80.htm
It also has additional recognition functions specifically designed for international conversion or capturing projects, such as Fast Mode Recognition, Document Analysis for Invoices, CJK OCR (Recognition of Chinese, Japanese, and Korean), etc.

Никто не пробовал?
В каком смысле? Программировал ли кто-нибудь здесь под этот SDK? Который стоит к тому же как фотошоп (в смысле лицензионный).
Вот если бы в ABBYY не поленились и включили все эти возможности в сам FineReader, то было бы дело. А так...
Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: nogakota от 19 Июля 2010 13:22:43
ABBYY Finereader 9.0.0.1019 Professional Edition  - начиная с этой новой версии, добавлена поддержка распознавания традиционного и упрощенного китайских языков.

http://magazeta.com/soft/2010/01/08/readiris-corporate-asian-12-0-5702-portable/

Так же слышал про Readiris Pro — OCR-система, пакeт для распознавания текста.  O:)
Название: Re: сканирование и распознавание китайского язка - проб
Отправлено: nogakota от 19 Июля 2010 13:25:34
А ещё http://magazeta.com/soft/2010/02/13/han-wang-7600/

Han Wang 7600

Но мне кажется это фигня...так же как и Readiris Pro!

Сегодня-завтра постараюсь ABBYY Finereader 9 или 10 установить... что и как получилось отпишусь....
Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: Cubana от 19 Июля 2010 14:31:45
Так же слышал про Readiris Pro — OCR-система, пакeт для распознавания текста.  O:)
ставил я этот Readiris.
ИМХО- полнейший маразм, для использования не пригодно. Пришлось стереть.
Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: Marishka06 от 17 Ноября 2010 17:40:15
здравствуйте, может я ни туда пишу, но из всего вышеизложенного не поняла ничего, просто подскажите мне, что нужно установить на компьютер, чтобы он видел иероглифы, а не квадратики вместо иероглифоф. спасибо за ответ!
Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: Criptozavr от 17 Ноября 2010 19:12:04
здравствуйте, может я ни туда пишу, но из всего вышеизложенного не поняла ничего, просто подскажите мне, что нужно установить на компьютер, чтобы он видел иероглифы, а не квадратики вместо иероглифоф. спасибо за ответ!

Обычно это делается так: Панель управления — Язык и региональные стандарты — Языки — Установить поддержку языков с письмом иероглифами — Применить — ОК. Дальше все может происходить по двум сценариям: 1) система найдет нужную папку (i386), скопирует из нее нужные шрифты, установит их и попросит перезагрузку 2) система попросит вставить инсталяционный диск с Windows, с которого будет скопирована и установлена вся необходимая информация. Есть еще и третий вариант, при котором у Вас отсутствует папка i386 или на компакт-диске с Windows отсутствует (вырезана) папка с восточными языками. В этом случае Вам придется ее скачать:

http://rapidshare.com/files/153892608/LANG.rar

... распаковать и проделать все шаги, указанные в первом сценарии. После того, как установка прервется и система попросит Вас вставить компакт-диск, нажать ОК — Обзор, указать папку i386, найти в папке LANG файл CPEEXE.EX, нажать Открыть — ОК. Начнется копирование файлов, которое прервется на определенном моменте, и Вас попросят еще раз вставить компакт-диск. Опять находите папку i386, а в ней файл XJIS.NL_ Жмете Открыть — ОК и ждете окончания копирования и установки. Когда все закончится, система попросит перезагрузку — соглашаетесь. После перезагрузки Пуск - Панель управления - Языки и региональные стандарты - Языки - Подробнее - Добавить - Жмете на ПЕРВУЮ стрелку, показывающую вниз и выбираете из выпадающего списка Китайский (КНР) - ОК - Применить - ОК. После этого попробуйте клавишами переключения языков поменять раскладку клавиатуры. Среди прочих там теперь должен присутствовать CHN или CN - это и есть китайский :)
Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: Marishka06 от 19 Ноября 2010 20:11:17
Спасибо, все получилось! Теперь мой комп видит иероглифы ёхууууу
Название: Re: сканирование и распознавание китайского язка - проб�
Отправлено: maresin от 02 Февраля 2011 07:01:25
Говоря о различных OCR-программах, никто не упомянул об Adobe Acrobat. А он очень неплохо сканирует и иерогифику, в том числе. Конечно долго, но в результате получаешь распознанный PDF-документ, который и расшивать не пришлось. Распознается естественно не все, но жизнь сильно облегчает. Я так распознавал некоторые китайские словари.

А что касается сканирования отдельных страниц и их частей в ручном режиме, то HanWang, по моему, удобнее всех. Однако, при работе с ней надо учитывать следующее: 1) копирование текста возможно только в китайских кодировках (РЕШЕНИЕ: из HanWang текст сначала копируется в NJStar WP, а оттуда в любой текстовый редактор, поддерживающий уникод); 2) для удобства работы вам потребляться делать снимок части экрана (РЕШЕНИЕ: небольшие программки, вроде SnippingTool от Александра Коурова); 3) Снимок должен быть в максимальном увеличении, выделены в HanWang должны быть только необходимые иероглифы и в максимальном увеличении;4) Не помню точно, но HanWang кажется требует установки локали? (РЕШЕНИЕ: Microsoft AppLocale).

Ну вот кажется все...
Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: timpor от 23 Апреля 2015 15:59:00
Китайский язык нормально поддерживается finereader-ом http://geek-nose.com/5-programm-raspoznavaniya-teksta-chto-skachat-besplatno/ (http://geek-nose.com/5-programm-raspoznavaniya-teksta-chto-skachat-besplatno/)
только нужно системную поддержку соответствующих языков включить в систему
CuneiForm тоже поможет.
из списка программ, указанного выше можно еще попробовать freemore ocr, помоему там поддержка китайского есть.
Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: [email protected] от 11 Сентября 2016 18:06:16
Китайский язык нормально поддерживается finereader-ом http://atmosoft.ru/61-abbyy-finereader.html (http://atmosoft.ru/61-abbyy-finereader.html)
только нужно системную поддержку соответствующих языков включить в систему
CuneiForm тоже поможет.
из списка программ, указанного выше можно еще попробовать freemore ocr, помоему там поддержка китайского есть.
По вышей ссылке ФайнРидер не скачивается, можете дать ссылку на официальный сайт?
Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: [email protected] от 06 Марта 2017 09:18:39
На оф сайте FineReader можно только купить, а на варез ссылки размещать не хочется. Поищите на торренах. Недавно тоже искал нормальный онлайн переводчик с китайского нашел только QTranslate http://only-free-soft.ru/programs/electronic-documents/translators (http://only-free-soft.ru/programs/electronic-documents/translators) . Может кто поделиться опытом использования и ссылкой на более мощный переводчик.
Название: Re: сканирование и распознавание китайского язка - проблема
Отправлено: g1007 от 31 Июля 2017 18:08:43
     Два-три месяца назад взял пробную версию ABBYY FineReader. Попробовал 2-3 листа, в том числе на красной бумаге (типа памятки от пожарников). Последний раз лет пятнадцать назад пользовался распознавалкой. Теперь уже 2017 год, много лет прошло. Оказалось, что эта прога нынче очень хорошо распознаёт китайский!  :) Жаль, что руководство жмотничает на программах, не соглашается покупать. Купил себе год-два назад словарь Лингво, без словаря никак, а файнридер потом уже куплю, когда придётся много текста набивать со сканированных листов. Если постоянно набивать текст со сканов, то своих денег файнридер стоит.
     Кстати, находясь в Китае, продукцию купить можно, оплатив с банковской карты. Я за словарь картой CCB платил. А вот дистрибутив скачать обычно проблемно - частые сбои, а через ВПН медленно, и тоже сбои. приходится по почте связываться со службой поддержки. Отвечают быстро.