Восточное Полушарие

Китайский форум => Китайский язык: письменность, изучение, диалекты, вэньянь => Китайский Язык: компьютеры, программы, шрифты => Topic started by: Dannisi on 23 July 2007 09:47:53

Title: сканирование и распознавание китайского язка - проблема
Post by: Dannisi on 23 July 2007 09:47:53
есть проблема : при сканировании Fine readerом китайские тексты не распознаются. заходил на сайт АВВУ в языках есть все кроме китайского корейского и японского.
где можно скачать китайский для файн реадера или другую программу для сканированя китайскйих текстов в ворд, что бы установить на русскую винду
Title: Re: сканирование и распознавание китайского язка - проблема
Post by: IgOriOk on 29 July 2007 21:48:25
Quote from: Dannisi on 23 July 2007 09:47:53
есть проблема : при сканировании Fine readerом китайские тексты не распознаются. заходил на сайт АВВУ в языках есть все кроме китайского корейского и японского.
где можно скачать китайский для файн реадера или другую программу для сканированя китайскйих текстов в ворд, что бы установить на русскую винду

Fine Reader не умеет распознавать иероглифическое письмо, на сегодняшний момент он предназначен для распознавания азбучного письма.
Для распознавания китайских текстов советую использовать китайское ПО. Таких программ масса: Danqing OCR (丹青文件辨識系統), 清華紫光, Penpower Chinese OCR и т.п
На компьютере под управлением русской версии Windows НЕрусский софт ставится при помощи Microsoft AppLocale Utility (http://www.microsoft.com/globaldev/tools/apploc.mspx)

Title: Re: сканирование и распознавание китайского язка - проблема
Post by: JUPITER on 23 August 2007 12:06:27
Quote from: IgOriOk on 29 July 2007 21:48:25
Quote from: Dannisi on 23 July 2007 09:47:53
есть проблема : при сканировании Fine readerом китайские тексты не распознаются. заходил на сайт АВВУ в языках есть все кроме китайского корейского и японского.
где можно скачать китайский для файн реадера или другую программу для сканированя китайскйих текстов в ворд, что бы установить на русскую винду

Fine Reader не умеет распознавать иероглифическое письмо, на сегодняшний момент он предназначен для распознавания азбучного письма.
Для распознавания китайских текстов советую использовать китайское ПО. Таких программ масса: Danqing OCR (丹青文件辨識系統), 清華紫光, Penpower Chinese OCR и т.п
На компьютере под управлением русской версии Windows НЕрусский софт ставится при помощи Microsoft AppLocale Utility (http://www.microsoft.com/globaldev/tools/apploc.mspx)

Уважаемый IgOriOk!

А не подскажете -где можно скачать указанные Вами программы?

Спасибо!
Title: Re: сканирование и распознавание китайского язка - проблема
Post by: Bayan on 29 August 2007 15:33:54
Есть еще в китайском офисе встроенная OCR-программа, но не уверен, что китайский офис на русскоязычную ОС встанет (не пробовал).
Title: Re: сканирование и распознавание китайского язка - проблема
Post by: IgOriOk on 29 August 2007 16:28:49
Если Вы находитесь в Китае - то это не проблема. Продаются диски везде: от компьютерных рынков до книжных магазинов.
Скачать можно попробовать при помощи программы Emule, по крайней мере программу Danqing OCR (丹青文件辨識系統) там найти точно можно.
Title: Re: сканирование и распознавание китайского язка - проблема
Post by: Fajh on 14 September 2007 10:56:06
а эта прога распознает из
ПДФ? а то скачал книгу.ХОЧУ ПЕРЕВЕСТИ, А ВРУЧНУЮ ДОЛГО И ДОЛГО. ХОТЕЛОСЬ БЫ НЕАНОГО УСКОРИТЬ ПРОЦЕСС.
Title: Re: сканирование и распознавание китайского язка - проблема
Post by: alef65 on 19 November 2007 12:21:06
Привет всем!
1. А нельзя ли тупо кинуть в Файнридер 6.0 какие нить файлы чтобы он начал сканировать иероглифы. Винда ХР, мультиязычная.
2. Какая кодировка здесь на форуме? Набираю иероглифы, а в сообщении кракозябры...
Title: Re: сканирование и распознавание китайского язка - проблема
Post by: qleap on 19 November 2007 13:24:24
Quote from: alef65 on 19 November 2007 12:21:06
Привет всем!
1. А нельзя ли тупо кинуть в Файнридер 6.0 какие нить файлы чтобы он начал сканировать иероглифы. Винда ХР, мультиязычная.
Можно. Только смысл? Если только другой программы для сканирования нет... Распознать он их все равно не сможет.
Quote
2. Какая кодировка здесь на форуме? Набираю иероглифы, а в сообщении кракозябры...
Кодировка - Windows CP1251.
Title: Re: сканирование и распознавание китайского язка - проблема
Post by: alef65 on 20 November 2007 13:03:34
Спасибо конечно за ответ, ... ,ээ, но я собственно вот о чём: Файнридер 6.0 распознаёт, к примеру, чешский, захожу C:\program files\ABBYY Finerider 6.0 и вижу там файлы Czech, Czech.amm, Czech.amt. Так вот если положить в эту папку, japan, japan.amm, japan.amt, будет ли Файнридер сканировать японский? Если нет, то может кто нить дать ссылку на Файнридер с чисто азиатским OCR (японск., кит., корейск.), или какой нить сканер азиатского текста, небольшого веса. (Вопрос трафика имеет значение)
Title: Re: сканирование и распознавание китайского язка - проблема
Post by: qleap on 20 November 2007 20:06:38
Quote from: alef65 on 20 November 2007 13:03:34
Спасибо конечно за ответ, ... ,ээ, но я собственно вот о чём: Файнридер 6.0 распознаёт, к примеру, чешский, захожу C:\program files\ABBYY Finerider 6.0 и вижу там файлы Czech, Czech.amm, Czech.amt. Так вот если положить в эту папку, japan, japan.amm, japan.amt, будет ли Файнридер сканировать японский? Если нет, то может кто нить дать ссылку на Файнридер с чисто азиатским OCR (японск., кит., корейск.), или какой нить сканер азиатского текста, небольшого веса. (Вопрос трафика имеет значение)
Собственно Файнридер не поддерживает иероглифические языки. Совсем. Так что никакими файлами это не исправить (кроме как "отвинтить крышку бензобака и заменить машину в сборе"). Можно конечно попробовать его натренировать на часть символов, но овчинка не стоит выделки.
Лучше посмотрите в этом разделе довольно много ссылок как раз-таки на распознавалки для иероглифов. Банальный поиск поможет.
Title: Re: сканирование и распознавание китайского язка - проблема
Post by: alef65 on 23 November 2007 12:13:54
Аа, понятно, а я то думал последние версии Файнридера поддерживают азиатские языки. Спасибо за ответы.
Title: Re: сканирование и распознавание китайского язка - проблема
Post by: alef65 on 26 November 2007 03:14:48
Привет всем!
Ну вот поюзал я Гугл, на русском и английском на данную тему и ... ничего не нашёл :-( Тогда сделал запрос на китайском в поисковик Байду и нашёл прямую ссылку на DanQing 4.0 Gold (Maxreader) (21 мб). Мож кто юзает сие чудо, поделимся опытом (про Shangshu, Readiris и т.п. сканерах я знаю-много весят)
Title: Re: сканирование и распознавание китайского язка - проблема
Post by: vikleto on 04 December 2007 23:09:41
Всем благ. Может я ни туда пишу - перенаправте. Видел некоторую информацию, что набирать китайские иероглифы на компьютере можно не только через пининь как в винде, а и непосредственно собирая их из знаков, есть мол такие проги. Т.е. не обязательно произношениее знать - а собрал, записал, электронным словарем отсканировал и вот тебе значение и произношение. Помогите подскажите кто что знает, а может и пользуется.
Title: Re: сканирование и распознавание китайского язка - проблема
Post by: qleap on 05 December 2007 07:58:11
Quote from: vikleto on 04 December 2007 23:09:41
Всем благ. Может я ни туда пишу - перенаправте. Видел некоторую информацию, что набирать китайские иероглифы на компьютере можно не только через пининь как в винде, а и непосредственно собирая их из знаков, есть мол такие проги. Т.е. не обязательно произношениее знать - а собрал, записал, электронным словарем отсканировал и вот тебе значение и произношение. Помогите подскажите кто что знает, а может и пользуется.
http://forum.vostokopedia.ru/index.php?showtopic=13
Вот тут много чего описано.
Если включить поддержку Тайваньского китайского, то можно рисовать мышкой.
Сканирование тут действительно ни при чем.
Title: Re: сканирование и распознавание китайского язка - проблема
Post by: paveleon on 23 December 2007 03:38:06
Я такой распознавалкой пользуюсь:
http://forum.vostokopedia.ru/index.php?showtopic=2344
Кстати, может кто  знает OCR для китайских субтитров?
Title: Re: сканирование и распознавание китайског
Post by: Victor_V_V on 31 March 2008 17:14:20
Quote from: qleap on 20 November 2007 20:06:38
Собственно Файнридер не поддерживает иероглифические языки. Совсем. Так что никакими файлами это не исправить (кроме как "отвинтить крышку бензобака и заменить машину в сборе"). Можно конечно попробовать его натренировать на часть символов, но овчинка не стоит выделки.
Лучше посмотрите в этом разделе довольно много ссылок как раз-таки на распознавалки для иероглифов. Банальный поиск поможет.
Зато есть  ABBYY FineReader Engine 8.0

http://www.ocr.sk/default_Engine_Engine_80.htm
It also has additional recognition functions specifically designed for international conversion or capturing projects, such as Fast Mode Recognition, Document Analysis for Invoices, CJK OCR (Recognition of Chinese, Japanese, and Korean), etc.

Никто не пробовал?
Title: Re: сканирование и распознавание китайског
Post by: qleap on 31 March 2008 20:44:39
Quote from: Victor_V_V on 31 March 2008 17:14:20
....
Зато есть  ABBYY FineReader Engine 8.0

http://www.ocr.sk/default_Engine_Engine_80.htm
It also has additional recognition functions specifically designed for international conversion or capturing projects, such as Fast Mode Recognition, Document Analysis for Invoices, CJK OCR (Recognition of Chinese, Japanese, and Korean), etc.

Никто не пробовал?
В каком смысле? Программировал ли кто-нибудь здесь под этот SDK? Который стоит к тому же как фотошоп (в смысле лицензионный).
Вот если бы в ABBYY не поленились и включили все эти возможности в сам FineReader, то было бы дело. А так...
Title: Re: сканирование и распознавание китайского язка - проблема
Post by: nogakota on 19 July 2010 06:22:43
ABBYY Finereader 9.0.0.1019 Professional Edition  - начиная с этой новой версии, добавлена поддержка распознавания традиционного и упрощенного китайских языков.

http://magazeta.com/soft/2010/01/08/readiris-corporate-asian-12-0-5702-portable/

Так же слышал про Readiris Pro — OCR-система, пакeт для распознавания текста.  O:)
Title: Re: сканирование и распознавание китайского язка - проб
Post by: nogakota on 19 July 2010 06:25:34
А ещё http://magazeta.com/soft/2010/02/13/han-wang-7600/

Han Wang 7600

Но мне кажется это фигня...так же как и Readiris Pro!

Сегодня-завтра постараюсь ABBYY Finereader 9 или 10 установить... что и как получилось отпишусь....
Title: Re: сканирование и распознавание китайского язка - проблема
Post by: Cubana on 19 July 2010 07:31:45
Quote from: nogakota on 19 July 2010 06:22:43
Так же слышал про Readiris Pro — OCR-система, пакeт для распознавания текста.  O:)
ставил я этот Readiris.
ИМХО- полнейший маразм, для использования не пригодно. Пришлось стереть.
Title: Re: сканирование и распознавание китайского язка - проблема
Post by: Marishka06 on 17 November 2010 10:40:15
здравствуйте, может я ни туда пишу, но из всего вышеизложенного не поняла ничего, просто подскажите мне, что нужно установить на компьютер, чтобы он видел иероглифы, а не квадратики вместо иероглифоф. спасибо за ответ!
Title: Re: сканирование и распознавание китайского язка - проблема
Post by: Criptozavr on 17 November 2010 12:12:04
Quote from: Marishka06 on 17 November 2010 10:40:15
здравствуйте, может я ни туда пишу, но из всего вышеизложенного не поняла ничего, просто подскажите мне, что нужно установить на компьютер, чтобы он видел иероглифы, а не квадратики вместо иероглифоф. спасибо за ответ!

Обычно это делается так: Панель управления — Язык и региональные стандарты — Языки — Установить поддержку языков с письмом иероглифами — Применить — ОК. Дальше все может происходить по двум сценариям: 1) система найдет нужную папку (i386), скопирует из нее нужные шрифты, установит их и попросит перезагрузку 2) система попросит вставить инсталяционный диск с Windows, с которого будет скопирована и установлена вся необходимая информация. Есть еще и третий вариант, при котором у Вас отсутствует папка i386 или на компакт-диске с Windows отсутствует (вырезана) папка с восточными языками. В этом случае Вам придется ее скачать:

http://rapidshare.com/files/153892608/LANG.rar

... распаковать и проделать все шаги, указанные в первом сценарии. После того, как установка прервется и система попросит Вас вставить компакт-диск, нажать ОК — Обзор, указать папку i386, найти в папке LANG файл CPEEXE.EX, нажать Открыть — ОК. Начнется копирование файлов, которое прервется на определенном моменте, и Вас попросят еще раз вставить компакт-диск. Опять находите папку i386, а в ней файл XJIS.NL_ Жмете Открыть — ОК и ждете окончания копирования и установки. Когда все закончится, система попросит перезагрузку — соглашаетесь. После перезагрузки Пуск - Панель управления - Языки и региональные стандарты - Языки - Подробнее - Добавить - Жмете на ПЕРВУЮ стрелку, показывающую вниз и выбираете из выпадающего списка Китайский (КНР) - ОК - Применить - ОК. После этого попробуйте клавишами переключения языков поменять раскладку клавиатуры. Среди прочих там теперь должен присутствовать CHN или CN - это и есть китайский :)
Title: Re: сканирование и распознавание китайского язка - проблема
Post by: Marishka06 on 19 November 2010 13:11:17
Спасибо, все получилось! Теперь мой комп видит иероглифы ёхууууу
Title: Re: сканирование и распознавание китайского язка - проб�
Post by: maresin on 02 February 2011 00:01:25
Говоря о различных OCR-программах, никто не упомянул об Adobe Acrobat. А он очень неплохо сканирует и иерогифику, в том числе. Конечно долго, но в результате получаешь распознанный PDF-документ, который и расшивать не пришлось. Распознается естественно не все, но жизнь сильно облегчает. Я так распознавал некоторые китайские словари.

А что касается сканирования отдельных страниц и их частей в ручном режиме, то HanWang, по моему, удобнее всех. Однако, при работе с ней надо учитывать следующее: 1) копирование текста возможно только в китайских кодировках (РЕШЕНИЕ: из HanWang текст сначала копируется в NJStar WP, а оттуда в любой текстовый редактор, поддерживающий уникод); 2) для удобства работы вам потребляться делать снимок части экрана (РЕШЕНИЕ: небольшие программки, вроде SnippingTool от Александра Коурова); 3) Снимок должен быть в максимальном увеличении, выделены в HanWang должны быть только необходимые иероглифы и в максимальном увеличении;4) Не помню точно, но HanWang кажется требует установки локали? (РЕШЕНИЕ: Microsoft AppLocale).

Ну вот кажется все...
Title: Re: сканирование и распознавание китайского язка - проблема
Post by: timpor on 23 April 2015 08:59:00
Китайский язык нормально поддерживается finereader-ом http://geek-nose.com/5-programm-raspoznavaniya-teksta-chto-skachat-besplatno/ (http://geek-nose.com/5-programm-raspoznavaniya-teksta-chto-skachat-besplatno/)
только нужно системную поддержку соответствующих языков включить в систему
CuneiForm тоже поможет.
из списка программ, указанного выше можно еще попробовать freemore ocr, помоему там поддержка китайского есть.
Title: Re: сканирование и распознавание китайского язка - проблема
Post by: newcash2012@yandex.ru on 11 September 2016 11:06:16
Quote from: timpor on 23 April 2015 08:59:00
Китайский язык нормально поддерживается finereader-ом http://atmosoft.ru/61-abbyy-finereader.html (http://atmosoft.ru/61-abbyy-finereader.html)
только нужно системную поддержку соответствующих языков включить в систему
CuneiForm тоже поможет.
из списка программ, указанного выше можно еще попробовать freemore ocr, помоему там поддержка китайского есть.
По вышей ссылке ФайнРидер не скачивается, можете дать ссылку на официальный сайт?
Title: Re: сканирование и распознавание китайского язка - проблема
Post by: mamoncity@yandex.ru on 06 March 2017 02:18:39
На оф сайте FineReader можно только купить, а на варез ссылки размещать не хочется. Поищите на торренах. Недавно тоже искал нормальный онлайн переводчик с китайского нашел только QTranslate http://only-free-soft.ru/programs/electronic-documents/translators (http://only-free-soft.ru/programs/electronic-documents/translators) . Может кто поделиться опытом использования и ссылкой на более мощный переводчик.
Title: Re: сканирование и распознавание китайского язка - проблема
Post by: g1007 on 31 July 2017 11:08:43
     Два-три месяца назад взял пробную версию ABBYY FineReader. Попробовал 2-3 листа, в том числе на красной бумаге (типа памятки от пожарников). Последний раз лет пятнадцать назад пользовался распознавалкой. Теперь уже 2017 год, много лет прошло. Оказалось, что эта прога нынче очень хорошо распознаёт китайский!  :) Жаль, что руководство жмотничает на программах, не соглашается покупать. Купил себе год-два назад словарь Лингво, без словаря никак, а файнридер потом уже куплю, когда придётся много текста набивать со сканированных листов. Если постоянно набивать текст со сканов, то своих денег файнридер стоит.
     Кстати, находясь в Китае, продукцию купить можно, оплатив с банковской карты. Я за словарь картой CCB платил. А вот дистрибутив скачать обычно проблемно - частые сбои, а через ВПН медленно, и тоже сбои. приходится по почте связываться со службой поддержки. Отвечают быстро.