• Welcome to Восточное Полушарие.

News:

Друзья! Форум перенесен на новый сервер, обновлено программное обеспечение, конвертированы данные. Изменений очень много, что-то могло сломаться, что-то не заработать, что-то пропасть. Если вы обнаружили проблему на форуме, пожалуйста, напишите на admin[собака]polusharie.com — постараемся исправить! 02.01.2026

Main Menu

OCR Readiris

Started by Олег, 28 July 2003 18:50:36

Previous topic - Next topic

0 Members and 3 Guests are viewing this topic.

pnkv

Кто-нибудь пользовалься OCR Readiris Pro 8 ?
Поддержка 104 языков, включая восточные.
Подробности:
http://www.irislink.com/opt/uk/products/readiris/asian/index.html

quaxter

#1
Quote from: Олег on 28 July 2003 18:50:36Кто-нибудь пользовалься OCR Readiris Pro 8 ?
Поддержка 104 языков, включая восточные.
Ну, Олег, ты прямо бежишь быстрее паровоза - хоть вагоны к тебе цепляй для повышения КПД.
А релиз этого ReadIris доступен? Ведь триал содержит только английский и французский, за что буржуям огромное спасибо.
И если я правильно понял то, что на ихнем сайте намалёвано, то только Asian add-ons тянут на 102 евры. Я человек не жадный, нго сколько ж тогда вся ReadIris Pro 8 Corporate Edition потянет? Подумать страшно... <изменено> Посмотрел... 202 евры вся сюита, причем одна - для USB, другая - для параллельного порта (LPT, то есть). Сдохнуть можно :(
От меня уже все мои пираты знакомые по поводу CJK-софта как завидят, так под прилавок прячутся. Затрахал, говорят :( А я чтой-то ничего подобного не помню. Просто г**нюки они, и хотят деньги грести ни фига не делая. Простите все за грубость...

Echter

Quote from: quaxter on 29 July 2003 23:27:50...А релиз этого ReadIris доступен? ...
Да-да, дайте нам этот самый ReadIris, а уж взломать мы его как-нибудь сами сможем.
   Сильно сомневаюсь, что эта, по всему видно, западная разработка будет хорошо распознавать иероглифы. Но с другой стороны, и от китайцев ничего нового не слышно...

pnkv

А кряки, которые к нему есть в сети, это на демку что ли?
Вот здесь
http://www.megazip.com/qs.html
есть два кряка на ReadIris Pro 8 build 2694 и 694.
А здесь build 2777
http://www.cracks.am/cracks/r.html



quaxter

Орлы! Соколы! Бойцы! Wushi!

Надо нам придумать как с буржуями (а точнее - с их жадностью) бороться. Может кинем клич, соберемся в складчину на эти долбаные 202 евры и купим софтину...

Только есть два помысла:

1) Echter может быть прав - и тогда плачь, мое сердце, плачь. То есть гнилой может софтина оказаться.

2) Видел я уже на ру-борде в варезнике беседу на эту тему. Линка на релиз 8-й версии дохлая висит, линки на пару кряк - и финиш.

2Олег: Олег, а ты в варезнике под каким ником светишься? Я  во всем и-нете квакстером хожу, только на слэшдоте какая-то библиотекарь мой ник затырила, так там я по другому обозвался.

Я тамошним людЯм задал пару вопросов - ответа пока нет.

Echter

Quote from: Олег on 30 July 2003 16:43:05А кряки, которые к нему есть в сети, это на демку что ли?
Вот здесь
http://www.megazip.com/qs.html
есть два кряка на ReadIris Pro 8 build 2694 и 694.
А здесь build 2777
http://www.cracks.am/cracks/r.html


Кряки, наверное, взламывают демо-версию, но дело не в этом, а в том, что необходимый для распознавания китайского плагин просто не предоставляется для скачивания (можно себе представить, - там, наверное, не один десяток мегабайт). А покупать кота в мешке, да за такие деньги - это уже диагноз.

quaxter

Quote from: Echter on 31 July 2003 00:19:51  Кряки, наверное, взламывают демо-версию, но дело не в этом, а в том, что необходимый для распознавания китайского плагин просто не предоставляется для скачивания (можно себе представить, - там, наверное, не один десяток мегабайт).
Понимаешь, Echter, да шут с ними, десятками метров. Как-нибудь скачаем. Я пошлю линку, а потом схожу к другу на работу, у него коннект нормальный - он поставит закачку на сервере под FreeBSD. Машину они не гасят, так что качаться будет. Но это ж надо иметь доступ к ресурсу, а на шару - индейское жилище фигвам.
QuoteА покупать кота в мешке, да за такие деньги - это уже диагноз.
Эт точно. Вот пробью в форумах ру-борда (или иной кто пробьет) - там инфой делятся охотно.
И кряками тоже.
И еще я своему другу инфу вбил. Он мне железо делает и кое-что из софта. Только он консервативным стал до невозможности. По любому поводу "а на фиг оно тебе". Тем не менее рабочие версии Dan Qing 4.0 и еще кое-что я получил от него.
Он в каком-то обменнике подписан в израильском форуме, куда шаровикам доступ заказан.  Может там нагребет. Я его предупреждал: любой CJK OCR, любой юникодистый редактор чего угодно, любой CJK словарь или чекспел неси не думая. А он и в ус не дует.

По-моему, он считает что у всех востокознатцев крыша едет :)

quaxter

#7
В Варезнике charle обещал залить 8-ю версию Corporate Edition, нужен только ресурс FTP, а это можно прямо сегодня уладить. Софт-форум хранит гробовое молчание.
Азиаты дают только линки на демо-версию о 21 МБ.
Скачал от безнадеги. Довожу до сведения: интерфейс - полное г****, демка распознает только английский и французский тексты, проверка орфографии в ней на уровне асфальта.
Т.е. вы можете запомнить новое слово, но поправить его на ходу, как в файном ридере - шиш.
С интерфейсом - нам не привывкать, Шаншу или Даньцин ничуть не удобнее.
От безнадеги же вооружился вместо пулемета ломом (поставил Мула). Мул нашел файл "ReadIris OCR.rar" - именно так, с пробелом посередке. Даю лину для ословодов: ed2k://|file|Readiris.Ocr.[found.via.www.fileDonkey.com].rar|100430687|C088B09C449EA4B5431F1AEFD91A2C11|/Не знаю, то ли я этот лом настроить не могу, то ли он такой кривой...
Ничего не качается... Точнее висит часами в положении Waiting.
И это при том, что RAR-архив имеет объем 95.78 МБ, и еще неизвестно, что там за версия. Будем ждать вестей от charle.
2Олег: раз уж ты в варезник тоже ходишь, может заглянешь и свяжешься с человеком - может он москвич, тогда для тебя и московской части сообщества кривая резко выпрямляется в сторону приобретения проги.
Соображений? Советов?

это я, quaxter

Так, орлы, прога у меня.
Я с чужого компа - потому гостем.
Сегодня покручу - ждите рецензии.

quaxter

Оценка программы (билд 2834):
Картинка украино-английского текста (скан черно-белый полутоновой, 300 dpi):
http://www.is.svitonline.com/quaxter/image.gif
Распознавание программой FineReader 6.0 Corporate Edition без коррекции ошибок:
http://www.is.svitonline.com/quaxter/FRrecognized.txt
Распознавание программой ReadIris Pro 8.0 Corporate Edition без коррекции ошибок:
http://www.is.svitonline.com/quaxter/RIrecognized.txt
Картинка греческо-английского текста (скан цветной, 300 dpi):
http://www.is.svitonline.com/quaxter/lit.gif
Распознавание программой FineReader 6.0 Corporate Edition без коррекции ошибок:
http://www.is.svitonline.com/quaxter/FRlit.doc
Распознавание программой ReadIris Pro 8.0 Corporate Edition без коррекции ошибок:
http://www.is.svitonline.com/quaxter/RIlit.doc
Сравнениваемый % ошибок распознавания в комментариях не нуждается.
Алгоритмы проверки и коррекции ошибок:
FineReader - слова вносятся в словарь с фиксированными образцами парадигмы, в греческом не распознаются ударения кроме острого и есть только 1 тип придыхания.
ReadIris - процесс работы с модулем проверки орфографии - самое слабое звено. Английский язык вылизан до блеска (условно), но все равно ошибки есть и серьезные.
С другими языками дело хуже. Есть ограничения на число распознаваемых языков - не более 4.
Распознавание текста ReadIris сильнее зависит от качества бумаги и печати, от сложности текста и лексической новизны.
Программа передает сырой текст в ворд для дальнейшей обработки.
Модули распознавания для азиатских языков в предоставленной для тестирования версии отсутствуют.

pnkv

Интересное сообщение с неделю назад получил письмом от quaxter'a

«обработанный в формате DJVU корпус сканов (в сети есть несколько тождественных реплик) при помощи последней shareware версии LizardTech'овского редактора могут быть распознаны вплоть до иероглифов – встроенный OCR работает на движке от ReadIris»

имеется в виду сканы БКРС.

Сам quaxter в сеть сейчас выйти не может, поэтому это вся информация по данному вопросу.


Fozzie

ReadIris для оцифровки БКРС действительно найболее подходящий вариант. К тому же сейчас вышли новые версии - 9 и 10. Только одно но - распознавание иероглифов у них находится на отдельном диске Asian Add-ons, который найти пока не удалось...
據梧

pnkv

Quote from: Fozzie on 21 February 2005 09:01:36Только одно но - распознавание иероглифов у них находится на отдельном диске Asian Add-ons, который найти пока не удалось...

а какова цена вопроса?


Fozzie

На сайте www.readiris.com Он сам - 152$ и ещё 102$ - Asian add-ons. Скинуться не проблема - знать бы насколько качественно он работает.... Может выслать им нашу страничку отсканированную на пробу?
據梧

pnkv

Quote from: Fozzie on 21 February 2005 12:11:12
Может выслать им нашу страничку отсканированную на пробу?

Послать можно. Только есть такое ощущение, что и они нас пошлют. Лучше бы демку выпустили двуязычную.


Fozzie

Quote from: Олег on 21 February 2005 14:18:16
Послать можно. Только есть такое ощущение, что и они нас пошлют. Лучше бы демку выпустили двуязычную.
Демка у них и так многоязычнейшая. Только китайского там нет...

據梧

morhad

Quote from: Fozzie on 21 February 2005 12:11:12
На сайте www.readiris.com Он сам - 152$ и ещё 102$ - Asian add-ons. Скинуться не проблема - знать бы насколько качественно он работает.... Может выслать им нашу страничку отсканированную на пробу?
Price:
USA & Canada: $129,99
Other Countries: EUR152

Так и попробуйте выслать страничку. Пошлют - так пошлют :)
Я вот на сайте скриншотов с распознаванием иерогов не заметел. Правда бегло сайт просмотрел

morhad

Мне кажется, для БКРС данная программа не пойдет, т.к. , на сколько я понял, она поддерживает распознавание смешанного текста с иероглифами и вестерн алфавита. Посмотрите на сайте разработчика. Ниже привожу картинку с данного сайта.

pnkv

Вообще-то, quaxter говорил про ReadIris встроенный в Lizard. Может там более продвинутые функции?


Fozzie

в общем сегодня аскнул насчёт возможности вообще в принципе распознать смешанный (китайско-русско-латинский) текст и дёрнул кое-кого в Чушке (ждать по полгода нашу таможню мне совсем не улыбается).
據梧

Jin Jie

Quote from: Fozzie on 24 February 2005 10:46:59
в общем сегодня аскнул насчёт возможности вообще в принципе распознать смешанный (китайско-русско-латинский) текст и дёрнул кое-кого в Чушке (ждать по полгода нашу таможню мне совсем не улыбается).
что есть Чушка и причем тут таможня?  :-\оптимизаторы, Вы почаще на наши сканы смотрите.. никакая программа не возьмет это..  :P а на сэкономленные деньги лучше купите мне на 8 марта сладкого ;)

Fozzie

#21
Quote from: Jin Jie on 24 February 2005 11:23:47
что есть Чушка
Для совсем серых поясняю: это общеизвестный Wonderland на северо-запад от Питера.  ;D
Quoteи причем тут таможня?
Любой идущий из-за рубежа предмет имеет чрезвычайно высокую вероятность застрять на ней надолго. Примеров - море. Из Чушки привезут за пару дней. Проверено. С гарантией.
Quote  :-\оптимизаторы, Вы почаще на наши сканы смотрите.. никакая программа не возьмет это..
Да куда она денется! Не возьмёт добром - заставим силушкой... Богатырской...
Quote:P а на сэкономленные деньги лучше купите мне на 8 марта сладкого ;)
А сладкое между прочим портит фигуру! ;) Особенно в таких количествах...
據梧

Fozzie

Получил сегодня ответ:
QuoteHello,

Thank you for your mail.
Mixed recognition is supported, it is 1 asian language + 1 other language.

К письму прилагалась ощутимая скидка - придётся брать :)
據梧

morhad

#23
Quote from: Fozzie on 25 February 2005 13:51:14
Получил сегодня ответ:
QuoteHello,

Thank you for your mail.
Mixed recognition is supported, it is 1 asian language + 1 other language.

К письму прилагалась ощутимая скидка - придётся брать :)
А образцы работы прилагались?
А есть смысл в сборе средств на приобретение? С миру по нитки :)

Fozzie

Quote from: morhad on 25 February 2005 14:50:27
А образцы работы прилагались?
Нет. Но я попробую в понедельник кинуть им страничку БКРС на пробу. :) И будем поглядеть...
QuoteА есть смысл в сборе средств на приобретение? С миру по нитки :)
Да не вижу особого смысла заморачиваться... Не те деньги.
據梧