А вот ещё SanskritOCR задаром, и как ни удивительно, даже делает вид, что работает.
http://www.sanskritreader.de/Inhalt/software.htm
Ни хрена он не работает. Пишет, что ему нкжно разрешение 8 бит/пкс и на этом все. Даже жаль потраченного времени на перекачку 8 метров.
Хм... Неужто всё?
А вы не пробовали дать ему те 8 бит, о которых он просит?
Я полтора года назад скачал программу, потестировал, распознал пару страниц стихов.
Результат не блистает и требует много правки. Но работает.
Вот из-за вас специально скачал их новую версию и проверил.
Как раньше работало, так примерно и сейчас работает.
Но наверное, много от шрифта зависит. Про акцентированный текст можно сразу забыть. А вот с хорошим стандартным шрифтом можно и повозиться, если охота. Может, что и выйдет.
Включенная проверка орфографии приводит к сбою.
Вот тест сделал.
Источник - текст шрифтом xdvng сфотографированный с файла pdf и сохранённый в bmp.
(текста с хорошим шрифтом как-то под рукой не оказалось)
Распознание как есть, без каких-либо предварительных настроек программы.
Первый результат - старая версия, второй - новая.
результат 1:
dhџtarеrara uvеca
dharmak№etre kukak№etre samavetе yuyutyavaµ
mеmakеµ pееg•avеёcaiva kimakurvata sanjaya 1 1
результат 2:
dhџtarе?ra uvеca
dharmak№etre kuruk№etre samavetе yuyutmavaµ
mеmakеµ pеее•avеёcaiva kimakurvata saсajaya thџ 1
Радует, что хотя бы в общих чертах узнаваемо, а не полная бессмыслица получается.
Но мне казалось, что в прошлый раз результаты были несколько лучше.