Даааааа, иногда делаешь открытия на пустом месте. Только сейчас обратил внимание, что в файн ридере можно, сохраняя проект в формате PDF, сохранять текст под изображением страницы, что впоследствии дает возможность применять функцию поиска.
Такое же возможно с функцией поиска русского текста и для сканов БКРС. Второй, третий и четвертый тома преобразованные в PDF с помощь Акробата занимают 300 мег. Вероятно, около этого они буду занимать, если pdf делать при помощи файн ридера.
По поводу OCR HanWang – он создает (вероятно то, что содержит распознанный текст) в файле с расширением BLK, иконка которого в точности такая же как у файн ридеровского файла с расширением TRF.
Что с этим делать дальше, непонятно.