Tesseract

Тут попросили глянуть, можно ли в ELiS запилить распознавание изображений. Типа есть 100500 PDF и почему-то нераспознанные и можно-ли чтобы все само распознавалось при загрузке.

Очевидным кандидатом является Tesseract, который развивает Google и которым типа даже текст в Android-приложениях распознается для индексирования.

Ну ок. Потыкал в Tesseract. Выяснилось: