Распознаванием текста на изображении с помощью Tesseract
Опубликовано 22 сентября, 2022 - 12:49 пользователем Арсен Боровинский
Тут попросили глянуть, можно ли в ELiS запилить распознавание изображений. Типа есть 100500 PDF и почему-то нераспознанные и можно-ли чтобы все само распознавалось при загрузке.
Очевидным кандидатом является Tesseract, который развивает Google и которым типа даже текст в Android-приложениях распознается для индексирования.
Ну ок. Потыкал в Tesseract. Выяснилось: