Положим у вас после сканера есть множество изображений в JPG и надо из них создать PDF и распознать изображения, чтобы по ним работал полнотекстовый поиск. Каким бесплатным ПО это можно сделать?
Есть программа PDFgear, которая берет изображения, создает из них PDF, а дальше можно PDF распознать с помощью встроенного в PDFgear системы распознавания Tesseract.
Распознанный текст будет размещен под изображением (так называемая текстовая подложка) и будет доступен при загрузки в ELiS для полнотекстового поиска.
Не забудьте выбрать языка распознавания или несколько языков, если у вас русский+английский (или формулы в латинице).