Вспомогательная утилита для преобразования текста с изображения в текст UTF-8.
- Обработка изображений без привязки к типу и наименованию
- Пакетная обработка изображений
- Преобразованный текст сохраняется в файл *.txt
Собрать приложение maven, далее jar файл поместить в любой каталог
В этом же месте создать папки: /tessdata и /input
В папку /tessdata поместить два словаря eng.traineddata и osd.traineddata
Целевые изображения помещаются в папку /input
Вывод результата появится в файле рядом с jar
Запуск приложения производится путем выполнения команды в проводнике, или командной строки:
java -jar имя_приложения.jar
Для начала обработки изображения, необходимо ввести в консоли
start
Затем нажать Enter На выходе получим файл parsed.txt