Skip to content

lao2r/tess_ocr

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Tess OCR

Преобразователь изображения в текст

Вспомогательная утилита для преобразования текста с изображения в текст UTF-8.

Особенности

  • Обработка изображений без привязки к типу и наименованию
  • Пакетная обработка изображений
  • Преобразованный текст сохраняется в файл *.txt

Установка

Собрать приложение maven, далее jar файл поместить в любой каталог

В этом же месте создать папки: /tessdata и /input

В папку /tessdata поместить два словаря eng.traineddata и osd.traineddata

Целевые изображения помещаются в папку /input

Вывод результата появится в файле рядом с jar

Запуск

Запуск приложения производится путем выполнения команды в проводнике, или командной строки:

java -jar имя_приложения.jar

Для начала обработки изображения, необходимо ввести в консоли

start

Затем нажать Enter На выходе получим файл parsed.txt

About

Tessaurus OCR

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages