Skip to content
ArtemMe edited this page Oct 2, 2018 · 2 revisions

OpenCv - библиотека для компьюторного виденья. Есть интерфейсы для с++ java python.

Заметки:

  1. Ни в коем случае не используй формат jpg для работы. Лучше используй png.
  2. Как подготовить картинку к обработке:
    • Установить dpi 300 (min)
    • Установить размер текста 12pt
    • Попытаться убрать искажения текста
    • Убрать шумы В простейшем случае шумы можно убрать как то так(для отсканированных бухгалтерских документов подойдет):
Imgproc.cvtColor(img, img, Imgproc.COLOR_BGR2GRAY);
// Операция threshold выбирает пиксели больше определннго значения (есть специальные функции для вычисления порогового значения).
// Пиксель может иместь значение в диапазоне от 0(black) до 255(white)
Imgproc.threshold(img,img,127,255,Imgproc.THRESH_BINARY | Imgproc.THRESH_OTSU);
  1. Откуда скачать . Далее запускаешь exe файл, он распаковывает нужные файлы, в том числе opencv\build\java\opencv-343.jar его и используй.
  2. Чтобы седелать буквы толще/тоньше используй функции: Erodу и Dilate.

Пример

Смотри модуль "object-detection" - делал распознование таблиц в документе.

Полезные ссылки:

Офф сайт
Как найти таблицу
Как найти таблицу другой подход
Откуда скачать

Clone this wiki locally