# Segmentace obrazu - text a jeho čtení
Cvičení je zaměřené na správné využití osvětlení při nasvícení objektu a následné využití metod pro segmentaci obrazu. Segmentovaný snímek je převeden na text pomocí OCR (optical character recognition).

<img src="images/ocr.png" width="300">

Ke čtení je využita knihovna [**Tesseract OCR**](https://github.com/tesseract-ocr/tesseract).

### Import knihoven a konfigurace

In [None]:

import os
import cv2
import numpy as np
import pytesseract
import improutils as iu

%matplotlib inline
np.set_printoptions(formatter={'float': lambda x: "{0:0.3f}".format(x)})

### Pomocné funkce
Z následujících funkcí je potřeba vybírat ty vhodné pro splnění úkolu. Parametry a implementaci funkcí si můžete zobrazit pomocí příkazu `help(function_name)` nebo na https://gitlab.fit.cvut.cz/bi-svz/improutils_package/tree/master/improutils.

Seznam funkcí pro přehlednost:

- [`to_gray(...)`](https://gitlab.fit.cvut.cz/bi-svz/improutils_package/blob/master/improutils/preprocessing/preprocessing.py#L5)
- [`negative(...)`](https://gitlab.fit.cvut.cz/bi-svz/improutils_package/blob/master/improutils/preprocessing/preprocessing.py#L57)
- [`crop(...)`](https://gitlab.fit.cvut.cz/bi-svz/improutils_package/blob/master/improutils/preprocessing/preprocessing.py#L104)

- [`rotate(...)`](https://gitlab.fit.cvut.cz/bi-svz/improutils_package/blob/master/improutils/preprocessing/preprocessing.py#L196)

- [`segmentation_one_threshold(...)`](https://gitlab.fit.cvut.cz/bi-svz/improutils_package/-/blob/master/improutils/segmentation/segmentation.py#L67)
- [`segmentation_auto_threshold(...)`](https://gitlab.fit.cvut.cz/bi-svz/improutils_package/-/blob/master/improutils/segmentation/segmentation.py#L86)
- [`segmentation_two_thresholds(...)`](https://gitlab.fit.cvut.cz/bi-svz/improutils_package/-/blob/master/improutils/segmentation/segmentation.py#L103)
- [`segmentation_adaptive_threshold(...)`](https://gitlab.fit.cvut.cz/bi-svz/improutils_package/-/blob/master/improutils/segmentation/segmentation.py#L123), vysvětlení [použití](https://courses.fit.cvut.cz/BI-SVZ/showroom/adaptive_thresholding/index.html)

- [`find_contours(...)`](https://gitlab.fit.cvut.cz/bi-svz/improutils_package/-/blob/master/improutils/preprocessing/contours.py#L39)
- [`fill_holes(...)`](https://gitlab.fit.cvut.cz/bi-svz/improutils_package/-/blob/master/improutils/preprocessing/contours.py#L91)

- [`filtration_median(...)`](https://gitlab.fit.cvut.cz/bi-svz/improutils_package/-/blob/master/improutils/filtration/filtration.py#L23)

- [`ocr(...)`](https://gitlab.fit.cvut.cz/bi-svz/improutils_package/-/blob/master/improutils/recognition/ocr.py#L7)

- [`cv2.morphologyEx(...)`](https://docs.opencv.org/4.x/d9/d61/tutorial_py_morphological_ops.html)
- [`cv2.dilate(...)`](https://docs.opencv.org/4.x/d9/d61/tutorial_py_morphological_ops.html)
- [`cv2.erode(...)`](https://docs.opencv.org/4.x/d9/d61/tutorial_py_morphological_ops.html)
- vysvětlení k morfologickým operacím [zde](https://courses.fit.cvut.cz/BI-SVZ/showroom/morfologie/index.html)

- [`cv2.minAreaRect(...)`](https://theailearner.com/tag/cv2-minarearect/)
- [`cv2.boxPoints(...)`](https://theailearner.com/tag/cv2-minarearect/)



---

### Úkoly

1. Změřte velikost placky s nápisem FIT v pixelech - výška, šířka.

1. Zvolte vhodné funkce pro segmentaci obrazu a přečtěte text z obrázku snímaném kamerou. Po vyladění algoritmu, využijte předzpracovaný obrázek a nechte ho přečíst OCR. V případě, že výsledek bude po porovnání `True`, úkol jste splnili.

Pro každý z úkolů je nutné zvolit vhodný typ osvětlení a následně placku nasnímat monochromatickou kamerou. Na každý úkol bude v ideálním případě potřeba jiný snímek. Volba vhodného nasvícení usnadní algoritmickou část úkolu. Při špatné volbě osvětlení nebude úkol uznán!

Pro volbu vhodné iluminační techniky a vhodného osvětlení můžete konzultovat přehledový dokument [Volba vhodného osvětlení v kombinaci s kamerou](https://courses.fit.cvut.cz/BI-SVZ/showroom/illumination/index.html), nebo  přednášku [Kamerový systém a zpracování obrazu](https://courses.fit.cvut.cz/BI-SVZ/lectures/files/bi-svz-03-kamerovy-system-a-zpracovani-obrazu.pdf).

#### 1) Nasnímejte placky s nápisem FIT a zobrazte.
Snímky uložte do jedné složky. Použijte vhodné osvětlení!

**POZOR:** Přestože pracujeme s monochromatickou kamerou, nemusí mít snímky z kamery jeden kanál ve stupních šedi, jak bychom očekávali. Typicky může mít snímek 3 kanály (RGB). Závisí to na nastavení parametru [PIXEL_FORMAT](https://docs.baslerweb.com/pixel-format) kamery. Před prací se snímky si ověřte, že pracujete se správným typem snímku. Snímky si můžete do vhodného formátu převést/nastavit vhodně parametr **PIXEL_FORMAT** kamery.

In [None]:
path = ... ### nezapomeňte cestu zakončit '/'
files = os.listdir(path)

images = []

for f in files:
    image = ...(path + f) ### načtěte obrázek
    images.append(image)
        
print('Celkem nalezených obrázků: ' + str(len(images)))
iu.plot_images(*images) #zobrazte snímky

#### 2) Změřte rozměry placky v pixelech

Úkolem je ze snímku segmentovat placku a změřit její rozměry - výška, šířka v pixelech.

Rozměry jsou vykresleny do původního snímku viz. obrázek. Pro pozicování textu a obrysu placky využijte znalost kontury, ze které byly hodnoty vypočítány. Pokud jsou vaše rozměry zobrazeny na opačné straně oproti referenčnímu obrázku, je to také správně.

<img src="images/measures_ref.png" width="300">

In [None]:
def measurement_algorithm(img):
    
    ### algoritmus segmentace a měření placky
    
    sizes_drawn = img.copy()
    
    ...
    
    rect = cv2.minAreaRect( ... ) ### doplňte správně vstup
    height, width = rect[ ... ] ### vyberte index, obsahující informaci o výšce a šířce 
    points = cv2.boxPoints( rect ) 
    points = points.astype( ... ) ### přetypujte na správný datový typ pro vykreslení

    cv2.line(sizes_drawn, points[0], points[1], color=(255, 0, 0), thickness=3)
    cv2.putText(sizes_drawn, "{:.2f} px".format(width), points[0], 0, 1.5, (0, 0, 255), 2)
    
    cv2.line(sizes_drawn, points[1], points[2], color=(255, 0, 0), thickness=3)
    cv2.putText(sizes_drawn, "{:.2f} px".format(height), points[2], 0, 1.5, (0, 0, 255), 2)

    return mask, sizes_drawn

In [None]:
img_measures = images[...]  ### doplňte index
mask, sizes_drawn = measurement_algorithm(img_measures)
iu.plot_images(mask, sizes_drawn)

#### 3) Doplňte algoritmus pro segmentaci textu z nasnímaných placek.
Výstupem algoritmu by měl být binární obraz, kde pozadí má černou barvu a objekty (popředí) bílou. Binární obrázek zobrazte.

**HINT:** Může (ale nemusí) se vám hodit funkce `find_holes(...)` pro segmentaci textu. 

In [None]:
def segmentation_algorithm(img):
    
    ### algoritmus segmentace textu 
   
    ...
    
    img = iu.crop(...)
    
    ...
    
    return img_bin

In [None]:
img_text = images[...] ### doplňte index
img_bin = segmentation_algorithm(img_text)
iu.plot_images(img_bin)

#### 4) Využijte funkční algoritmus na snímky.
**POZOR:** Dokud nebude vstupní obraz vypadat následovně, **NEPOUŠTĚJTE** se do další části. 

<img src="images/fit_preprocessed.png" width="200">

#### 5) Využijte OCR na výsledný binární obrázek a zkontrolujte správnost.
**HINT:** Pokud se požadovaný výstup OCR neshoduje s referenčním textem, zařiďte aby nebyl text na obrázku nijak rotován a kolem textu byl alespoň 20px rámeček. Důvodem je použití Tesseract OCR, jenž je na dané věci velice náchylný.

In [None]:
config = r' -l eng --psm 6'
text = ...(img_bin, config = config) ###
ref_text = 'FIT'

print('Přečtený text je: ' + "'" + text.strip() + "'\n")
if text.strip() == ref_text:
    print('-> Úkol jste splnili!\n')
else:
    print('-> Úkol je třeba dál ladit ...')    
print('')


### 6) Bonusová část - změřte rozměry kostičky v milimetrech

Změřte a zobrazte rozměry placky v milimetrech, když víte že výška písmena I je 18 mm.