# Segmentace obrazu - text a jeho čtení
Cvičení je zaměřené na správné využití osvětlení při nasvícení objektu a následné využití metod pro segmentaci obrazu. Novinkou ve cvičení je využití OCR (optical character recognition) k převodu obrazu na text.

<img src="images/ocr.png" width="300">

Ke čtení je využita knihovna [**Tesseract OCR**](https://github.com/tesseract-ocr/tesseract).

### Import knihoven a konfigurace

In [None]:
%run ../svz.ipynb

### Pomocné funkce
Z následujících funkcí je potřeba vybírat ty vhodné pro splnění úkolu.

Seznam funkcí pro přehlednost:
- [`connect_camera(...)`](../svz.ipynb#connect_functions)
- [`show_images(...)`](../svz.ipynb#show_functions)
- [`plot_images(...)`](../svz.ipynb#show_functions)


- [`to_gray(...)`](../svz.ipynb#preprocessing_functions)
- [`to_hsv(...)`](../svz.ipynb#preprocessing_functions)
- [`negative(...)`](../svz.ipynb#preprocessing_functions)
- [`crop(...)`](../svz.ipynb#preprocessing_functions)


- [`segmentation_one_threshold(...)`](../svz.ipynb#segmentation_functions)
- [`segmentation_auto_threshold(...)`](../svz.ipynb#segmentation_functions)
- [`segmentation_two_thresholds(...)`](../svz.ipynb#segmentation_functions)
- [`segmentation_adaptive_threshold(...)`](../svz.ipynb#segmentation_functions)
- [`find_contours(...)`](../svz.ipynb#segmentation_functions)


- [`filtration_median(...)`](../svz.ipynb#filtration_functions)
- [`fill_holes(...)`](../svz.ipynb#filtration_functions)


- [`ocr(...)`](../svz.ipynb#ocr)


- [`to_intensity(...)`](../svz.ipynb#others)

---

### Úkol
Zvolte vhodné funkce pro segmentaci obrazu a přečtěte text na obrazu snímaném kamerou.

Po vyladění algoritmu, využijte obrázek z kamery a nechte ho přečíst OCR. V případě, že výsledek bude po porovnání `True`, úkol jste splnili.

#### 1) Načtěte data pouze kostek "FIT" a zobrazte
Naučte se využívat funkci `plot_images()`, je přehlednější pro zobrazení dat v rámci jupyter notebooku.

In [None]:
path = '.../' ### nezapomeňte cestu zakončit '/'
files = os.listdir(path)

images = []

for f in files:
    if '...' in f: ### najděte společný string v rámci jména pro jednoduchou filtraci
        image = ...(path + f) ### načtěte obrázek
        images.append(image)
        
print('Celkem nalezených obrázků: ' + str(len(images)))

In [None]:
plot_images(*images) ### zobrazte obrázky

#### 2) Doplňte funkční verze algoritmů pro nasvícení jednotlivými typy světel.
Výstupem každého algoritmu by měl být binární obraz, kde pozadí má černou barvu a objekty (popředí) bílou.

**2a)** Funkce pro segmentaci referenčních obrazců (černo-bílých). Osvětlení žádné navíc (při nízkých světelných podmínkách lze využít světlo DOME).

In [None]:
def algorithm_reference_1(img):
    ###
    
    return img_bin

def algorithm_reference_2(img):
    ###
    
    return img_bin

def algorithm_reference_3(img):
    ###
    
    return img_bin

def algorithm_reference_4(img):
    ###
    
    return img_bin

algorithms_ref = [algorithm_reference_1, algorithm_reference_2, algorithm_reference_3, algorithm_reference_4]

In [None]:
im_ids = [...] ### lze postupně doplňovat jak algoritmy, tak image_ids a tím postupovat v cyklu
results_ref = []

# Pro každý obrázek vyzkouší jeho příslušný algoritmus
for i, im_id in enumerate(im_ids):
    image_ref = images[im_id]
    image_crop = crop(image_ref, ..., ..., ..., ...) ###
    
    result = algorithms_ref[i](image_crop)
    results_ref.append(result)

plot_images(*results_ref)

**2b)** Funkce pro segmentaci obrazců s využitím osvětlení typu darkfield (konzole se 4 bar světly).

In [None]:
def algorithm_console_1(img):
    ###
    
    return img_bin

def algorithm_console_2(img):
    ###
    
    return img_bin

def algorithm_console_3(img):
    ###
    
    return img_bin

algorithms_console = [algorithm_console_1, algorithm_console_2, algorithm_console_3]

In [None]:
im_ids = [...] ### lze postupně doplňovat jak algoritmy, tak image_ids a tím postupovat v cyklu
results_console = []

# Pro každý obrázek vyzkouší jeho příslušný algoritmus
for i, im_id in enumerate(im_ids):
    image_console = images[im_id]    
    image_crop = crop(image_console, ..., ..., ..., ...) ###
    
    result = algorithms_console[i](image_crop)
    results_console.append(result)

plot_images(*results_console)

#### 4) Využijte OCR na výsledný binární obrázek
**POZOR:** Dokud nebude vstupní obraz vypadat přibližně následovně, **NEPOUŠTĚJTE** se do další části. Tesseract vyžaduje velkou míru předzpracování, aby byl schopný text úspěšně přečíst.

<img src="images/fit_preprocessed.png" width="200">

In [None]:
results = results_ref + results_console
texts = []

for image in results:
    text = ocr(image) ###
    print(text)
    texts.append(text)

#### 5) Zkontrolujte správnost

In [None]:
ref_text = 'FIT'

for i, text in enumerate(texts):
    print('Přečtený text je: ' + text)
    
    if text == ref_text:
        print('-> Úkol ' + str(i+1) + ' jste splnili!')
    else:
        print('-> Úkol je třeba dál ladit ...')    
    print('')