# Przekształcenia morfologiczne

## Cel:
- zapoznanie z podstawowymi przekształceniami morfologicznymi – erozją, dylatacją, otwarciem, zamknięciem, transformacją trafi, nie trafi,
- zapoznanie ze złożonymi operacjami morfologicznymi wykorzystującymi rekonstrukcję morfologiczną,
- zapoznanie z operacjami morfologicznym dla obrazów w odcieniach szarości – erozją, dylatacją, otwarciem, zamknięciem, filtrami top-hat i bottom-hat,
- zapoznanie z wykorzystaniem złożonych operacji morfologicznych przy rozwiązywaniu konkretnego problemu,
- zadanie domowe: wykorzystanie morfologii do implementacji ,,gry w życie''.

## Przypomnienie teorii

### Element strukturalny

Element strukturalny obrazu jest to pewien wycinek obrazu (przy dyskretnej reprezentacji obrazu – pewien podzbiór jego elementów).
Najczęściej stosowanym elementem strukturalnym jest kwadratowa maska o rozmiarze 3×3 lub 5×5. Niekiedy pożądane są maski o innym kształcie, np. zbliżonym do elipsy.

### Erozja

Erozja (ang. _erosion_) jest podstawowym przekształceniem morfologicznym.
Zakładamy, że obraz wyjściowy zawiera pewien obszar (figurę) X, wyróżniający się pewną charakterystyczną cechą (np. odróżniającą się od tła jasnością).
Figura X po wykonaniu operacji erozji to zbiór punktów centralnych wszystkich elementów strukturalnych, które w całości mieszczą się we wnętrzu obszaru X.
Miarą stopnia erozji jest wielkość elementu strukturalnego.

**Erozję** można traktować jako **filtr minimalny**, tj. z danego otoczenia piksela (określanego przez maskę) do obrazu wynikowego wybierana jest wartość minimalna.

### Dylatacja

Dylatacja (ang. _dilation_): Zakładamy, że obraz wejściowy zawiera obszar X wyróżniający się pewną charakterystyczną cechą (np. jasnością). Figura przekształcona przez dylatacje to zbiór punktów centralnych wszystkich elementów strukturalnych, których którykolwiek punkt mieści sie we wnętrzu obszaru X. Miarą  dylatacji jest wielkość elementu strukturalnego.

**Dylatację** można traktować jako **filtr maksymalny**, tj. z danego otoczenia piksela (określanego
przez maskę) do obrazu wynikowego wybierana jest wartość maksymalna.

### Otwarcie i zamknięcie

Otwarcie (ang. _opening_) polega na wykonaniu najpierw operacji erozji, a następnie dylatacji.

> Otwarcie = erozja + dylatacja

Zamkniecie (ang. _closing_) polega na wykonaniu najpierw operacji dylatacji, a następnie erozji.

> Zamkniecie = dylatacja + erozja

### Obrazy w odcieniu szarości

Obrazy w odcieniu szarości – detekcja dolin i szczytów (ang. _top-hat_, _bottom-hat_):

Aby wyodrębnić z obrazu lokalne ekstrema można wykorzystać zdefiniowane wcześniej przekształcenia: otwarcie i zamkniecie.
W celu wyszukania lokalnych maksimów (szczytów) należy od wyniku otwarcia danego obrazu odjąć obraz wyjściowy.
Analogicznie, aby wyodrębnić lokalne minima obrazu, należy dokonać podobnej operacji, z tym że pierwszą operacją bedzie zamknięcie.
Uwaga! Należy zwrócić uwagę, że poniższe metody służą do detekcji (pokreślenia) tylko lokalnych ekstremów!

## Podstawowe operacje morfologiczne: erozja, dylatacja, otwarcie, zamknięcie, trafi nie trafi

1. Wczytaj obraz ertka.bmp
2. Wykonaj operację erozji `cv2.erode`. Parametrami funkcji są obraz oraz element strukturalny. Element można stworzyć samodzielnie jako tablicę składającą się z 0 i 1 `np.ones((3,3))` lub posłużyć się funkcją `cv2.getStructuringElement`, do której należy podać kształt `cv2.MORPH_RECT` oraz wielkość elementu `(3,3)`. Na początku użyj kwadratu o rozmiarze 3 pikseli.
3. Wyświetl obraz oryginalny oraz po wykonaniu erozji – najlepiej na wspólnym wykresie. Upewnij się, że rozumiesz, jak działa erozja.
4. Zmień element strukturalny (inny kształt – koło, diament lub inny rozmiar). Ponownie wykonaj erozję, sprawdź rezultat działania operacji.
5. Oprócz zmiany elementu strukturalnego na rezultat erozji można wpłynąć zwiększając liczbę iteracji (np. wykonać erozję trzykrotnie). Ustal element strukturalny na kwadrat o boku 3 piksele. Wykonaj erozję obrazu _ertka_ dwukrotnie, a następnie trzykrotnie. Zaobserwuj rezultaty. Wskazówka: warto zajrzeć do dokumentacji funkcji `erode`.
6. Wczytaj obraz buzka.bmp. Dobierz element strukturalny (zdefiniuj go ręcznie jako macierz 0 i 1) w taki sposób, aby usunąć włosy o określonej orientacji (ukośnie lewo lub prawo).
7. Uwaga: pokazane metody wpływania na rezultaty erozji wykorzystuje się identycznie dla pozostałych operacji morfologicznych – dylatacji, otwarcia i zamknięcia.
8. Operacją odwrotną do erozji jest dylatacja `cv2.dilate`. Ustal element strukturalny na kwadrat o boku 3 piksele. Wykonaj dylatację obrazu _ertka_. Zapoznaj się z rezultatem działania.
9. Na wspólnym wykresie wyświetl obraz oryginalny oraz obrazy po operacjach morfologicznych: erozja, dylatacja, otwarcie i zamkniecie. Otwarcie i zamknięcie można uzyskać za pomocą `cv2.morphologyEx(img, operacja, element_strukturalny)`, gdzie typem operacji jest `cv2.MORPH_OPEN` lub `cv2.MORPH_CLOSE`.
10. Zmień obraz _ertka_ na _wyspa_, a następnie na _kolka_. Wykonaj na każdym cztery przedstawione operacje morfologiczne. Zaobserwuj rezultaty.
11. Minizadanko: wykorzystując poznane operacje morfologiczne spowoduj, że na obrazie _ertka_ pozostanie tylko napis RT (bez wypustek i dziur).
12. Niekiedy potrzebne jest wykrycie konkretnych konfiguracji pikseli na obrazie – przydaje się do tego transformacja trafi, nie trafi (ang. _hit-or-miss_). Pozwala ona wykryć na obrazie obecność elementów, które dokładnie odpowiadają masce.
13. Wczytaj obraz hom.bmp. Wyświetl go. Załóżmy, że chcemy wykryć na obrazie krzyżyki 3x3. Zdefiniuj następujący element strukturalny:
```
[0,1,0]
[1,1,1]
[0,1,0]
```
Wykonaj transformację trafi, nie trafi – `cv2.morphologyEx(hom, cv2.MORPH_HITMISS, se1)`. Rezultat operacji wyświetl. Czy udało się zrealizować zadanie? Jeżeli pojawiają się u Państwa błędy związane z typem danych, należy obraz wejściowy przekonwertować na skalę szarości: `cv2.cvtColor(hom, cv2.COLOR_BGR2GRAY)`.


In [None]:
import matplotlib.pyplot as plt
import cv2
import numpy as np
import os
import requests

In [None]:


url = 'https://raw.githubusercontent.com/vision-agh/poc_sw/master/10_Morphology/'

fileNames = ["buzka.bmp", "calculator.bmp", "ertka.bmp", "ferrari.bmp", "fingerprint.bmp", "hom.bmp", "kolka.bmp", "kosc.bmp", "szkielet.bmp", "text.bmp", "wyspa.bmp", "rice.png", "gra.py"]
for fileName in fileNames:
  if not os.path.exists(fileName):
      r = requests.get(url + fileName, allow_redirects=True)
      open(fileName, 'wb').write(r.content)


In [None]:
def plot_img(img, title=""):
    plt.imshow(img, 'gray')
    plt.title(title)
    plt.axis('off')
    plt.show()

img_erka = cv2.imread("ertka.bmp", cv2.IMREAD_GRAYSCALE)

plot_img(img_erka, "Original")

plot_img(cv2.erode(img_erka, cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))), "Eroded")
plot_img(cv2.erode(img_erka, cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (7, 7))), "Eroded diament")

In [None]:
ertka_iter = cv2.erode(img_erka, cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3)), iterations=2)
plot_img(ertka_iter, "Eroded 2 iterations")
ertka_iter = cv2.erode(img_erka, cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3)), iterations=3)
plot_img(ertka_iter, "Eroded 3 iterations(2+3)")


In [None]:
buzka = cv2.imread("buzka.bmp", cv2.IMREAD_GRAYSCALE)
plot_img(buzka, "Original")
macierz = np.array([[0, 0, 1], [0, 1, 0], [1, 0, 0]], dtype=np.uint8)
buzka_erode = cv2.erode(buzka, macierz)
plot_img(buzka_erode, "Eroded")


In [None]:
def plot_different(img, title=""):
    kwadrat = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))
    _, ax = plt.subplots(1, 5, figsize=(15, 15))
    ax[0].imshow(img, 'gray')
    ax[0].set_title(title)
    ax[0].axis('off')
    ax[1].imshow(cv2.erode(img, kwadrat), 'gray')
    ax[1].set_title(title+"Eroded")
    ax[1].axis('off')
    ax[2].imshow(cv2.dilate(img, kwadrat), 'gray')
    ax[2].set_title(title+"Dilated")
    ax[2].axis('off')
    ax[3].imshow(cv2.morphologyEx(img, cv2.MORPH_OPEN, kwadrat), 'gray')
    ax[3].set_title(title+"Opened")
    ax[3].axis('off')
    ax[4].imshow(cv2.morphologyEx(img, cv2.MORPH_CLOSE, kwadrat), 'gray')
    ax[4].set_title(title+"Closed")

In [None]:
ertka = cv2.imread("ertka.bmp", cv2.IMREAD_GRAYSCALE)
plot_different(ertka, "Ertka")
buzka = cv2.imread("buzka.bmp", cv2.IMREAD_GRAYSCALE)
plot_different(buzka, "Buzka")
wyspa = cv2.imread("wyspa.bmp", cv2.IMREAD_GRAYSCALE)
plot_different(wyspa, "Wyspa")
kolo = cv2.imread("kolka.bmp", cv2.IMREAD_GRAYSCALE)
plot_different(kolo, "Kolka")

In [None]:
ertka = cv2.imread("ertka.bmp", cv2.IMREAD_GRAYSCALE)
kw = np.ones((3, 3), dtype=np.uint8)
# ertka_erode = cv2.erode(ertka, cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3)))
ertka_open = cv2.morphologyEx(ertka, cv2.MORPH_OPEN, kw)
ertka_close = cv2.morphologyEx(ertka_open, cv2.MORPH_CLOSE, kw)
plot_img(ertka_close, "Opened and closed")

In [None]:
macierz = np.array([[0, 1, 0], [1, 1, 1], [0, 1, 0]], dtype=np.uint8)
hom = cv2.imread("hom.bmp", cv2.IMREAD_GRAYSCALE)
hitmiss = cv2.morphologyEx(hom, cv2.MORPH_HITMISS, macierz)

plot_img(hitmiss, "Hit or miss")

## Inne operacje morfologiczne
Do innych operacji morfologicznych należą między innymi ścienianie (ang. _thinning_), szkieletyzacja (ang. _skeletonization_), rekonstrukcja morfologiczna (ang. _morphological reconstruction_), czyszczenie brzegu (ang. _clearing border_) i uzupełnianie dziur (ang. _filling holes_). W tym rozdziale zostanie zaprezentowana rekonstrukcja morfologiczna.

Rekonstrukcja morfologiczna jest operacją trójargumentową. Wymaga podania markera (obrazu, od którego zacznie się transformacja), maski (ograniczenia transformacji) oraz elementu strukturalnego. Operacja polega na wykonywaniu kroków (dopóki w dwóch kolejnych iteracjach nic się nie zmieni):
- dylatacja obrazu markera (z danym elementem strukturalnym),
- nowy marker = część wspólna dylatacji starego markera i maski.

Trzy operacje, które wykorzystują schemat rekonstrukcji to:
- otwarcie poprzez rekonstrukcję,
- wypełnianie dziur,
- czyszczenie brzegu.

### Otwarcie poprzez rekonstrukcję:
- Wczytaj obraz text.bmp, wyświetl go.
- Załóżmy, że chcemy wykryć na obrazie litery, które zawierają długie pionowe fragmenty. W pierwszym podejściu stosujemy morfologiczne otwarcie z maską pionową o wysokości 51 pikseli (taka jest średnia wysokość liter na obrazie – `np.ones((51,1))`. Sprawdź rezultat takiej operacji.
- Detekcja wprawdzie sie udała, ale otrzymujemy tylko pionowe kreski.
- Rozwiązaniem jest rekonstrukcja – jako marker wybieramy obraz oryginalny poddany erozji. Maskę stanowi obraz oryginalny. Samodzielnie dobierz element strukturalny.
- Zaimplementuj rekonstrukcję i porównaj efekt otwarcia i rekonstrukcji.


In [None]:
text = cv2.imread("text.bmp", cv2.IMREAD_GRAYSCALE)
plot_img(text, "Original")
cone = np.ones((51,1), dtype=np.uint8)
text_open = cv2.morphologyEx(text, cv2.MORPH_OPEN, cone)
plot_img(text_open, "Opened")
text_marker = cv2.erode(text_open, cone)
plot_img(text_marker, "Marker")

while True:
    text_dilated = cv2.dilate(text_marker, kernel=np.ones((3,3)))
    text_marker_new = np.minimum(text_dilated, text)
    if np.array_equal(text_marker, text_marker_new):
        break
    text_marker = text_marker_new
plot_img(text_marker, "Restored")



## Operacje morfologiczne dla obrazów w skali szarości

Wszystkie dotychczasowe operacje (oprócz transformacji trafi, nie trafi) mają swoje odpowieniki dla obrazów w skali szarości. Konieczne jest tylko podanie definicji erozji i dylatacji w nieco innej formie:
- Erozja – filtr minimalny.
- Dylatacja – filtr maksymalny.


1. Wczytaj obraz ferrari.bmp i wykonaj operacje morfologiczne: erozję i dylatację. Element strukturalny ustal na kwadrat 3×3. Oblicz też różnicę pomiędzy obrazem po dylatacji a po erozji – czyli tzw. gradient morfologiczny. Rezultaty wyświetl na wspólnym wykresie.
2. Otwarcie to tłumienie jasnych detali na obrazie. Zamkniecie to tłumienie ciemnych detali na obrazie. Potwierdź powyższe stwierdzenia wykonując obie operacje na obrazie _ferrari_.
3. Wykonaj operacje top-hat i bottom-hat `cv2.morphologyEx(img, cv2.MORPH_TOPHAT, strel)` oraz `cv2.morphologyEx(img, cv2.MORPH_BLACKHAT, strel)` na obrazie _ferrari_. Jakie obszary udało sie wykryć za pomocą tej operacji? Z jakich operacji składa sie filtr top-hat?
4. Wczytaj obraz rice.png (z laboratorium o binaryzacji). Wyświetl go. Zwróć uwage na niejednorodne oświetlenie. Wykonaj operacje top-hat z dużym elementem strukturalnym (np. koło o rozmiarze 10) na tym obrazie. Wynik wyświetl. Co stało się z niejednorodnością oświetlenia?

In [None]:
kwadrat = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))
ferrarri = cv2.imread("ferrari.bmp", cv2.IMREAD_GRAYSCALE)
plot_img(ferrarri, "Original")
ferrarri_erode = cv2.erode(ferrarri, kwadrat)
plot_img(ferrarri_erode, "Eroded")
ferrarri_dilate = cv2.dilate(ferrarri, kwadrat)
plot_img(ferrarri_dilate, "Dilated")
ferrarri_diff = cv2.absdiff(ferrarri_dilate, ferrarri_erode)
plot_img(ferrarri_diff, "Diff")
ferrarri_open = cv2.morphologyEx(ferrarri, cv2.MORPH_OPEN, kwadrat)
plot_img(ferrarri_open, "Opened")
ferrarri_close = cv2.morphologyEx(ferrarri, cv2.MORPH_CLOSE, kwadrat)
plot_img(ferrarri_close, "Closed")
ferrarri_top = cv2.morphologyEx(ferrarri, cv2.MORPH_TOPHAT, kwadrat)
plot_img(ferrarri_top, "Tophat")
ferrarri_black = cv2.morphologyEx(ferrarri, cv2.MORPH_BLACKHAT, kwadrat)
plot_img(ferrarri_black, "Blackhat")

In [None]:
circle = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (10, 10))
rice = cv2.imread("rice.png", cv2.IMREAD_GRAYSCALE)
plot_img(rice, "Original")
rice_open = cv2.morphologyEx(rice, cv2.MORPH_TOPHAT, circle)
plot_img(rice_open, "TopHat")

## Przykład zastosowania morfologii

1. Wczytaj obraz calculator.bmp. Wyświetl go. Zadanie do realizacji: wyizolować tekst na klawiszach kalkulatora.
2. W pierwszym kroku usunięte zostaną poziome odbicia znajdujące się na górnej krawędzi każdego z klawiszy. Wykorzystamy fakt, że odbicie jest dłuższe niż jakikolwiek pojedynczy znak. Wykonujemy otwarcie przez rekonstrukcję (można wykorzystać kod z wcześniejszego zadania, ale tym razem mamy do czynienia z obrazem w skali szarości zamiast z binarnym – proszę się zastanowić, jaka operacja jest odpowiednikiem operacji AND?):
  - początkowo wykonujemy erozję z elementem strukturalnym w postaci poziomej linii — `np.ones((1,71))`,
  - następnie dokonujemy rekonstrukcji: marker – obraz po erozji, maska – obraz oryginalny,
  - wynik operacji wyświetl. Dla porównania wyświetl wynik klasycznego otwarcia z takim samym elementem strukturalnym. W czym otwarcie przez rekonstrukcję jest lepsze od klasycznego?
3. W poprzednim kroku (tj. w wyniku otwarcia przez rekonstrukcję) uzyskaliśmy obraz tła. Należy go teraz odjąć od obrazu oryginalnego. Ten rodzaj operacji można nazwać top-hat poprzez rekonstrukcję. Wynik wyświetl. Dla porównania wyświetl wynik klasycznej operacji top-hat – różnicy miedzy obrazem oryginalnym a obrazem po klasycznym otwarciu.
4. W podobny sposób należy zlikwidować odblaski pionowe:
  - erozja z elementem strukturalnym w postaci poziomej linii – `np.ones((1,11))` – zostaną zachowane wszystkie znaki (bo prawie wszystkie są szersze). Uwaga. Operacje wykonujemy na uzyskanym w kroku 3 rezultacie odjęcia od obrazu oryginalnego, obrazu po rekonstrukcji.
  - rekonstrukcja: marker – obraz po erozji, maska – obraz z punktu 3 (różnica oryginalnego i tła),
  - wynik wyświetl.
5. Rezultat jest niemal satysfakcjonujący, ale wystąpił problem z cienkimi pionowymi elementami napisów – np. I na klawiszu ASIN. Wykorzystując fakt, że usunięte znaki znajdują się w bezpośrednim sąsiedztwie istniejących znaków wykonujemy następujące operacje:
  - dylatacja z elementem `np.ones((1,21))`,
  - rekonstrukcja z markerem w postaci – minimum(obraz po dylatacji z punktu powyżej, obraz uzyskany w punkcie 3, tj. różnica oryginalnego i tła) oraz maską – obraz z pkt. 3.
6. Rezultat wyświetl. Czy za pomocą zaproponowanych operacji udało się uzyskać zamierzony efekt – ekstrakcję napisów?


In [None]:
def reconstruct(img, kernel, marker=None):
    mask = img.copy()
    marker = cv2.erode(img, kernel) if marker is None else marker

    while True:
        text_dilated = cv2.dilate(src=marker, kernel=np.ones((3, 3)))
        text_marker_new = np.minimum(text_dilated, mask)
        if np.array_equal(marker, text_marker_new):
            break
        marker = text_marker_new
    return marker

In [None]:
calculator = cv2.imread("calculator.bmp", cv2.IMREAD_GRAYSCALE)
plot_img(calculator, "Original")
kernel1 = np.ones((1, 71), dtype=np.uint8)
calculator_open = cv2.morphologyEx(calculator, cv2.MORPH_OPEN, kernel1)
plot_img(calculator_open, "Opened")
calculator_tophat = cv2.morphologyEx(calculator, cv2.MORPH_TOPHAT, kernel1)
plot_img(calculator_tophat, "Tophat")

In [None]:
marker = reconstruct(calculator, kernel1)
plot_img(marker, "Marker")

calculator_diff = cv2.absdiff(calculator, marker)
plot_img(calculator_diff, "Diff")

calculator_erode = cv2.erode(calculator, np.ones((1, 11)))
calculator_dilate = cv2.dilate(calculator_erode, np.ones((1, 11)))

calculator_reconstruct = reconstruct(calculator_diff, np.ones((1, 21)), np.minimum(calculator_dilate, calculator_tophat))

plot_img(calculator_reconstruct, "Reconstructed")