# Detekcja krawędzi

## Cel ćwiczenia

- Zapoznanie z metodami detekcji krawędzi:
    - Sobel, Prewitt, Roberts - przypomnienie,
    - Laplasjan z Gaussa (LoG – ang. Laplacian of Gaussian),
    - Canny.

Detekcja krawędzi przez wiele lat była podstawą algorytmów segmentacji.
Krawędzie wykrywane są najczęściej z wykorzystaniem pierwszej (gradient) i drugiej (Laplasjan) pochodnej przestrzennej.
Wykorzystanie obu metod zaprezentowane zostało w ćwiczeniu *Przetwarzanie wstępne. Filtracja kontekstowa*.

W niniejszym ćwiczeniu poznane detektory krawędzi zostaną porównane z bardziej zaawansowanymi: Laplasjan z funkcji Gaussa (LoG), Zero Crossing i Canny.

## Laplasjan z Gaussa (LoG)

Funkcja Gaussa:<br>
\begin{equation}
h(r) = e^{\frac{-r^2}{2 \sigma^2}}
\end{equation}<br>
gdzie:
- $r^2 = x^2 + y^2$
- $\sigma$ to odchylenie standardowe.

Działanie filtracji Gaussowskiej zostało przedstawione w ćwiczeniu "Przetwarzanie wstępne". W jej wyniku następuje rozmazanie obrazu.
Laplasjan tej funkcji dany jest wzorem:

\begin{equation}
\nabla^2 h(r) = \frac{r^2 - 2\sigma^2}{\sigma^4} e^{-\frac{r^2}{2\sigma^2}}
\end{equation}

Funkcję (z oczywistych powodów) nazywamy Laplasjan z Gaussa (LoG).
Ponieważ druga pochodna jest operacją liniową, konwolucja obrazu z $\nabla^2 h(r)$ daje taki sam efekt jak zastosowanie filtracji Gaussa na obrazie, a następnie obliczenie Laplasjanu z wyniku.
Lokalizacja krawędzi polega na znalezieniu miejsca, gdzie po filtracji LoG następuje zmiana znaku.

1. Wczytaj obraz *house.png*.
2. Wykonaj rozmycie Gaussowskie obrazu wejściowego.
W tym celu wykorzysaj funkcję `cv2.GaussianBlur(img, kSize, sigma)`.
Pierwszy argument jest obrazem wejśćiowym.
Drugi jest rozmiarem filtru (podanym w nawiasach okrągłych, np. *(3, 3)*).
Trzecim argumentem jest odchylenie standardowe. Wartość jest dobrana automatycznie, jeśli zosanie podana wartość `0` (będą równe rozmiarowi).
3. Oblicz laplasjan obrazu rozmytego.
W tym celu wykorzysaj funkcję `cv2.Laplacian(img, ddepth)`.
Pierszym argumentem jest obraz wejściowy.
Drugim argumentem jest typ danych wejściowych. Użyj `cv2.CV_32F`.
4. Wyznacz miejsca zmiany znaku.
Zaimplementuj funkcję `crossing(LoG, thr)`:
    - Najpierw stwórz tablicę, do której zostanie zapisany wynik.
    Jej rozmiar jest taki sam jak przetwarzanego obrazu.
    - Następnie wykonaj pętle po obrazie (bez ramki jednopikselowej).
    W każdej iteracji stwórz otoczenie o rozmiarze $3 \times 3$.
    Dla otoczenia oblicz wartość maksymalną i minimalną.
    - Jeśli wartości te mają przeciwne znaki, to do danego miejsca tablicy przypisz wartość:
        - jeśli piksel wejściowy > 0, to dodaj do niego wartość bezwzględną minimum.
        - jeśli piksel wejściowy < 0, to do jego wartości bezwzględnej dodaj maksimum.
    - Zmień zakres wykonanej tablicy do $<0, 255>$.
    - Wykonaj progowanie tablicy. Próg jest argumentem wejściowym.
    - Przeskaluj dane binarne do wartości `[0, 255]`.
    - Wykonaj konwersję do typu *uint8*.
    - Wykonaj rozmycie medianowe wyniku.
    Wykorzystaj funkcję `cv2.medianBlur(img, kSize)`.
    Pierwszym argumentem jest obraz wejśćiowy, a drugim rozmiar filtra.
    - Zwróć wyznaczoną tablicę.
5. Wyświetl obraz wynikowy.
6. Dobierz parametry (rozmiar filtru Gaussa, odchylenie standardowe, próg binaryzacji) tak, by widoczne były kontury domu, ale nie dachówki.

In [None]:
import cv2
from matplotlib import pyplot as plt
import numpy as np
import math
import os

if not os.path.exists("dom.png") :
    !wget https://raw.githubusercontent.com/vision-agh/poc_sw/master/09_Canny/dom.png --no-check-certificate


#Wczytanie obrazu dom
dom = cv2.imread('dom.png', cv2.IMREAD_GRAYSCALE)

#Rozmycie gaussowskie
gauss = cv2.GaussianBlur(dom, (3, 3), 2)

#Obliczenie laplasjanu
lapl = cv2.Laplacian(gauss, cv2.CV_32F)


fig, axs = plt.subplots(1, 3)
fig.set_size_inches(30, 30)
axs[0].imshow(dom, 'gray')
axs[0].set_title('Obraz oryginalny')
axs[0].axis('off')
axs[1].imshow(gauss, 'gray')
axs[1].set_title('Rozmycie Gaussowskie')
axs[1].axis('off')
axs[2].imshow(lapl, 'gray')
axs[2].set_title('Laplasjan obrazu rozmytego')
axs[2].axis('off')

plt.show()


In [None]:
#Funkcja crossing

def crossing(LoG, thr):
    X, Y = LoG.shape
    tab = np.ones((X, Y))
    for i in range(1, X-1):
        for j in range(1, Y-1):
            zm = LoG[(i-1):(i+2), (j-1):(j+2)]
            z_max = np.max(zm)
            z_min = np.min(zm)
            if (z_min > 0 and z_max < 0) or (z_min < 0 and z_max > 0):
                if LoG[i, j] > 0:
                    tab[i, j] = LoG[i, j] + np.abs(z_min)
                else:
                    tab[i, j] = np.abs(LoG[i, j]) + z_max
                    
    tab_norma=cv2.normalize(tab,None,0,255,cv2.NORM_MINMAX) #normalizacja
    #tab_norma=tab_norma.astype('uint8')
    
    tab_prog=np.where(tab_norma < thr, 0, 1) #progowanie
    tab_prog=tab_prog*255  
    tab_prog=tab_prog.astype('uint8')  
    
    new_tab=cv2.medianBlur(tab_prog, 5)
    return new_tab  

#rozmiar filtru 7x7
#odchylenie standardowe = 45
#prog binaryzacji 5


gauss_1 = cv2.GaussianBlur(dom, (7, 7), 45)
lap_1=cv2.Laplacian(gauss_1, cv2.CV_32F)
cross=crossing(lap_1, 5)

fig, axs = plt.subplots(1, 2)
fig.set_size_inches(30, 30)
axs[0].imshow(dom, 'gray')
axs[0].set_title('Obraz oryginalny')
axs[0].axis('off')
axs[1].imshow(cross , 'gray')
axs[1].set_title('Obraz po filtracji')
axs[1].axis('off')

plt.show()


## Algorytm Canny'ego

> Algorytm Canny'ego to często wykorzystywana metoda detekcji krawędzi.
> Zaproponowana została w~1986r. przez Johna F. Cannego.
> Przy jego projektowaniu założono trzy cele:
> - niska liczba błędów - algorytm powinien znajdywać wszystkie krawędzie oraz generować jak najmniej fałszywych detekcji,
> - punkty krawędziowe powinny być poprawnie lokalizowane - wykryte punkty powinny być jak najbardziej zbliżone do rzeczywistych,
> - krawędzie o szerokości 1 piksela - algorytm powinien zwrócić jeden punkt dla każdej rzeczywistej krawędzi.

Zaimplementuj pierwszą część algorytmu detekcji krawędzi Canny'ego:
1. W pierwszym kroku obraz przefiltruj dwuwymiarowym filtrem Gaussa.
2. Następnie oblicz gradient pionowy i poziomy ($g_x $ i $g_y$).
Jedną z metod jest filtracja Sobela.
3. Dalej oblicz amplitudę:
$M(x,y)  = \sqrt{g_x^2+g_y^2}$ oraz kąt:
$\alpha(x,y) = arctan(\frac{g_y}{g_x})$.
Do obliczenia kąta wykorzystaj funkcję `np.arctan2(x1, x2)`.
Wynik jest w radianach.
4. W kolejnym etapie wykonaj kwantyzację kątów gradientu.
Kąty od $-180^\circ$ do $180^\circ$ można podzielić na 8 przedziałów:
[$-22.5^\circ, 22.5^\circ$], [$22.5^\circ, 67.5^\circ$],
[$67.5^\circ, 112.5^\circ$], [$112.5^\circ, 157.5^\circ$],
[$157.5^\circ, -157.5^\circ$], [$-157.5^\circ, -112.5^\circ$],
[$-112.5^\circ, -67.5^\circ$], [$-67.5^\circ, -22.5^\circ$].
Przy czym należy rozpatrywać tylko 4 kierunki:
    - pionowy ($d_1$),
    - poziomy ($d_2$),
    - skośny lewy ($d_3$),
    - skośny prawy ($d_4$).
5. Dalej przeprowadź eliminację pikseli, które nie mają wartości maksymalnej (ang. *nonmaximal suppresion*).
Celem tej operacji jest redukcja szerokości krawędzi do rozmiaru 1 piksela.
Algorytm przebiega następująco.
W rozpatrywanym otoczeniu o rozmiarze $3 \times 3$:
    - określ do którego przedziału należy kierunek gradientu piksela centralnego ($d_1, d_2, d_3, d_4$).
    - przeanalizuje sąsiadów leżących na tym kierunku.
Jeśli choć jeden z nich ma amplitudę większą niż piksel centralny, to należy uznać, że nie jest lokalnym maksimum i do wyniku przypisać $g_N(x,y) = 0$.
W przeciwnym przypadku $g_N(x,y) = M(x,y)$.
Przez $g_N$ rozumiemy obraz detekcji lokalnych maksimów.
Zaimplementuj funkcję `nonmax`.
Pierwszym argementem jest macierz kierunków (po kwantyzacji).
Drugim argumentem jest macierz amplitudy.
6. Ostatnią operacją jest binaryzacja obrazu $g_N$.
Stosuje się tutaj tzw. binaryzację z histerezą.
Wykorzystuje się w niej dwa progi: $T_L$ i $T_H$, przy czym $T_L < T_H$.
Canny zaproponował, aby stosunek progu wyższego do niższego był jak 3 lub 2 do 1.
Rezultaty binaryzacji można opisać jako:<br>
$g_{NH}(x,y) = g_N(x,y) \geq TH $<br>
$g_{NL}(x,y) = TH > g_N(x,y) \geq TL $<br>
Można powiedzieć, że na obrazie $g_{NH}$ są "pewne" krawędzie.
Natomiast na $g_{NL}$ "potencjalne".
7. Na jednym obrazie zaznacz piksele należące do obrazu $g_{NH}$ jako czerwone oraz należące do obrazu $g_{NL}$ jako niebieskie.
Wyświetl obraz.

In [None]:
dom = cv2.imread('dom.png', cv2.IMREAD_GRAYSCALE)

def fgaussian(size, sigma):
     m = n = size
     h, k = m//2, n//2
     x, y = np.mgrid[-h:h+1, -k:k+1]
     g = np.exp(-(x**2 + y**2)/(2*sigma**2))
     return g /g.sum() 

    #algorytm Canny'ego
def Canny(obraz, tl, th):
    X,Y = obraz.shape
    #filtorwanie
    obraz_Gauss = cv2.GaussianBlur(obraz, (5, 5), 0)
    
    S1 = np.array([[-1, 0, 1], [-2, 0, 2], [-1, 0, 1]], np.float32)
    S2 = np.array([[-1, -2, -1], [0, 0, 0], [1, 2, 1]], np.float32)
    
    #gradient pionowy i poziomy
    gx = cv2.filter2D(obraz_Gauss, -1, S1)
    gy = cv2.filter2D(obraz_Gauss, -1, S2)
    
    #amplituda
    Mxy = np.sqrt((gx**2)+(gy**2))
    Mxy = Mxy.astype('uint8')
    
    #kąt
    alpha = np.arctan2(gy, gx)   
    angle = alpha * 180 / np.pi
    angle[angle < 0] += 180
    
    #tablica kierunku gradientu piksela centralnego
    tab_1 = np.ones((X,Y))
    
    for i in range (X):
        for j in range (Y):
            
            #kąt 0
            if (0 <= angle[i,j] < 22.5) or (157.5 <= angle[i,j] <= 180):
                tab_1[i, j] = 1
            
            #kąt 45
            elif (22.5 <= angle[i,j] < 67.5):
                tab_1[i, j] = 2
            
            #kąt 90
            elif (67.5 <= angle[i,j] < 112.5):
                tab_1[i, j] = 3
            
            #kąt 135
            elif (112.5 <= angle[i,j] < 157.5):
                tab_1[i,j] = 4
                
    gN = nonmax(tab_1, Mxy)
    gNH = gN >= th
    gNL = np.where(np.logical_and(th > gN, gN >= tl), 1, 0)
    
    return gNH, gNL            


In [None]:
def nonmax(tab_1, Mxy):
    
    X, Y = tab_1.shape
    gN = np.ones((X,Y))
    
    for i in range (1, X-1):
        for j in range (1, Y-1):
            
            if(tab_1[i, j] == 1):
                
                if(Mxy[i, j-1] > Mxy[i, j] or Mxy[i, j + 1] > Mxy[i, j]):
                    gN[i, j]=0 
                else:                    
                    gN[i, j] = Mxy[i, j]
                    
            elif(tab_1[i, j] == 2):
                
                if(Mxy[i + 1, j - 1] > Mxy[i, j] or Mxy[i - 1, j + 1] > Mxy[i, j]):      
                    gN[i, j] = 0
                
                else:
                    gN[i, j] = Mxy[i, j]
            
            elif(tab_1[i, j] == 3):
                
                if(Mxy[i + 1, j] > Mxy[i, j] or Mxy[i - 1, j] > Mxy[i, j]):
                    gN[i, j] = 0
                else:
                    gN[i, j] = Mxy[i, j]
            elif(tab_1[i, j] == 4):
                
                if(Mxy[i - 1, j - 1] > Mxy[i, j] or Mxy[ i + 1, j + 1] > Mxy[i, j]):
                    gN[i, j] = 0
                else:
                    gN[i, j] = Mxy[i, j]
    return gN

In [None]:
I_dom = cv2.imread('dom.png', cv2.IMREAD_GRAYSCALE)

#Wyświetlenie dwóch obrazów gNH i gNL
gNH, gNL = Canny(I_dom, 5, 10)
fig, axs = plt.subplots(1, 2)
fig.set_size_inches(30, 30)
axs[0].imshow(gNH, 'gray', vmin=0, vmax=1)
axs[0].set_title('Obraz gnh')
axs[0].axis('off')
axs[1].imshow(gNL, 'gray', vmin=0, vmax=1)
axs[1].set_title('Obraz gnl')
axs[1].axis('off')
plt.show()


In [None]:
#binaryzacja obrazu gn
X,Y = gNH.shape
obraz = np.zeros((X, Y, 3))

for i in range(0, X):
    for j in range(0, Y):
        
        if gNH[i, j] == 1:
            obraz[i,j] = [255, 0, 0]
            
        elif gNL[i, j] == 1:
            obraz[i, j] = [0, 0, 255]

#Wyświetlenie obrazu            
plt.imshow(obraz)
plt.axis('off')
plt.title('gNH-czerwone, gNL-niebieskie')
plt.show()

## Algorytm Canny'ego - OpenCV

1. Wykonaj dektekcję krawędzi metodą Canny'ego wykorzystując funkcję `cv2.Canny`.
    - Pierwszym argumentem funkcji jest obraz wejściowy.
    - Drugim argumentem jest mniejszy próg.
    - Trzecim argumentem jest większy próg.
    - Czwarty argument to tablica, do której wpisany zostanie wynik.
    Można zwrócić go przez wartość i podać wartość `None`.
    - Piąty argument to rozmiar operatora Sobela (w naszym przypadku 3).
    - Szósty argument to rodzaj używanej normy.
    0 oznacza normę $L_1$, 1 oznacza normę $L_2$. Użyj $L_2$.
2. Wynik wyświetl i porównaj z wykonaną częściową implementacją w poprzednim ćwiczeniu.
Na czym polegają różnice?

In [None]:
dom = cv2.imread('dom.png', cv2.IMREAD_GRAYSCALE)

dom_1 = cv2.Canny(dom, 20, 40, None, 3, 1)

f, ax = plt.subplots(1,2,figsize=(20,6))
ax[0].imshow(gNH, 'gray')
ax[0].axis('off')
ax[0].set_title('Obraz gNH')
ax[1].imshow(dom_1, 'gray')
ax[1].axis('off')
ax[1].set_title('Canny-OpenCV')

plt.show()

In [None]:
#KOMENTARZ
#Detekcja krawędzi funkcją cv2.Canny jest zdecydowanie dokładniejsza. Krawędzie są zaokrąglone, są zdecydowanie
#wyraźniejsze oraz ciągłe, nie ma żadnych przerw. Kolejna zaleta to eliminacja szumu