# Przetwarzanie wstępne. Filtracja kontekstowa.


### Cel:
- zapoznanie z pojęciem kontekstu / filtracji kontekstowej,
- zapoznanie z pojęciem konwolucji (splotu),
- zapoznanie z wybranymi filtrami:
	- filtry liniowe dolnoprzepustowe:
		- filtr uśredniający,
		- filtr Gaussa.
	- filtry nielinowe:
		- mediana,
		- mediana dla obrazów kolorowych.
	- filtry liniowe górnoprzepustowe:
			- laplasjan,
			- operator Robersta, Prewitta, Sobela.
- zadanie domowe: adaptacyjna filtracja medianowa.

### Filtry liniowe uśredniające (dolnoprzepustowe)

Jest to podstawowa rodzina filtrów stosowana w cyfrowym przetwarzaniu obrazów. 
Wykorzystuje się je w celu "rozmazania" obrazu i tym samym redukcji szumów (zakłóceń) na obrazie.
Filtr określony jest przez dwa parametry: rozmiar maski (ang. _kernel_) oraz wartości współczynników maski.

Warto zwrócić uwagę, że omawiane w niniejszym rozdziale operacje generują nową wartość piksela na podstawie pewnego fragmentu obrazu (tj. kontekstu), a nie jak operacje punktowe tylko na podstawie jednego piksela.


1. Wczytaj obraz _plansza.png_.
W dalszej części ćwiczenia sprawdzenie działania filtracji dla innych obrazów sprowadzi się do wczytania innego pliku.

2. Podstawowa funkcja to `cv2.filter2D`  - realizacja filtracji konwolucyjnej.
   Proszę sprawdzić jej dokumentację i zwrócić uwagę na obsługę problemu brzegowego (na krawędziach istnieją piksele dla których nie da się wyznaczyć otoczenia).

  Uwaga. Problem ten można też rozwiązać z użyciem funkcji `signal.convolve2d` z biblioteki _scipy_ (`from scipy import signal`).

3. Stwórz podstawowy filtr uśredniający o rozmiarze $3 \times 3$ -- za pomocą funkcji `np.ones`. Wykonaj konwolucję na wczytanym obrazie. Na wspólnym rysunku wyświetl obraz oryginalny, po filtracji oraz moduł z różnicy.

4. Przeanalizuj otrzymane wyniki. Jakie elementy zawiera obraz "moduł z różnicy"? Co na tej podstawie można powiedzieć o filtracji dolnoprzepustowej?

In [None]:
%pip install scipy

import cv2
import os
import requests
from matplotlib import pyplot as plt
import numpy as np
from scipy import signal

url = 'https://raw.githubusercontent.com/vision-agh/poc_sw/master/06_Context/'

fileNames = ["jet.png", "kw.png", "moon.png", "lenaSzum.png", "lena.png", "plansza.png"]
for fileName in fileNames:
  if not os.path.exists(fileName):
      r = requests.get(url + fileName, allow_redirects=True)
      open(fileName, 'wb').write(r.content)



In [None]:
plansza = cv2.imread("plansza.png", cv2.IMREAD_GRAYSCALE)
N = 3
kernel = np.ones((N, N)) / (N ** 2)

signed_plansza = np.copy(plansza).astype(np.int16)
convolved_plansza = cv2.filter2D(src=signed_plansza, ddepth=-1, kernel=kernel).astype(np.int16)

fig, (src, dest, diff) = plt.subplots(1, 3, figsize=(15, 5))
for ax in (src, dest, diff):
    ax.axis('off')
src.imshow(signed_plansza, cmap="gray")
dest.imshow(convolved_plansza, cmap="gray")
diff.imshow(np.abs(signed_plansza - convolved_plansza), cmap="gray")

5. Na wspólnym rysunku wyświetl wyniki filtracji uśredniającej z oknem o rozmiarze 3, 5, 9, 15 i 35. 
Wykorzystaj polecenie `plt.subplot`. 
Przeanalizuj wpływ rozmiaru maski na wynik. 

In [None]:
def plot_convolutions_ex1(image):
    fig, axes = plt.subplots(3, 2, figsize=(10, 15))
    kernel_sizes = -1, 3, 5, 9, 15, 35
    for ax, size in zip(axes.flatten(), kernel_sizes):
        if size == -1:
            ax.imshow(image, cmap="gray")
            ax.set_title("Original")
        else:
            ax.imshow(cv2.filter2D(src=image, ddepth=-1, kernel=np.ones((size, size)) / size ** 2),
                     cmap="gray")
            ax.set_title(f"{size}x{size} convolution")
        ax.axis('off')

plot_convolutions_ex1(plansza)

6. Wczytaj obraz _lena.png_.
Zaobserwuj efekty filtracji dolnoprzepustowej dla obrazu rzeczywistego.

In [None]:
lena = cv2.imread("lena.png", cv2.IMREAD_GRAYSCALE)
plot_convolutions_ex1(lena)

7. Niekorzystny efekt towarzyszący wykonanym filtracjom dolnoprzepustowym to utrata ostrości. 
Częściowo można go zniwelować poprzez odpowiedni dobór maski. 
Wykorzystaj maskę:  `M = np.array([1 2 1; 2 4 2; 1 2 1])`. 
Przed obliczeniami należy jeszcze wykonać normalizację - podzielić każdy element maski przez sumę wszystkich elementów: `M = M/sum(sum(M));`.
Tak przygotowaną maskę wykorzystaj w konwolucji - wyświetl wyniki tak jak wcześniej.
Możliwe jest też wykorzystywanie innych masek - współczynniki można dopasowywać do konkretnego problemu.

In [None]:
M = np.array([[1, 2, 1], [2, 4, 2], [1, 2, 1]])

def plot_image(image, title="", **kwargs):
    plt.title(title)
    plt.axis('off')
    plt.imshow(image, **kwargs)
    plt.show()

plot_image(cv2.filter2D(src=plansza, ddepth=-1, kernel=M/np.sum(M)), "[1 2 1; 2 4 2; 1 2 1] mask", cmap="gray")
plot_image(cv2.filter2D(src=plansza, ddepth=-1, kernel=kernel), "Normal 3x3 mask", cmap="gray")

plot_image(cv2.filter2D(src=lena, ddepth=-1, kernel=M/np.sum(M)), "[1 2 1; 2 4 2; 1 2 1] mask", cmap="gray")
plot_image(cv2.filter2D(src=lena, ddepth=-1, kernel=kernel), "Normal 3x3 mask", cmap="gray")

8. Skuteczną i często wykorzystywaną maską jest tzw. maska Gasussa.
Jest to zbiór liczb, które aproksymują dwuwymiarowy rozkład Gaussa. 
Parametrem jest odchylenie standardowe i rozmiar maski.

9. Wykorzystując przygotowaną funkcję `fgaussian` stwórz maskę o rozmiarze $5 \times 5$ i odchyleniu standardowym 0.5.
  Wykorzystując funkcję `mesh` zwizualizuj filtr.
  Sprawdź jak parametr ``odchylenie standardowe'' wpływa na ``kształt'' filtru.

  Uwaga. W OpenCV dostępna jest *dedykowana* funkcja do filtracji Gaussa - `GaussianBlur`.
  Proszę na jednym przykładzie porównać jej działanie z użytym wyżej rozwiązaniem.

10. Wykonaj filtrację dla wybranych (2--3) wartości odchylenia standardowego.


In [None]:
def fgaussian(size, sigma):
     m = n = size
     h, k = m//2, n//2
     x, y = np.mgrid[-h:h+1, -k:k+1]
     g = np.exp(-(x**2 + y**2)/(2*sigma**2))
     return g /g.sum() 
    
    
def mesh(fun, size, ax):    
    X = np.arange(-size//2, size//2, 1)
    Y = np.arange(-size//2, size//2, 1)
    X, Y = np.meshgrid(X, Y)
    Z = fun
    
    ax.plot_surface(X, Y, Z)
        

fig, axes = plt.subplots(5, 5, figsize=(20, 20), subplot_kw={'projection': '3d'})
std_devs = np.linspace(0.1, 4, axes.size)
for ax, dev in zip(axes.flatten(), std_devs):
    mesh(fgaussian(5, dev), 5, ax)
    ax.set_title(f"std dev = {dev:.3f}")

In [None]:
def compare_functions(left_img, mid_img, **kwargs):
    left_img = left_img.astype(np.int16)
    mid_img = mid_img.astype(np.int16)
    fig, (left, mid, right) = plt.subplots(1, 3, figsize=(15, 5))
    left.imshow(left_img, cmap="gray")
    left.set_title(kwargs.get("left_title", "Original"))
    mid.imshow(mid_img, cmap="gray")
    mid.set_title(kwargs.get("mid_title", ""))

    right.imshow(np.abs(kwargs.get("operation", np.ndarray.__sub__)(left_img, mid_img)), cmap="gray")
    right.set_title(kwargs.get("right_title", "Abs difference"))
    for ax in [left, mid, right]:
        ax.axis('off')
    plt.show()

def compare_gaussian_blurs(image, kernel_size, std):
    compare_functions(
        cv2.filter2D(src=image, ddepth=-1, kernel=fgaussian(kernel_size, std)),
        cv2.GaussianBlur(image, (kernel_size, kernel_size), std),
        left_title=f"My Gaussian {kernel_size}x{kernel_size}, std: {std}",
        mid_title=f"Opencv Gaussian {kernel_size}x{kernel_size}, std: {std}"
    )

compare_gaussian_blurs(lena, 5, 0.5)
compare_gaussian_blurs(lena, 5, 1.5)
compare_gaussian_blurs(lena, 5, 2.5)
compare_gaussian_blurs(lena, 5, 3.5)

### Filtry nieliniowe -- mediana

Filtry rozmywające redukują szum, ale niekorzystnie wpływają na ostrość obrazu.
Dlatego często wykorzystuje się filtry nieliniowe - np. filtr medianowy (dla przypomnienia: mediana - środkowa wartość w posortowanym ciągu liczb).

Podstawowa różnica pomiędzy filtrami liniowymi, a nieliniowymi polega na tym, że przy filtracji liniowej na nową wartość piksela ma wpływ wartość wszystkich pikseli z otoczenia (np. uśrednianie, czasem ważone), natomiast w przypadku filtracji nieliniowej jako nowy piksel wybierana jest któraś z wartości otoczenia - według jakiegoś wskaźnika (wartość największa, najmniejsza czy właśnie mediana).


1. Wczytaj obraz _lenaSzum.png_ (losowe 10% pikseli białych lub czarnych - tzw. zakłócenia impulsowe). Przeprowadź filtrację uśredniającą z rozmiarem maski 3x3. Wyświetl, podobnie jak wcześniej, oryginał, wynik filtracji i moduł z różnicy. Wykorzystując funkcję ``cv2.medianBlur` wykonaj filtrację medianową _lenaSzum.png_ (z rozmiarem maski $3 \times 3$). Wyświetl, podobnie jak wcześniej, oryginał, wynik filtracji i moduł z różnicy. Która filtracja lepiej radzi sobie z tego typu szumem?

  Uwaga. Taki sam efekt da również użycie funkcji `signal.medfilt2d`.


In [None]:
lena_szum = cv2.imread("lenaSzum.png", cv2.IMREAD_GRAYSCALE)

def compare_median_blurs(image, kernel_size):
    compare_functions(
        image,
        cv2.medianBlur(image, kernel_size),
        mid_title=f"Median blur with {kernel_size} kernel"
    )

compare_median_blurs(lena_szum, 3)
compare_median_blurs(lena_szum, 5)
compare_median_blurs(lena_szum, 7)
compare_median_blurs(lena_szum, 9)

2. Przeprowadź filtrację uśredniającą, a następnie medianową obrazu _lena.png_.
   Wyniki porównaj - dla obu wyświetl: oryginał, wynik filtracji i moduł z różnicy.
   Szczególną uwagę zwróć na ostrość i krawędzie.
   W której filtracji krawędzie zostają lepiej zachowane?

In [None]:
def avg_filter(size):
    return np.ones((size, size)) / (size * size)

def compare_median_and_avg(image, kernel_size):
    compare_functions(
        cv2.filter2D(src=image, ddepth=-1, kernel=avg_filter(kernel_size)),
        cv2.medianBlur(image, kernel_size),
        left_title=f"Average blur {kernel_size} size",
        mid_title=f"Median blur {kernel_size} size"
    )

compare_median_and_avg(lena_szum, 3)
compare_median_and_avg(lena_szum, 5)
compare_median_and_avg(lena_szum, 7)
compare_median_and_avg(lena_szum, 9)

3. Ciekawy efekt można uzyskać wykonując filtrację medianową wielokrotnie. Określa się go mianem  posteryzacji.  W wyniku przetwarzania z obrazka usunięte zostają detale, a duże obszary uzyskują tą samą wartość jasności.  Wykonaj operację mediany $5 \times 5$ na obrazie _lena.png_ 10-krotnie. (wykorzystaj np. pętlę `for`).


Inne filtry nieliniowe:
- filtr modowy - moda (dominanta) zamiast mediany,
- filtr olimpijski - średnia z podzbioru otoczenia (bez wartości ekstremalnych),
- hybrydowy filtr medianowy - mediana obliczana osobno w różnych podzbiorach otoczenia (np. kształt ``x'',``+''), a jako wynik brana jest mediana ze zbioru wartość elementu centralnego, mediana z ``x'' i mediana z ``+'',
- filtr minimalny i maksymalny (będą omówione przy okazji operacji morfologicznych w dalszej części kursu).


Warto zdawać sobie sprawę, z szerokich możliwości dopasowywania rodzaju filtracji do konkretnego rozważanego problemu i rodzaju zaszumienia występującego na obrazie.

In [None]:
def compare_multimedian(image, kernel_size, num_iter):
    for _ in range(num_iter):
        locals()["result"] = cv2.medianBlur(locals().get("result", image), kernel_size)
    compare_functions(
        image,
        locals()["result"],
        left_title="Original",
        mid_title=f"Multimedian with {kernel_size}x{kernel_size} kernel, {num_iter} iterations"
    )

compare_multimedian(lena_szum, 5, 5)
compare_multimedian(lena_szum, 5, 10)
compare_multimedian(lena_szum, 5, 20)
compare_multimedian(lena_szum, 5, 50)

## Filtry liniowe górnoprzepustowe (wyostrzające, wykrywające krawędzie)

Zadaniem filtrów górnoprzepustowych jest wydobywanie z obrazu składników odpowiedzialnych za szybkie zmiany jasności - konturów, krawędzi, drobnych elementów tekstury.

### Laplasjan (wykorzystanie drugiej pochodnej obrazu)

1. Wczytaj obraz _moon.png_.

2. Wprowadź podstawową maskę laplasjanu:
\begin{equation}
M = 
\begin{bmatrix}
0 & 1& 0 \\ 1 & -4 & 1 \\ 0 & 1 & 0
\end{bmatrix}
\end{equation}

3. Przed rozpoczęciem obliczeń należy dokonać normalizacji maski - dla rozmiaru $3 \times 3$ podzielić każdy element przez 9.
   Proszę zwrócić uwagę, że nie można tu zastosować takiej samej normalizacji, jak dla filtrów dolnoprzepustowanych, gdyż skutkowałby to dzieleniem przez 0.

4. Wykonaj konwolucję obrazu z maską (`c2.filter2D`). Przed wyświetleniem, wynikowy obraz należy poddać normalizacji (występują ujemne wartości). Najczęściej wykonuje się jedną z dwóch operacji:
- skalowanie (np. poprzez dodatnie 128 do każdego z pikseli),
- moduł (wartość bezwzględna).

Wykonaj obie normalizacje. 
Na wspólnym wykresie wyświetl obraz oryginalny oraz przefiltrowany po obu normalizacjach. 

In [None]:
moon = cv2.imread("moon.png", cv2.IMREAD_GRAYSCALE)
laplace_mask = np.array([[0, 1, 0], [1, -4, 1], [0, 1, 0]]) / 9

laplace_moon = moon.copy()

def subplot_image(ax, image, title="", **kwargs):
    ax.set_title(title)
    ax.axis("off")
    ax.imshow(image, cmap=kwargs.get("cmap", "gray"), **kwargs)

def laplace_transform(image, norm_func, norm_name):
    _, (org, laplace) = plt.subplots(1, 2, figsize=(10, 5))
    cv2.filter2D(src=image, ddepth=-1, kernel=laplace_mask, dst=laplace_moon)
    subplot_image(org, image, "Original")
    subplot_image(
        laplace, 
        norm_func(laplace_moon),
        f"Laplace transform with {norm_name} normalization"
    )
    plt.show()

laplace_transform(moon, lambda img: img + 128, '"add 128" scaling')
laplace_transform(moon, np.abs, "abs value")
    

7. Efekt wyostrzenia uzyskuje się po odjęciu/dodaniu (zależy do maski) rezultatu filtracji laplasjanowej i oryginalnego obrazu. Wyświetl na jednym wykresie: obraz oryginalny, sumę oryginału i wyniku filtracji oraz różnicę (bezwzględną) oryginału i wyniku filtracji.
 Uwaga. Aby uniknąć artefaktów, należy obraz wejściowy przekonwertować do formatu ze znakiem.



In [None]:
compare_functions(
    moon,
    laplace_moon,
    operation=np.ndarray.__add__,
    mid_title="Laplaced",
    right_title="Original + Laplace"
)

compare_functions(
    moon.astype(np.int16),
    laplace_moon,
    mid_title="Laplaced"
)

### Gradienty (wykorzystanie pierwszej pochodnej obrazu)

1. Wczytaj obraz _kw.png_. Stwórz odpowiednie maski opisane w kolejnych punktach i dokonaj filtracji.
2. Wykorzystując gradient Robertsa przeprowadź detekcję krawędzi - poprzez wykonanie konwolucji obrazu z daną maską:
\begin{equation}
R1 = \begin{bmatrix} 0 & 0 & 0 \\ -1 & 0 & 0 \\ 0 & 1 & 0 \end{bmatrix}   
R2 = \begin{bmatrix} 0 & 0 & 0 \\ 0 & 0 & -1 \\ 0 & 1 & 0 \end{bmatrix}
\end{equation}

Wykorzystaj stworzony wcześniej kod (przy laplasjanie) - dwie metody normalizacji oraz sposób wyświetlania.

3. Analogicznie przeprowadź detekcję krawędzi za pomocą gradientu Prewitta (pionowy i poziomy)
\begin{equation}
P1 = \begin{bmatrix} -1 & 0 & 1 \\ -1 & 0 & 1 \\ -1 & 0 & 1 \end{bmatrix}   
P2 = \begin{bmatrix} -1 & -1 & -1 \\ 0 & 0 & 0 \\ 1 & 1 & 1 \end{bmatrix}
\end{equation}

4. Podobnie skonstruowany jest gradient Sobela (występuje osiem masek, zaprezentowane są dwie ``prostopadłe''):
\begin{equation}
S1 = \begin{bmatrix} -1 & 0 & 1 \\ -2 & 0 & 2 \\ -1 & 0 & 1 \end{bmatrix}   
S2 = \begin{bmatrix} -1 & -2 & -1 \\ 0 & 0 & 0 \\ 1 & 2 & 1 \end{bmatrix}
\end{equation}

Przeprowadź detekcję krawędzi za pomocą gradientu Sobela. 

In [None]:
kw = cv2.imread("kw.png", cv2.IMREAD_GRAYSCALE)
R1 = np.array([[0, 0, 0], [-1, 0, 0], [0, 1, 0]])
R2 = np.fliplr(R1)
P1 = np.array([[-1, 0, 1], [-1, 0, 1], [-1, 0, 1]])
P2 = P1.T
S1 = P1; S1[1] *= 2
S2 = S1.T

def apply_convolution(image, kernel_globals_key):
    kernel = globals()[kernel_globals_key]
    _, (org, cv) = plt.subplots(1, 2, figsize=(10, 5))
    subplot_image(
        org, 
        image, 
        title="Original"
    )
    subplot_image(
        cv, 
        cv2.filter2D(src=image, ddepth=-1, kernel=kernel), 
        title=f"{kernel_globals_key} convolution"
    )
    plt.show()

for conv in ["R1", "R2", "P1", "P2", "S1", "S2"]:
    apply_convolution(kw, conv)

5. Na podstawie dwóch ortogonalnych masek np. Sobela można stworzyć tzw. filtr kombinowany - pierwiastek kwadratowy z sumy kwadratów gradientów:
\begin{equation}
OW = \sqrt{(O * S1)^2 + (O * S2)^2}
\end{equation}
gdzie:  $OW$ - obraz wyjściowy, $O$ - obraz oryginalny (wejściowy), $S1,S2$ - maski Sobela, $*$ - operacja konwolucji.

Zaimplementuj filtr kombinowany.

Uwaga. Proszę zwrócić uwagę na konieczność zmiany formatu danych obrazu wejściowego - na typ znakiem



In [None]:
def conv(image, kernel, dtype=np.uint8):
    return cv2.filter2D(src=image.astype(dtype), ddepth=-1, kernel=kernel)

def norm_combined_conv(image):
    return np.sqrt(np.square(conv(image, S1, np.uint16)) + np.square(conv(image, S2, np.uint16)))

def abs_combined_conv(image):
    return np.abs(conv(image, S1) + conv(image, S2))

def display_conv(image, method):
    _, (org, cv) = plt.subplots(1, 2, figsize=(10, 5))
    subplot_image(org, image, "Original")
    subplot_image(cv, method(image), method.__name__)
    plt.show()


display_conv(kw, norm_combined_conv)

6. Istnieje alternatywna wersja filtra kombinowanego, która zamiast pierwiastka z sumy kwadratów wykorzystuje sumę modułów (prostsze obliczenia). 
Zaimplementuj tę wersję. 

In [None]:
display_conv(kw, abs_combined_conv)

7. Wczytaj plik _jet.png_ (zamiast _kw.png_).
Sprawdź działanie obu wariantów filtracji kombinowanej.

In [None]:
jet = cv2.imread("jet.png", cv2.IMREAD_GRAYSCALE)
display_conv(jet, norm_combined_conv)
display_conv(jet, abs_combined_conv)