# Filtracja Non-Local Means

## Definicja

Kolejny "poziom wtajemniczenia" w zagadnienie filtracji obrazów to metoda Non-Local Means (NLM).
Została ona zaproponowana w pracy *A non-local algorithm for image denoising* autorstwa Antoni Buades, Bartomeu Coll, i Jean Michel Morel na konferencji CVPR w 2005 roku.

Filtr NLM dany jest zależnością:

\begin{equation}
\hat{I}(\mathbf{x}) = \sum_{\mathbf{p} \in V(\mathbf{x})} w(\mathbf{p},\mathbf{x})I(\mathbf{p})
\end{equation}

gdzie:
- $I$ - obraz wejściowy,
- $\hat{I}$ - obraz wyjściowy (przefiltrowany),
- $\mathbf{x}$ - współrzędne piksela obrazu,
- $V(\mathbf{x})$ - obszar poszukiwań piksela, dla którego przeprowadzana jest filtracja,
- $w$ - waga punktu $\mathbf{p}$ z obszaru poszukiwań.

Wróćmy na chwilę do filtracji bilateralnej. Tam waga danego piksela z kontekstu zależała od dwóch czynników - odległości przestrzennej pomiędzy pikselami oraz różnicy w jasności/kolorze pomiędzy pikselami (tzw. przeciwdziedzina).
Filtr NLM stanowi uogólnienie tej metody - do obliczania wag nie wykorzystuje się już pojedynczych pikseli ($\mathbf{p}$ i $\mathbf{x}$), a lokalne konteksty ($N(\mathbf{p})$ i $N(\mathbf{x})$).

Waga $w$ dana jest następującą zależnością:

\begin{equation}
w(\mathbf{p},\mathbf{x}) = \frac{1}{Z(\mathbf{x})}\exp(-\frac{|| v(N(\mathbf{p})) - v(N(\mathbf{x})) ||^2_{2}}{\alpha \sigma^2})
\end{equation}

gdzie:
- \begin{equation}
Z(\mathbf{x}) = \sum_{\mathbf{p} \in  V(\mathbf{x})} \exp(-\frac{|| v(N(\mathbf{p})) - v(N(\mathbf{x})) ||^2_{2}}{\alpha \sigma^2})
\end{equation},
- $|| \cdot ||$ - jest normą $L_2$ odległości pomiędzy dwoma kontekstami,
- $v$ oznacza mnożenie punktowe kontekstu $N$ przez dwuwymiarową maskę Gaussa o odpowiadających kontekstowi wymiarach,
- $\alpha$ > 0 - parametr sterujący filtracją,
- $\sigma$ - parametr szumu stacjonarnego występującego na obrazie (w przypadku szumu niestacjonarnego, parametr $\sigma$ musi zostać dopasowany lokalnie tj. $\sigma = \sigma(\mathbf{x})$).

## Analiza działania

Zastanówmy sie teraz jak działa filtra NLM. Najprościej to zrozumieć na rysunku.

![Ilustracja NLM](https://raw.githubusercontent.com/vision-agh/poc_sw/master/07_Bilateral/nlm.png)

1. Dla rozważanego piksela $\mathbf{x}$ definiujemy obszar poszukiwań $V(\mathbf{x})$. Uwaga - obszar poszukiwań ($V$) jest jednostką większą niż otocznie/kontekst ($N$).

2. Następnie, dla każdego z pikseli $\mathbf{p} \in  V(\mathbf{x})$ oraz samego $\mathbf{x}$ definiujemy otocznie/kontekst odpowiednio $N(\mathbf{p})$ i $N(\mathbf{x})$.

3. Wracamy do równania definiującego wagę  $w(\mathbf{p},\mathbf{x})$, a konkretnie do wyrażenia $|| v(N(\mathbf{p})) - v(N(\mathbf{x})) ||$. Przeanalizujmy co ono oznacza. Mamy dwa otoczenia: $N(\mathbf{p})$ i $N(\mathbf{x})$. Każde z nich mnożymy przez odpowiadającą maskę Gaussa - funkcja $v$. Otrzymujemy dwie macierze, które odejmujemy od siebie punktowo. Następnie obliczamy kwadrat z normy ($L_2$ definiujemy jako $||X||_2 = \sqrt{\sum_k|X_k|^2}$. Otrzymujemy zatem jedną liczbę, która opisuje nam podobieństwo otoczeń pikseli $\mathbf{x}$ i $\mathbf{p}$. Mała wartość oznacza otoczenia zbliżone, duża - różniące się. Ponieważ, z dokładnością do stałych, liczba ta stanowi wykładnik funkcji $e^{-x}$, to ostatecznie waga jest zbliżona do 1 dla otoczeń podobnych, a szybko maleje wraz z malejącym podobieństwem kontekstów.

4. Podsumowując. Jak wynika z powyższej analizy filtr NLM to taki filtr bilateralny, w którym zamiast pojedynczych pikseli porównuje się ich lokalne otoczenia. Wpływa to pozytywnie na jakość filtracji, niestety kosztem złożoności obliczeniowej.

## Implementacja

W ramach zadania należy zaimplementować filtr NLM, ocenić jego działanie w porównaniu do filtra Gaussa i bilateralnego oraz dokonać pomiaru czasu obliczeń (dla trzech wymienionych metod).

Jak już się zrozumie jak działa NLM, jego implementacja jest dość prosta.
Wartość parametru $\alpha$ należy dobrać eksperymentalnie.
Nie należy także "przesadzić" z rozmiarem obszaru poszukiwań (np. 11x11) oraz kontekstu (5x5 lub 3x3).

Wskazówki do implementacji:
- algorytm sprowadza się do dwóch podwójnych pętli for: zewnętrzne po pikselach, wewnętrzne po kolejnych obszarach przeszukań,
- przed realizacją trzeba przemyśleć problem pikseli brzegowych - de facto problemów jest kilka. Po pierwsze nie dla każdego piksela można wyznaczyć pełny obszar przeszukań (tu propozycja, aby filtrację przeprowadzać tylko dla pikseli z pełnym obszarem). Po drugie, ponieważ rozpatrujemy konteksty, to nawet dla piksela o "pełnym" obszarze przeszukań, będą istnieć piksele, dla których nie pełnych kontekstów (sugestia - powiększyć obszar przeszukać, tak aby zawierał konteksty). Ostatni problem jest bardziej techniczny/implementacyjny. Jeśli w kolejnych iteracjach "jawnie" wytniemy fragment o rozmiarach obszaru przeszukiwań, to znowu pojawi się problem brzegowy - tu można albo wyciąć nieco większy obszar, albo cały czas "pracować" na obrazie oryginalnym ("żonglerka indeksami").
- warto sprawdzać indeksy i rozmiary "wycinanych" kontekstów,
- wagi wyliczamy w trzech krokach:
    - obliczenia dla $N(\mathbf{x})$ + inicjalizacja macierzy na wagi,
    - podwójna pętla, w której przeprowadzamy obliczenia dla kolejnych $N(\mathbf{p})$ oraz wyliczamy wagi,
    - normalizacja macierzy wag oraz końcowa filtracja obszaru w wykorzystaniem wag.
- uwaga, obliczenia trochę trwają, nawet dla obrazka 256x256 i względnie niewielkich obszaru przeszukań i kontesktu.

Efekt końcowy:
- porównanie wyników metod: filtr Gaussa, filtr bilateralny oraz filtr NLM (2-3 zdania komentarza),
- porównanie czasu działania powyższych metod (1 zdanie komentarza).


In [None]:
def fgaussian(size, sigma):
    m = n = size
    h, k = m//2, n//2
    x, y = np.mgrid[-h:h+1, -k:k+1]
    g = np.exp(-(x**2 + y**2)/(2*sigma**2))
    return g /g.sum()

In [None]:
def nlm(image, window_size, context_size, alfa=15, sigma=3):
    image_copy = image.copy()
    X,Y = image.shape
    g_f = fgaussian(context_size, 5)
    
    border = window_size//2 + context_size//2
    
    for i in range(border, X - border ):
        for j in range(border, Y - border):
            
            x_w_range_up =   i - window_size//2 
            x_w_range_down = i + window_size//2 + 1
            y_w_range_left =  j - window_size//2 
            y_w_range_right = j + window_size//2 + 1
            
            window = image[x_w_range_up : x_w_range_down, y_w_range_left : y_w_range_right]
            X_w, Y_w = window.shape
            
            N_x = image[i - context_size//2 : i + context_size//2 + 1  , j - context_size//2 : j + context_size//2 + 1]
            
            matrix_of_exps = np.zeros(window.shape)
            
#             print("N_X\n\n",N_x)
            for i_w in range(X_w):
                for j_w in range(Y_w):
                    x_c_range_up =   i- window_size//2 + i_w - context_size//2 
                    x_c_range_down = i- window_size//2 + i_w + context_size//2 + 1
                    y_c_range_left =  j- window_size//2 + j_w - context_size//2 
                    y_c_range_right = j- window_size//2 + j_w + context_size//2 + 1
                    
                    context= image[x_c_range_up : x_c_range_down, y_c_range_left : y_c_range_right]
                    
#================================================================================================================================

                    diff = np.dot(N_x, g_f) - np.dot(context, g_f)  
                    norm_of_diff = (np.sum(diff**2))**0.5        
                    norm_to_2 = norm_of_diff**2
                    matrix_of_exps[i_w,j_w]= np.exp( ((-1) * norm_to_2) / (alfa * ((sigma)**2)))
#                     print(matrix_of_exps[i_w,j_w])
#                     print("n_x\n",N_x, "\ng_f\n", g_f, "\ncontext\n", context )
#                     print("\nm1:\n", np.dot(N_x, g_f), "\nm2\n", np.dot(context, g_f))
#                     print("\n\ndiff\n",diff)
#                     print("norm_ofdiff", norm_of_diff)
#                     print("normto2", norm_to_2)
#                     print("context\n\n",context)
                    
#             print(matrix_of_exps)
            z_x = np.sum(matrix_of_exps)
            w_px_matrix = np.zeros(window.shape)
        
            for i_w in range(X_w):
                for j_w in range(Y_w):
                    w_px_matrix[i_w, j_w] = (1/z_x) * matrix_of_exps[i_w,j_w] * image[i- window_size//2 + i_w, j- window_size//2 + j_w ]
                    
#             print("\n\nz_x\n",z_x)
#             print("\n\nmatrix_of_exps\n",matrix_of_exps)
#             print("\n\nw_px_matrix\n", w_px_matrix)
        
            value = np.sum(w_px_matrix )
            
#             print("\n\norg:", image[i,j], "\nnew:", value )
            image_copy[i,j]= value
    return image_copy

In [None]:
def get_new_pixel_fb(window, g_filtr, sigma_r):
    X, Y = window.shape
    matrix = np.zeros(window.shape)
    
    for i_w in range(X):
        for j_w in range(Y):
            middle_i= X//2
            middle_j= Y//2
            dst_val = ((middle_i - i_w)**2 + (middle_j - j_w)**2)**0.5

            gamma = np.exp(((-1)*(dst_val)**2)/(2*(sigma_r)**2))
            
            matrix[i_w,j_w] = gamma*window[i_w,j_w]*g_filtr[i_w,j_w]
    
    value = np.sum(matrix) / np.sum(g_filtr)
    return value

def f_bilateralna(image, window_size, sigma_s, sigma_r):
    g_filtr = fgaussian(window_size, sigma_s)
    image_copy = image.copy()
    X,Y= image.shape
    filter_image=np.zeros((X,Y))
    
    for i in range(window_size//2, X - window_size//2):
        for j in range(window_size//2, Y - window_size//2):
            x_range_up = i- window_size//2 
            x_range_down = i + window_size//2 + 1
            y_range_left = j- window_size//2 
            y_range_right = j + window_size//2 + 1
    
            window = image[x_range_up : x_range_down, y_range_left : y_range_right]
            value = get_new_pixel_fb(window, g_filtr, sigma_r)
            
            image_copy[i,j]= value
    return image_copy
            

In [None]:
def get_new_pixel_value(window, g_filtr):
    matrix = np.zeros(window.shape)
    
    for i_w in range(len(window[:])):
        for j_w in range(len(window[i_w, :])):
            matrix[i_w,j_w] = window[i_w,j_w]*g_filtr[i_w,j_w]
    
    value = np.sum(matrix) / np.sum(g_filtr)
    return value

def konwolucja(image, window_size, sigma):
    g_filtr = fgaussian(window_size, sigma)
    image_copy = image.copy()
    X,Y= image.shape
    filter_image=np.zeros((X,Y))
    
    for i in range(window_size//2, X - window_size//2):
        for j in range(window_size//2, Y - window_size//2):
            x_range_up = i- window_size//2 
            x_range_down = i + window_size//2 + 1
            y_range_left = j- window_size//2 
            y_range_right = j + window_size//2 + 1
    
            window = image[x_range_up : x_range_down, y_range_left : y_range_right]
            value = get_new_pixel_value(window, g_filtr)
            
            image_copy[i,j]= value
    return image_copy

In [None]:
from matplotlib import pyplot as plt
import numpy as np
from scipy.io import loadmat
from timeit import default_timer as timer
import math
import os

if not os.path.exists("MR_data.mat") :
    !wget https://raw.githubusercontent.com/vision-agh/poc_sw/master/07_Bilateral/MR_data.mat --no-check-certificate

mat = loadmat('MR_data.mat')
Input = mat['I_noisy1']        
plt.gray()

# POMIAR CZASOW

start = timer()
konw_image=konwolucja(Input, window_size = 3, sigma = 5)
end = timer()
konw_time=(end - start)

start = timer()
bilat_image=f_bilateralna(Input, window_size = 3, sigma_s = 5, sigma_r = 3)
end = timer()
bilat_time=(end - start)

start = timer()
nlm_image=nlm(Input, window_size = 11, context_size = 3)    
end = timer()    
nlm_time=(end - start)
    
    
    
f, tab = plt.subplots(2,2, figsize=(15,15))
tab[0,0].imshow(Input)
tab[0,0].axis('off')
tab[0,0].set_title('Oryginal')

tab[0,1].imshow(nlm_image)
tab[0,1].axis('off')
tab[0,1].set_title('NLM Time:'+ str(nlm_time))

tab[1,0].imshow(konw_image)
tab[1,0].axis('off')
tab[1,0].set_title('Konwolucja Time:'+ str(konw_time))

tab[1,1].imshow(bilat_image)
tab[1,1].axis('off')
tab[1,1].set_title('Bilateralna Time:'+ str(bilat_time))


In [None]:
# Najlepszy efekt uzyskuje się bezapelacyjnie dla algorytmu nlm. Obraz zarazem jest dość ostry i nie ma na nim zakłóceń. 
# Pozostałe metody pozbywaja się zakłóceń tlyko w jakimś stopniu a dodatkow bardziej rozmywają obraz.
# Niestety wrogiem metody nlm jest czas, który jest wynikiem ogromnej złożoności obliczeniowej - Czas ten jest O WIELE dłuższy niż w pozostałych algorytmach.