# Binaryzacja

### Zadanie domowe - binaryzacja adaptacyjna w oknach z interpolacją.

Pokazana w ramach podstawowej części ćwiczenia binaryzacja adaptacyjna działa dobrze, ale jest dość złożona obliczeniowo (choć oczywiście należy mieć świadomość, że implementację można zoptymalizować i wyeliminować pewne powtarzające się obliczenia).
Zbliżone rozwiązanie można również realizować w nieco innym wariancie - w oknach.
Ogólna idea jest następująca: wejściowy obraz dzielimy na nienachodzące (rozłączne) okna - wygodnie jest założyć, że są one kwadratowe i o rozmiarze będącym potęgą liczby 2.
W każdym z okien obliczamy próg - niech to będzie średnia i stosujemy do binaryzacji lokalnej.
Jak nietrudno się domyślić efekt nie będzie dobry, gdyż na granicach okien wystąpią artefakty.
Aby je wyeliminować należy zastosować interpolację, co zostanie szczegółowo opisane poniżej.
Warto zaznaczyć, że podobny mechanizm interpolacji stosowany jest w poznanym wcześniej algorytmie CLAHE.
Zainteresowane osoby odsyłam do artykułu na [Wikipedii](https://en.wikipedia.org/wiki/Adaptive_histogram_equalization) oraz do artykułu o metodzie CLAHE - Zuiderveld, Karel. “Contrast Limited Adaptive Histograph Equalization.” Graphic Gems IV. San Diego: Academic Press Professional, 1994. 474–485.



Na początek zaimplementujemy wariant metody bez interpolacji:
1. Wczytaj obraz _rice.png_.
2. W dwóch pętlach `for`, dla okien o ustalonym wymiarze $W$ (potęga 2), oblicz średnią:
- pętle powinny mieć krok $W$,
- wynik (tj. średnie) należy zapisać w pomocniczej tablicy,
- przydatny operator to `//` - dzielenie całkowitoliczbowe (*floor division*).

3. W kolejnych dwóch pętlach `for` (tym razem o kroku 1) przeprowadź binaryzację z wyznaczonymi progami.
   Tu oczywiście należy się sprytnie odwołać do wyników z tablicy pomocniczej.
   Wyświetl wyniki - czy jest on poprawny?
   Podpowiedź - błędy lepiej widać dla mniejszego rozmiaru okna (np. 16 x 16).

In [None]:
import matplotlib.pyplot as plt
import cv2
import numpy as np
import os
import math
        
def adaptive(x,W):
    I = cv2.imread(x)
    I = cv2.cvtColor(I, cv2.COLOR_RGB2GRAY)
    B = np.zeros(I.shape)
    X,Y = I.shape
    mean = np.zeros((Y//W + 1, X//W + 1))
    for j in range(0,len(I),W):
        for i in range(0,len(I),W):
            mean[j//W,i//W] = cv2.mean(I[j : j+W , i : i+W])[0]

    for j in range(0,len(I)):
        for i in range(0,len(I)):
            B[j,i] = I[j,i] > mean[j//W , i//W] 
            
    plt.imshow(B.astype(np.int))
    plt.xticks([]), plt.yticks([])
    plt.gray()
    plt.show()

if not os.path.exists("rice.png") :
    !wget https://raw.githubusercontent.com/vision-agh/poc_sw/master/04_Thresholding/rice.png --no-check-certificate
        
adaptive("rice.png",32)

4. Rozwiązaniem problemu artefaktów na obrazie jest zastosowanie interpolacji.
   Próg binaryzacji dla danego okna wyliczany jest na podstawie progów z sąsiednich okien.
   ![Ilustracja koncepcji interpolacji](https://raw.githubusercontent.com/vision-agh/poc_sw/master/04_Thresholding/clahe_tile_interpolation.png)

   Koncepcja została przedstawiona na powyższym rysunku.
   Możliwe są 3 przypadki:
   - piksel leży w rogach obrazu (kolor czerwony) - wtedy za próg przyjmuje się wartość średniej obliczonej dla danego okna,
   - piksel leży na krawędzi obrazu (kolor zielony) - wtedy za próg przyjmuje się wartość obliczoną na podstawie średnich z dwóch sąsiednich okien,
   - piksel leży w środku (kolor fioletowy) - wtedy próg jest obliczany na podstawie 4 sąsiednich okien.

   Uwaga. Proszę zwrócić uwagę, że sprawa jest dość złożona.
   Obraz dzielimy na okna (dla nich liczymy średnią) i następnie każde z okien "wirtualnie" na cztery sub-okna (linie przerywane).
   To ułatwia znalezienie środków okien (czarne kwadraty), które są wykorzystywane w interpolacji.

5. Implementujemy interpolację.
   Potrzebujemy do tego znać progi (jeden, dwa lub cztery), ale dla przejrzystości obliczeń lepiej zawsze przyjąć cztery oraz odległości od rozważnego piksela do środka sąsiednich okien (też w ogólnym przypadku 4):
   - całość sprowadza się do określania pozycji piksela,
   - na początek rozważmy przypadek czterech narożników (kolor czerwony na rysunku) - trzeba napisać `if`, który je wyznaczy,
   - warto sprawdzić, czy nie popełniliśmy błędu i np. tymczasowo do obrazu wynikowego w tym miejscu przypisać wartość 255. Efekt powinien być taki, że widoczne będą tylko narożniki.
   - drugi przypadek do brzegi (kolor zielony) - postępujemy podobnie jak przy narożnikach, przy czym osobno wydzielamy brzegi pionowe i poziome. Tu też warto sobie obrazek "pokolorować".
   - na koniec wyznaczamy piksele w środku.
   - analizując poprawność proszę zwrócić uwagę na to, żeby nie było przerw pomiędzy obszarami.
   - mając podział możemy dla każdego z obszarów wyliczyć cztery progi ($t11, t12, t21, t22$):
        - dla narożników wartość ta będzie identyczna i wynosi po prostu `t11 =t[jT][iT]`, gdzie `iT=i//W` oraz `jT=j//W`.
          Uwaga. Proszę używać indeksów tymczasowych $jT,iT$, gdyż będą potrzebne w dalszych obliczeniach.
        - dla brzegów pionowych występują dwie wartości: okno bieżące i sąsiednie.
          Wyznaczenie współrzędnej poziomej jest proste (jak dla narożników).
          Nad współrzędną pionową trzeba się chwilę zastanowić - aby nie rozważać wielu przypadków można od bieżącej współrzędnej odjąć połowę rozmiaru okna i dopiero później wykonać dzielenie przez rozmiar okna.
          W ten sposób otrzymujemy indeks okna o mniejszej współrzędnej.
          Indeks drugiego uzyskamy dodając 1.
          Proszę się zastanowić dlaczego to działa - najlepiej to sobie rozrysować.
        - dla brzegów poziomych należy postąpić analogicznie,
        - obliczenia dla obszaru wewnątrz powinny być już oczywiste.
   - kolejny krok to wyliczenie odległości pomiędzy rozważanym pikselem, a czterema środkami.
     Przykładowo dla osi X wygląda to następująco: `dX1 = i - W/2 - iT*W` oraz `dX2 = (iT+1)*W - i-W/2`.
     Dla osi Y analogicznie.
     Ponownie proszę się zastanowić dlaczego to jest poprawne - najlepiej to sobie narysować.
   - ostatni krok to interpolacja dwuliniowa.
     Wykonamy ją w trzech krokach:
     - interpolacja w osi X dla dwóch górnych okien - sprowadza się ona do średniej ważonej pomiędzy wartościami $t11$ i $t12$, przy czym wagi to odpowiednio $dX2/W$ i $dX1/W$.
       Ponownie na podstawie rysunku proszę to przemyśleć.
     - interpolacja w osi X dla dolnych okien jest analogiczna,
     - interpolacja w osi Y również jest analogiczna, z tym, że wejściem są dwa wyniki interpolacji w poziomie.

6. "Kropka nad i" to oczywiście binaryzacja z wyznaczonym poprzez interpolację progiem - proszę dobrać rozmiar okna.
7. Na koniec proszę porównać na wspólnym rysunku poznane metody binaryzacji:
- Otsu,
- lokalna na podstawie średniej,
- lokalna Sauvoli,
- lokalna w oknach bez interpolacji,
- lokalna w oknach z interpolacją.

Proszę pod porównaniem, w osobnej sekcji *markdown*, krótko skomentować uzyskane wyniki.

In [None]:
import matplotlib.pyplot as plt
import cv2
import numpy as np
import os
import math
        
def adaptive_interpolation(x,W):
    I = cv2.imread(x)
    I = cv2.cvtColor(I, cv2.COLOR_RGB2GRAY)
    B = np.zeros(I.shape)
    X,Y = I.shape
    mean = np.zeros((Y//W + 1, X//W + 1))
    mean2 = np.zeros(((Y//W*2 ), (X//W*2)))
    mean3 = np.zeros(((Y//W*2 ), (X//W*2)))
    k = 0
    l = 0
    for j in range(0,len(I),W):
        for i in range(0,len(I),W):
            mean[j//W,i//W] = cv2.mean(I[j : j+W , i : i+W])[0]
            mean2[2*(j//W),2*(i//W)] = mean[j//W,i//W]
            mean2[2*(j//W)+1,2*(i//W)] = mean[j//W,i//W]
            mean2[2*(j//W),2*(i//W)+1] = mean[j//W,i//W]
            mean2[2*(j//W)+1,2*(i//W)+1] = mean[j//W,i//W]
            
    for j in range(len(mean2)):
        for i in range(len(mean2[:])):
            if j==0 and i==len(mean2[:])-1:
                mean3[j][i] = mean2[j][i] 
            elif j==0 and i==0:
                mean3[j][i] = mean2[j][i]      
            elif j==len(mean2)-1 and i==0:
                mean3[j][i] = mean2[j][i]         
            elif j==len(mean2) -1 and i==len(mean2[:])-1:
                mean3[j][i] = mean2[j][i] 
            elif j == 0 or  j == len(mean2[:]) -1: 
                if j%2==0:
                    mean3[j][i] = (mean2[j][i] + mean2[j+1][i])/2
                else:
                    mean3[j][i] = (mean2[j][i] + mean2[j-1][i])/2
            elif i == 0 or  i == len(mean2[:]) -1: 
                if i%2==0:
                    mean3[j][i] = (mean2[j][i] + mean2[j][i+1])/2
                else:
                    mean3[j][i] = (mean2[j][i] + mean2[j][i-1])/2
            else:
                if i%2==1 and j %2 == 1:
                    mean3[j][i] = (mean2[j][i] + mean2[j][i-1]/W + mean2[j-1][i]/W + mean2[j-1][i-1]/(math.sqrt(W)))/(1+2/W+1/(math.sqrt(W)))
                elif i%2==1 and j %2 == 0:
                    mean3[j][i] = (mean2[j][i] + mean2[j][i-1]/W + mean2[j+1][i]/W + mean2[j+1][i-1]/(math.sqrt(W)))/(1+2/W+1/(math.sqrt(W)))
                elif i%2==0 and j %2 == 0:
                    mean3[j][i] = (mean2[j][i] + mean2[j][i+1]/W + mean2[j+1][i]/W + mean2[j+1][i+1]/(math.sqrt(W)))/(1+2/W+1/(math.sqrt(W)))
                else:
                    mean3[j][i] = (mean2[j][i] + mean2[j][i+1]/W + mean2[j-1][i]/W + mean2[j-1][i+1]/(math.sqrt(W)))/(1+2/W+1/(math.sqrt(W)))            
                    
    for j in range(0,len(I)):
        for i in range(0,len(I)):
            B[j,i] = I[j,i] >= mean3[j//(W*2) , i//(W*2)] 

    plt.imshow(B.astype(np.int))
    plt.xticks([]), plt.yticks([])
    plt.gray()
    plt.show()
    
if not os.path.exists("rice.png") :
    !wget https://raw.githubusercontent.com/vision-agh/poc_sw/master/04_Thresholding/rice.png --no-check-certificate
        
adaptive_interpolation("rice.png",64)

In [None]:
import matplotlib.pyplot as plt
import cv2
import numpy as np
import os
import math
        
def adaptive(x,W):
    I = cv2.imread(x)
    I = cv2.cvtColor(I, cv2.COLOR_RGB2GRAY)
    B = np.zeros(I.shape)
    X,Y = I.shape
    mean = np.zeros((Y//W + 1, X//W + 1))
    for j in range(0,len(I),W):
        for i in range(0,len(I),W):
            mean[j//W,i//W] = cv2.mean(I[j : j+W , i : i+W])[0]

    for j in range(0,len(I)):
        for i in range(0,len(I)):
            B[j,i] = I[j,i] > mean[j//W , i//W] 
            
    plt.imshow(B.astype(np.int))
    plt.xticks([]), plt.yticks([])
    plt.gray()
    plt.show()
    
def adaptive_interpolation(x,W):
    I = cv2.imread(x)
    I = cv2.cvtColor(I, cv2.COLOR_RGB2GRAY)
    B = np.zeros(I.shape)
    X,Y = I.shape
    mean = np.zeros((Y//W + 1, X//W + 1))
    mean2 = np.zeros(((Y//W*2 ), (X//W*2)))
    mean3 = np.zeros(((Y//W*2 ), (X//W*2)))
    k = 0
    l = 0
    for j in range(0,len(I),W):
        for i in range(0,len(I),W):
            mean[j//W,i//W] = cv2.mean(I[j : j+W , i : i+W])[0]
            mean2[2*(j//W),2*(i//W)] = mean[j//W,i//W]
            mean2[2*(j//W)+1,2*(i//W)] = mean[j//W,i//W]
            mean2[2*(j//W),2*(i//W)+1] = mean[j//W,i//W]
            mean2[2*(j//W)+1,2*(i//W)+1] = mean[j//W,i//W]
            
    for j in range(len(mean2)):
        for i in range(len(mean2[:])):
            if j==0 and i==len(mean2[:])-1:
                mean3[j][i] = mean2[j][i] 
            elif j==0 and i==0:
                mean3[j][i] = mean2[j][i]      
            elif j==len(mean2)-1 and i==0:
                mean3[j][i] = mean2[j][i]         
            elif j==len(mean2) -1 and i==len(mean2[:])-1:
                mean3[j][i] = mean2[j][i] 
            elif j == 0 or  j == len(mean2[:]) -1: 
                if j%2==0:
                    mean3[j][i] = (mean2[j][i] + mean2[j+1][i])/2
                else:
                    mean3[j][i] = (mean2[j][i] + mean2[j-1][i])/2
            elif i == 0 or  i == len(mean2[:]) -1: 
                if i%2==0:
                    mean3[j][i] = (mean2[j][i] + mean2[j][i+1])/2
                else:
                    mean3[j][i] = (mean2[j][i] + mean2[j][i-1])/2
            else:
                if i%2==1 and j %2 == 1:
                    mean3[j][i] = (mean2[j][i] + mean2[j][i-1]/W + mean2[j-1][i]/W + mean2[j-1][i-1]/(math.sqrt(W)))/(1+2/W+1/(math.sqrt(W)))
                elif i%2==1 and j %2 == 0:
                    mean3[j][i] = (mean2[j][i] + mean2[j][i-1]/W + mean2[j+1][i]/W + mean2[j+1][i-1]/(math.sqrt(W)))/(1+2/W+1/(math.sqrt(W)))
                elif i%2==0 and j %2 == 0:
                    mean3[j][i] = (mean2[j][i] + mean2[j][i+1]/W + mean2[j+1][i]/W + mean2[j+1][i+1]/(math.sqrt(W)))/(1+2/W+1/(math.sqrt(W)))
                else:
                    mean3[j][i] = (mean2[j][i] + mean2[j][i+1]/W + mean2[j-1][i]/W + mean2[j-1][i+1]/(math.sqrt(W)))/(1+2/W+1/(math.sqrt(W)))            
                    
    for j in range(0,len(I)):
        for i in range(0,len(I)):
            B[j,i] = I[j,i] >= mean3[j//(W*2) , i//(W*2)] 

    plt.imshow(B.astype(np.int))
    plt.xticks([]), plt.yticks([])
    plt.gray()
    plt.show()
    
def im(I):
    plt.imshow(I)
    plt.xticks([]), plt.yticks([])
    plt.gray()
    plt.show()
    
def binar_imread(I, k):
    B = I > k
    return B.astype(np.int)
    
def otsu(x):
    I = cv2.imread(x)
    I = cv2.cvtColor(I, cv2.COLOR_RGB2GRAY)

    im(I)

    T = np.zeros((I.shape))
    I2 = cv2.normalize(I, T, 0, 255, cv2.NORM_MINMAX )
    H2 = cv2.calcHist([I2], [0], None, [256], [0, 256])
    HC = H2.cumsum()
    H2 = np.squeeze(H2)

    s = 0
    v = 0


    for k in range (0,len(H2)):
        P0 =  HC[k]/HC.max()
        if P0 >= 1 or P0 <= 0:
            continue
        P1 = 1 - P0

        P0S = 0
        for i in range(0,k+1):
            P0S = P0S + i * H2[i] / HC.max()

        m0 = P0S / P0

        P1S = 0
        for i in range(k+1, len(H2)):
            P1S = P1S + i * H2[i] / HC.max()

        m1 = P1S / P1

        sk=P0*P1*((m0-m1)**2)    
        if sk > s:
            s = sk
            v = k
    im(binar_imread(I2,v))
    
def local(x,W):
    I = cv2.imread(x)
    I = cv2.cvtColor(I, cv2.COLOR_RGB2GRAY)
    (X,Y) = I.shape
    B = np.zeros(I.shape)
    im(I)

    for j in range(int(W/2), Y-int(W/2)):
        for i in range(int(W/2), X-int(W/2)):
            mean = cv2.mean(I[int(j - (W/2)) : int(j + (W/2)) , int(i - (W/2)) : int(i + (W/2))])[0] 
            if I[j,i] > mean:
                B[j,i] = True;
            else:
                B[j,i] = False;
    im(B.astype(np.int))
    
def sauvol(x,W,f):
    I = cv2.imread(x)
    I = cv2.cvtColor(I, cv2.COLOR_RGB2GRAY)
    (X,Y) = I.shape
    B = np.zeros(I.shape)
    im(I)

    R = 128
    k = 0.15

    for j in range(int(W/2), X-int(W/2)):
        for i in range(int(W/2), Y-int(W/2)):
            C = I[int(j - (W/2)) : int(j + (W/2)) , int(i - (W/2)) : int(i + (W/2))] 
            mean = cv2.mean(C)[0]
            std = np.std(C)

            t = mean*(1 + f*k*(std/R - 1))
            if I[j,i] > t:
                B[j,i] = True;
            else:
                B[j,i] = False;
    im(B.astype(np.int))
    
print("Sauvol")
sauvol("rice.png",20,-1)
print("Lokalna na podstawie średniej")
local("rice.png",20)
print("Otsu")
otsu("rice.png")
print("Lokalna w oknach bez interpolacji")
adaptive("rice.png",64)
print("Lokalna w oknach z interpolacją")
adaptive_interpolation("rice.png",64)


Najlepiej wykonane binaryzacje dla tego zdjęcia są wykonane przy użyciu algorytmu otsu i lokalnej z interpolacją. Jednak w ogólnym przypadku otsu źle się zachowuje przy nierównomiernie oświetlonych zdjęciach. Sauvol i lokalna na podstawie średniej tworzą obramowanie wokół zdjęć oraz dają trochę gorsze wyniki niż lokalna z interpolacją. Lokalna z interpolacją jest lepsza niż lokalna bez interpolacji.