# Otklanjanje distorzije

Aplikacija ucitava JPG sliku, korisnik, klikom misa, bira 4 piksela koji se slikaju u pravougaonik i aplikacija prikazuje sliku sa otklonjenom projektivnom distorzijom.

In [1]:
import cv2
import numpy as np
from numpy import linalg as LA

In [2]:
def homogenizacija(tacka):
    return [tacka[0], tacka[1], 1]

In [3]:
def dehomogenizacija(tacka):
    return [tacka[0]/tacka[2], tacka[1]/tacka[2]]

In [4]:
def matricaKorespodencije(o, s):
    M = np.array([[0, 0, 0, -s[2]*o[0], -s[2]*o[1], -s[2]*o[2], s[1]*o[0], s[1]*o[1], s[1]*o[2]],
                 [s[2]*o[0], s[2]*o[1], s[2]*o[2], 0, 0, 0, -s[0]*o[0], -s[0]*o[1], -s[0]*o[2]]])
    return M

In [5]:
def dltAlgoritam(n, originali, slike):
    
    M1 = matricaKorespodencije(originali[0], slike[0])
    
    for i in range(1,n):
        M2 = matricaKorespodencije(originali[i], slike[i])
        M1 = np.vstack((M1, M2))
            
    U, D, V_transponovano = LA.svd(M1, full_matrices=True)
    
    P = V_transponovano[-1]
    P = P.reshape(3,3)
    return P

In [6]:
def normalizacija(n,tacke):
    afine = []

    tx = 0
    ty = 0
    for i in range(n):
        afine.append(dehomogenizacija(tacke[i]))
        tx = tx + afine[i][0]
        ty = ty + afine[i][1]
    tx = tx/n
    ty = ty/n

    G = np.array([[1,0,-tx], [0,1,-ty], [0,0,1]])

    for i in range(n):
        afine[i] = G.dot(homogenizacija(afine[i]))
   
    dist = 0
    for i in range(n):
        dist = dist + np.sqrt(np.square(afine[i][0]) + np.square(afine[i][1]))

    dist = dist/n

    S = np.array([[np.sqrt(2)/dist,0, 0], [0,np.sqrt(2)/dist,0], [0,0,1]])

    for i in range(n):
        afine[i] = S.dot(homogenizacija(afine[i]))

    T = S.dot(G)
  
    return T, afine

In [7]:
def normDltAlgoritam(n, originali, slike):
    originali_t, originali_n = normalizacija(n, originali)

    slike_t, slike_n = normalizacija(n, slike)

    MP = dltAlgoritam(n, originali_n, slike_n)

    M = MP.dot(originali_t)
    M = LA.inv(slike_t).dot(M)

    return np.round(M, decimals=5)

In [8]:
def pravougaonik(originali):
    slike = []
    originali.sort()
    
    w = (originali[1][1] - originali[0][1]+originali[2][1] - originali[3][1])/2.0  
    h = (originali[2][0] - originali[1][0]+originali[3][0] - originali[0][0])/2.0
    
    slike.append((originali[0][0], originali[0][1], originali[0][2]))
    slike.append((originali[0][0], originali[0][1] + w, originali[0][2]))
    slike.append((originali[0][0] + h, originali[0][1] + w, originali[0][2]))     
    slike.append((originali[0][0] + h, originali[0][1], originali[0][2])) 

    return slike

In [9]:
def click_event(event, x, y, flags, params):
    global i
    if event == cv2.EVENT_LBUTTONDOWN:
        tacke.append((x,y))
        font = cv2.FONT_HERSHEY_DUPLEX
        print("Tacka {} : {}, {}".format(i, x, y))
        i = i + 1
        cv2.putText(img, '(' + str(x) + ',' + str(y) + ')', (x,y), font, 0.9, (50, 50, 100), 2)
        cv2.imshow('Originalna slika', img)

In [10]:
i = 1
tacke = []

img = cv2.imread("zgrada.jpg", 1)
img = cv2.resize(img,(800,600))
cv2.imshow('Originalna slika', img)
cv2.setMouseCallback('Originalna slika', click_event)

while True:
    if cv2.waitKey(1) & len(tacke) == 4:
        break

originali = []
for i in range(4):
    originali.append(homogenizacija(tacke[i]))    


slike = pravougaonik(originali)

P = normDltAlgoritam(4, originali, slike)
P = np.round(P,decimals=5)

img = cv2.imread("zgrada.jpg", 1)
img = cv2.resize(img,(800,600))

P = np.float64(P)
dst = cv2.warpPerspective(img,P,(800,600))

cv2.imshow('Nova slika',dst)
cv2.waitKey(0)

Tacka 1 : 521, 62
Tacka 2 : 518, 31
Tacka 3 : 161, 118
Tacka 4 : 164, 93


27