# Projeto 2-1: Estabilização de imagens

## Leonardo Medeiros

Este projeto consiste em implementar um programa que captura as imagens da webcam e realiza a estabilização da imagem, esta estabilização e feita através da compensação das imagens relativo aos movimentos dos componentes, para tal foram utilizados dois métodos distintos, de pontos notaveis e de densidade, que terão sua efetividade analisada perante os resultados obtidos.

## Import

In [1]:
import cv2 as cv2
import cv2 as cv
import time
import numpy as np

## Pontos Notavies - Optical Flow 

Este método consiste em analisar os pontos notáveis da imagem para obter o fluxo ótico, foi utilizada a função goodFeaturesToTrack do opencv para obter esses pontos, para obter através de dois frames consecutivos o fluxo ótico foi utilizado a função calcOpticalFlowPyrLK do opencv que nos fornece esse parâmetro, porem como há diversos pontos na imagem com diferentes fluxos torna-se necessário realizar uma média para obter um valor de fluxo ótico mais próximo do real e acumular este valor de forma a gerar um vetor para que representa o fluxo ótico do primeiro frame ao último frame, finalmente para a estabilização da imagem está é deslocada em função do fluxo ótico acumulado na direção x e na direção y, que serve como parâmetro para ajustar os componentes do frame a posição inicial.

In [2]:
vec = [0, 0]

# Parametriza a funcao do OpenCV
dt_params = dict( maxCorners = 100,
                  qualityLevel = 0.3,
                  minDistance = 7,
                  blockSize = 7 )

# Parametriza o Lucas-Kanade
lk_params = dict( winSize  = (15,15),
                  maxLevel = 2,
                  criteria = (cv.TERM_CRITERIA_EPS | cv.TERM_CRITERIA_COUNT, 10, 0.03))


def get_Traking(frame_inicial, frame, dt_params, lk_params):    
    global vec
    
    # Gera cores de forma aleatória
    color = np.random.randint(0,255,(100,3))
    
    previous_gray = cv.cvtColor(frame_inicial, cv.COLOR_BGR2GRAY)
    p0 = cv.goodFeaturesToTrack(previous_gray, mask = None, **dt_params)#allter
    
    # Cria uma máscara para imprimir o rastro.
    mask = np.zeros_like(frame_inicial)
    
    actual_gray = cv.cvtColor(frame, cv.COLOR_BGR2GRAY)
    
    # Calcula o Fluxo Otico
    p1, st, err = cv.calcOpticalFlowPyrLK(previous_gray, actual_gray, p0, None, **lk_params)
    
    # Seleciona somente os melhores pontos
    good_new = p1[st==1]
    good_old = p0[st==1]
    
    delta_x = []
    delta_y = []
    
    # Desenha as trilhas para cada ponto em p1 e p0
    for i,(new, old) in enumerate(zip(good_new, good_old)):
        a,b = new.ravel()
        c,d = old.ravel()
        mask = cv.line(mask,(a,b),(c,d), [0,0,255], 2)
        frame = cv.circle(frame,(a,b),5,color[i].tolist(),-1)
        
        delta_x.append(a - c)
        delta_y.append(b - d)
        
    
    ##Calculo da media
    if (len(delta_x) > 0 and len(delta_y) > 0):  
        media_x = sum(delta_x)/len(delta_x)
        media_y = sum(delta_y)/len(delta_y)
    
        vec[0] += media_x
        vec[1] += media_y
    
    img = cv.add(frame, mask)
    
    ##deslocamento da imagem
    M = np.array([[1, 0, -vec[0]], [0, 1, -vec[1]]], dtype=np.float32)
    img = cv2.warpAffine(frame, M, (frame.shape[1], frame.shape[0]))  # Terceiro argumento é o tamanho da imagem resultante.

    
    return frame, img
            


Ao analisar o resultado obtido pelo método de pontos notáveis  tem-se que a estabilização da imagem é parcial e ocasionalmente falha, isso se deve pela razão de que os pontos da imagem podem se deslocar de forma inconsistente com o movimento, pois como este método considera pontos notáveis da imagem (como por exemplo bordas) devido a  luminosidade, os pontos do frame podem ser totalmente divergentes ao componente considerado no frame anterior.

## Dense Optical Flow

Para solucionar o problema dos pontos notáveis foi utilizado o dense optical flow, este método consiste em observar a todos os pontos da imagem, permitindo que a falha seja menor ao realizar um movimento, para isso foi utilizado a função calcOpticalFlowAarneback do opencv que ao receber dois frames consegue calcular a diferença da posição x e y dos pontos entre os frames. Para  diminuir interferências do fundo da imagem, assim como tornar o programa mais rápido diminuindo a quantidade de informação processadas, foi limitado apenas a área central da imagem para análise de fluxo, simulada visualmente por um retângulo, posteriormente calcula-se a média do fluxo ótico para obter um valor mais real e acumular este valor de forma a gerar um vetor que represente o fluxo optico do primeiro frame ao último frame, e por fim é aplicado o deslocamento da imagem com o vetor acumulado do fluxo optico.

Como resultado do deslocamento obtém-se bordas pretas nas imagens, que foram retiradas com cortes na imagem de forma a manter sua proporção, como a imagem cortada possui tamanho variável e menor que o frame original foi utilizado o resize para manter o tamanho original, obtendo um efeito de zoom.  


In [3]:
vec = [0, 0]

def get_DenciveTraking(frame_anterior, frame):
    global vec
    y = frame.shape[0] 
    x = frame.shape[1]
    
    #Calcula o centro da imagem 
    cy = int(y/2)
    cx = int(x/2)
    rec = [70, 90]
    
    previous = cv2.cvtColor(frame_inicial, cv.COLOR_BGR2GRAY)
    actual   = cv2.cvtColor(frame,cv2.COLOR_BGR2GRAY)
    
    # Calcula o Fluxo Otico No Centro da Imagem Lititado Por Um Retangulo
    flow = cv2.calcOpticalFlowFarneback(previous[cx - rec[0] + int(vec[0]) : cx + rec[0] + int(vec[0]), 
                                                 cy - rec[1] + int(vec[1]) : cy + rec[1] + int(vec[1])], 
                                          actual[cx - rec[0] + int(vec[0]) : cx + rec[0] + int(vec[0]),
                                                 cy - rec[1] + int(vec[1]) : cy + rec[1] + int(vec[1])],
                                                                            None, 0.5, 3, 15, 3, 5, 1.2, 0)
    #Calcula a Média
    vec[0] += np.mean(np.mean(flow[:, :, 0]))
    vec[1] += np.mean(np.mean(flow[:, :, 1]))
   
    #Deslocamento da Imagem
    M = np.array([[1, 0, -vec[0]], [0, 1, -vec[1]]], dtype=np.float32)
    img = cv2.warpAffine(frame, M, (x, y))
 
    #Scaling
    proporcao = x / y
    corte_x = 0
    corte_y = 0
    
    #Tamanha da nova imagem sem considerar a proporção
    new_y = y - np.abs(vec[1])
    new_x = x - np.abs(vec[0])
    
    #Corta a imagem considerando a proporção 
    if(np.abs(vec[0] / x) < np.abs(vec[1] / y)):
        var = "X_CT"
        corte_x = int( x - (proporcao * new_y) )
        corte_y = int(y - new_y)
        
    elif(np.abs(vec[0] / x) > np.abs(vec[1] / y)):
        var = "Y_CT"
        corte_x = int(x - new_x)    
        corte_y = int( y - (new_x / proporcao) )
     
    v_x = x - corte_x - 1
    v_y = y - corte_y - 1

    if(vec[0] > 0):
        img = img[:,:v_x,:]

    elif(vec[0] < 0):
        img = img[:, corte_x:, :]
    
    else:
        img = img[:, corte_x/2: (v_x + corte_x/2), :]
        
    if(vec[1] > 0):
        img = img[:v_y,:,:]

    elif(vec[1] < 0):
        img = img[corte_y:,:,:]

    else:
        img = img[corte_y/2:(v_y + corte_y/2) , : , :]
        
    #Print dos parametros de controle
    #print("Corte_X: {0}, Corte_y: {1}, x: {2}, y: {3}, var: {4}, Dx: {5}, Dy: {6}, prop: {7}".format(corte_x, corte_y, img.shape[1], img.shape[0], var, vec[0], vec[1], x/y))

    #Resize da imagem cortada para o tamanho original do frame
    img = cv.resize(img,(x, y), interpolation = cv.INTER_LINEAR)
    
    #Alerta do Limite do fluxo optico atraves da mudança de cor do retangulo 
    if(np.abs(vec[0]) > 80 or np.abs(vec[1]) > 80):
        color = (0, 0, 255)
    
    else:
        color = (255, 0, 0)
    
    #Criação do retangulo na imagem de visualização
    cv2.rectangle(img, (cx - rec[0] + int(vec[0]), cy - rec[1] + int(vec[1])), 
                   (cx + rec[0] + int(vec[0]), cy + rec[1] + int(vec[1])), color, 2)

    
    return frame, img

## Captura da Imagem

In [4]:
captura = cv2.VideoCapture(0)

# Para não deixar encavalar os frames
captura.set(cv2.CAP_PROP_BUFFERSIZE, 1)

#Condição inicial
ret, frame_inicial = captura.read()

#Vetor optical flow
#vec = [0, 0]

while(1):
    ret, frame = captura.read()
        
    #frame_inicial, img = get_Traking(frame_inicial, frame, dt_params, lk_params) #Optical Flow
    frame_inicial, img = get_DenciveTraking(frame_inicial, frame) #Densive Optical Flow
    
    cv2.imshow("Video", img)

    # Pressione ESC para sair do loop
    k = cv2.waitKey(30) & 0xff
    if k == 27:
        break

captura.release()
cv2.destroyAllWindows()