# Rastreamento de um objeto utilizando o método SIFT

In [1]:
import numpy as np
import cv2
from matplotlib import pyplot as plt
from time import time

class RegionSelector:
    """Classe para capturar o desenho de um retângulo na tela. Utilizada para 
    capturar a posição inicial de um objeto."""
    
    def __init__(self, img):

        self.img = img
        self.img2draw = img
        self.drawing = False
        self.initial_x = -1
        self.initial_y = -1
        self.end_selection = False

        cv2.namedWindow('image')
        cv2.setMouseCallback('image', self.draw_rectangle)

        while not self.end_selection:
            cv2.imshow('image', self.img2draw)
            if cv2.waitKey(1) & 0xFF == 27:
                break
        cv2.destroyAllWindows()

    def draw_rectangle(self, event, x, y, flags, param):

        if event == cv2.EVENT_LBUTTONDOWN:
            self.drawing = True
            self.initial_x = x
            self.initial_y = y

        elif event == cv2.EVENT_MOUSEMOVE:
            if self.drawing == True:
                ix = self.initial_x
                iy = self.initial_y
                self.img2draw = self.img.copy()
                cv2.rectangle(self.img2draw,(ix,iy),(x,y),(0,255,0),2)

        elif event == cv2.EVENT_LBUTTONUP:
            self.drawing = False
            ix = self.initial_x
            iy = self.initial_y
            self.img2draw = self.img.copy()
            cv2.rectangle(self.img2draw,(ix,iy),(x,y),(0,255,0),2)

            upper_left_x = ix if ix<x else x
            upper_left_y = iy if iy < y else y
            w = np.abs(ix - x)
            h = np.abs(iy - y)
            self.track_window = (upper_left_x, upper_left_y, w, h)
            self.end_selection = True

def get_matched_image(img_scene, img_obj, kp_obj, des_object, sift):
    """Identifica a posição de um objeto em uma outra imagem.

    Args:
        img_scene: Imagem global na qual o objeto será buscado
        img_obj: Imagem do objeto a ser buscado
        kp_obj: Pontos salientes do objeto previamente calculados
        des_object: Descritores dos pontos salientes do objeto
        sift: Instância do detector SIFT

    Returns:
        Imagem contendo o bounding box de `img_obj` na imagem `img_scene`
    """

    # Detecta os pontos salientes e realiza o casamento
    kp_scene, des_scene = sift.detectAndCompute(img_scene, None)
    bf = cv2.BFMatcher(crossCheck=True)
    matches = bf.knnMatch(des_object, des_scene, k=1)

    # Mantém apenas os pontos que possuem uma correspondência na outra imagem
    good = []
    for m in matches:
        if len(m)!=0:
            good.append(m[0])

    if len(good)<=10:
        img_matches_ransac = cv2.drawMatches(img_obj, kp_obj, img_scene, kp_scene, good, None)
    else:
        obj_pts = np.zeros((len(good), 2), dtype=np.float32)
        scene_pts = np.zeros((len(good), 2), dtype=np.float32)
        for i, m in enumerate(good):
            obj_pts[i] = kp_obj[m.queryIdx].pt
            scene_pts[i] = kp_scene[m.trainIdx].pt

        # Mapeia os pontos do objeto na imagem global
        T, mask = cv2.findHomography(obj_pts, scene_pts, cv2.RANSAC, ransacReprojThreshold=3.0) 
        h, w = img_obj.shape
        obj_bounds = np.float32(((0, 0), (0, h-1), (w-1, h-1), (w-1, 0))).reshape(-1,1,2)
        obj_bounds_in_scene = cv2.perspectiveTransform(obj_bounds, T)

        img_scene_obj = cv2.polylines(img_scene.copy(), [np.int32(obj_bounds_in_scene)], True, 255, 3, cv2.LINE_AA)
        img_matches_ransac = img_scene_obj

    return img_matches_ransac

In [2]:
cap = cv2.VideoCapture(1)

# Captura a imagem atual da câmera quando o usuário pressiona a tecla 'q'
# A imagem capturada será usada para selecionar o objeto a ser rastreado
while(True):
    ret, frame = cap.read()
    cv2.imshow('frame', frame)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Seleção do objeto pelo usuário
rs = RegionSelector(frame)        
upper_left_x, upper_left_y, w, h = rs.track_window

img_obj = frame[upper_left_y:upper_left_y+h, upper_left_x:upper_left_x+w]
img_obj_g = cv2.cvtColor(img_obj, cv2.COLOR_BGR2GRAY)

# Pontos salientes do objeto, calculados apenas uma vez
sift = cv2.SIFT_create(nfeatures=0, nOctaveLayers=3, contrastThreshold=0.02, 
                        edgeThreshold=10, sigma=1.6)
kp_obj, des_obj = sift.detectAndCompute(img_obj_g, None)

while(True):
    # Captura imagem atual da câmera
    ret, frame = cap.read()
    frame_g = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    # Redimensiona imagem para melhor performance
    frame_g_res = cv2.resize(frame_g, (640, 360))
    img_matches_ransac = get_matched_image(
        frame_g_res, 
        img_obj_g,
        kp_obj, 
        des_obj, 
        sift
        )  

    # Mostra o resultado
    cv2.imshow('frame', img_matches_ransac)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

cap.release()
cv2.destroyAllWindows()