# Trabajo práctico 5 - Template Matching

**Alumnos:**

- Carol lugones Ignacio (100073)
- Torresetti Lisandro (99846)

## Objetivo

A partir del patrón de la cara de Messi (el cual debe ser seleccionado de entre las imágenes) encontrarlo en cada una de las imágenes en las que Messi aparece. Se pide un algoritmo automático que frente a la lectura sucesiva de estas imágenes (y si quieren, pueden probar con imágenes que encuentren ustedes) devuelva la posición de la cara de Messi dentro de la imagen y el nivel de confianza con el que fue hallada (deben definir también el nivel de confianza propuesto).

In [None]:
import cv2 as cv
import numpy as np
import matplotlib.pyplot as plt
from glob import glob
%matplotlib inline

In [None]:
def plotter(image, title = '', imgSize = (18,9), grayScale = False, step = 25): #Funcion auxiliar para realizar los graficos
    plt.figure(figsize=imgSize)
    plt.title(title, fontsize = 16, fontweight = "bold")
    plt.imshow(image) if not grayScale else plt.imshow(image, cmap='gray', vmin=0, vmax=255)
    plt.yticks(np.arange(0, len(image), step))
    plt.xticks(np.arange(0, len(image[0]), step))
    plt.show()  

In [None]:
def gaussian_pyramid(img, num_levels):
    lower = img.copy()
    gaussian_pyr = [lower]
    for i in range(num_levels):
        lower = cv.pyrDown(lower)
        gaussian_pyr.append(np.float32(lower))
    return gaussian_pyr

def laplacian_pyramid(gaussian_pyr):
    laplacian_top = gaussian_pyr[-1]
    num_levels = len(gaussian_pyr) - 1
    
    laplacian_pyr = [laplacian_top]
    for i in range(num_levels,0,-1):
        size = (gaussian_pyr[i - 1].shape[1], gaussian_pyr[i - 1].shape[0])
        gaussian_expanded = cv.pyrUp(gaussian_pyr[i], dstsize=size)
        laplacian = np.subtract(gaussian_pyr[i-1], gaussian_expanded)
        laplacian_pyr.append(laplacian)
    return laplacian_pyr
def getLaplacian(img, desiredLevel):
    return laplacian_pyramid(gaussian_pyramid(img, desiredLevel))

def reconstruct(laplacian_pyr):
    laplacian_top = laplacian_pyr[0]
    laplacian_lst = [laplacian_top]
    num_levels = len(laplacian_pyr) - 1
    for i in range(num_levels):
        size = (laplacian_pyr[i + 1].shape[1], laplacian_pyr[i + 1].shape[0])
        laplacian_expanded = cv.pyrUp(laplacian_top, dstsize=size)
        laplacian_top = cv.add(laplacian_pyr[i+1], laplacian_expanded)
        laplacian_lst.append(laplacian_top)
    return laplacian_lst


Se noto que las imagenes tenian diferente escala y se hizo un analisis de como seria un analisis basico de las imagenes sin igualarles el tamaño. Se descubrio que no encontraba nunca al personaje buscado, entonces se obliga a que todas las imagenes tengan el mismo tamaño asi llevandolas al tamaño de donde sale el template.

In [None]:
level = 2
selected = -1
#Cargo el padron de imagenes a usar cuando se trata de encontrar a Messi
imgsGray = []
imgsRgb = []
#imgTemplate = cv.cvtColor(cv.imread("./Fotos/Template.jpg"), cv.COLOR_BGR2RGB)
pathOfTemplate = "./Fotos/Messi_6.jpg"
imgTemplate = gaussian_pyramid(cv.imread("./Fotos/Template.jpg", 0), level)[selected]
paths = glob("./Fotos/Messi_*")
#paths.remove(pathOfTemplate)
img = cv.imread(pathOfTemplate)
x,y = len(img[0]), len(img)
#imgsRgb.append(cv.cvtColor(img, cv.COLOR_BGR2RGB))
#imgsRgb.append(img)
#imgsGray.append(cv.cvtColor(img, cv.COLOR_BGR2GRAY))
for pathImg in paths:
    img = cv.imread(pathImg)
    img = cv.resize(img, (x, y))
    #imgsRgb.append(cv.cvtColor(img, cv.COLOR_BGR2RGB))
    imgsRgb.append(img)
    imgsGray.append(cv.cvtColor(img, cv.COLOR_BGR2GRAY))
    print(f"Nombre: {pathImg}, cantidad en y: {len(img)}, cantidad en x: {len(img[0])}")

In [None]:
def pyrUp(lowerPoint, originalImg, levelsDone = level):
    laplacian = getLaplacian(originalImg, levelsDone)
    actualCompression = laplacian[1] + cv.pyrUp(lowerPoint)
    for i in range(2, len(laplacian)):
        plotter(actualCompression)
        actualCompression = cv.pyrUp(actualCompression) + laplacian[i]
    return actualCompression
        

In [None]:
#Se corre el codigo de la practica para ver como lo muestra, saltear celda si no interesa el trabajo de verlo
#Si se quiere ver los graficos descomentar el plot del final, no recomendado porque es bastante feob
# Los 6 métodos posibles para comparación:
#Elegimos borrar de prepo ceccor porque viendo como devuelve los resultados, da cosas que estan muy fuera de foco
methods = ['cv.TM_CCOEFF', 'cv.TM_CCOEFF_NORMED', 
            'cv.TM_CCORR_NORMED', 'cv.TM_SQDIFF', 'cv.TM_SQDIFF_NORMED']
w, h = imgTemplate.shape[::-1]
for meth in methods:
    for img_rgb, img_gray in zip(imgsRgb, imgsGray):
        # Hago una copia de la imagen porque ciclo a ciclo le dibujo rectángulos
        img_salida = img_rgb.copy()
        img_gray = gaussian_pyramid(img_gray, level)[selected]
        other = gaussian_pyramid(img_salida, level)[selected]
        method = eval(meth)

        # Aplicamos la coincidencia de patrones
        #--------------------------------------
        res = cv.matchTemplate(img_gray,imgTemplate,method)

        # Encontramos los valores máximos y mínimos
        min_val, max_val, min_loc, max_loc = cv.minMaxLoc(res)

        # Si el método es TM_SQDIFF o TM_SQDIFF_NORMED, tomamos el mínimo
        if method in [cv.TM_SQDIFF, cv.TM_SQDIFF_NORMED]:
            top_left = min_loc
        else:
            top_left = max_loc
        # Marcamos el lugar donde lo haya encontrado
        #----------------------------------------
        bottom_right = ((top_left[0] + w), (top_left[1] + h))
        cv.rectangle(other,top_left, bottom_right, 255, 2)
        ##Reescalamos:
        # Graficamos el procesamiento y la salida
        #----------------------------------------
        plt.figure()
        for i in range(level):
            other = cv.pyrUp(other)
        # Resultado de coincidencia
        plt.subplot(121),plt.imshow(res,cmap = 'gray')
        plt.title('Matching Result'), plt.xticks([]), plt.yticks([])

        # Imagen original con recuadros
        plt.subplot(122),plt.imshow(img_salida)
        plt.title('Detected Point'), plt.xticks([]), plt.yticks([])

        plt.subplot(121),plt.imshow(other)
        plt.title('Matching Result'), plt.xticks([]), plt.yticks([])



        plt.suptitle(meth)
        plt.show()

# Reconocimiento de caras

In [None]:
#Vuelvo a cargar todas las imagenes
img_fnames = glob('./Fotos/*')
template = None
imgs = []

for name in img_fnames:
    img = cv.imread(name)
    img = cv.cvtColor(img, cv.COLOR_BGR2RGB)
    if 'Messi' in name:
        imgs.append(img)
    else:
        template = img
    
    print('Image name: {}, Width = {}, Height = {}'.format(name, img.shape[0], img.shape[1]))


In [None]:
#Pasamos todas las imagenes al mismo shape de la que se extrajo el template, o sea Messi_1 
for img in imgs:
    plotter(img)

In [None]:
cv.minMaxLoc(res)

In [None]:
w, h = template.shape[:-1]
# Los 6 métodos posibles para comparación:
methods = ['cv.TM_CCOEFF', 'cv.TM_CCOEFF_NORMED', 'cv.TM_CCORR',
            'cv.TM_CCORR_NORMED', 'cv.TM_SQDIFF', 'cv.TM_SQDIFF_NORMED']

img_rgb = imgs[5]
img_gray = cv.cvtColor(img_rgb, cv.COLOR_RGB2GRAY)
template = cv.cvtColor(template, cv.COLOR_RGB2GRAY)

for meth in methods:
    # Hago una copia de la imagen porque ciclo a ciclo le dibujo rectángulos
    img_salida = img_rgb.copy()
    
    method = eval(meth)
    
    # Aplicamos la coincidencia de patrones
    #--------------------------------------
    res = cv.matchTemplate(img_gray,template,method)
    
    # Encontramos los valores máximos y mínimos
    min_val, max_val, min_loc, max_loc = cv.minMaxLoc(res)
    
    # Si el método es TM_SQDIFF o TM_SQDIFF_NORMED, tomamos el mínimo
    if method in [cv.TM_SQDIFF, cv.TM_SQDIFF_NORMED]:
        top_left = min_loc
    else:
        top_left = max_loc
    
    # Marcamos el lugar donde lo haya encontrado
    #----------------------------------------
    bottom_right = (top_left[0] + w, top_left[1] + h)
    cv.rectangle(img_salida,top_left, bottom_right, 255, 2)
    
    # Graficamos el procesamiento y la salida
    #----------------------------------------
    plt.figure()
    
    # Resultado de coincidencia
    plt.subplot(121),plt.imshow(res,cmap = 'gray')
    plt.title('Matching Result'), plt.xticks([]), plt.yticks([])
    
    # Imagen original con recuadros
    plt.subplot(122),plt.imshow(img_salida)
    plt.title('Detected Point'), plt.xticks([]), plt.yticks([])
    
    plt.suptitle(meth)
    plt.show()

In [None]:
# Load the cascade
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
# Read the input image
imgTest = imgs[5].copy()
# Convert into grayscale
gray = cv2.cvtColor(imgTest, cv.COLOR_RGB2GRAY)
# Detect faces
faces = face_cascade.detectMultiScale(gray, 1.1, 4)




In [None]:
def _getProportion(img, desiredWidth, desiredHeight):
    w, h = 100, 100 #Hacer mas automatico, esto es como un POC
    return w /desiredWidth, h / desiredHeight

def _getRes(img, template):
    img_gray = cv.cvtColor(img, cv.COLOR_RGB2GRAY)
    methods = ['cv.TM_CCOEFF']
    finalRes = None
    minValue = 0
    maxValue = 0
    for method in methods:
        method = eval(method)
        res = cv.matchTemplate(img_gray,template,method)
        actualMin, actualMax, _, _ = cv.minMaxLoc(res)
        if abs(maxValue - minValue) < abs(actualMax - actualMin):
            maxValue, minValue = actualMax, actualMin
            finalRes = res
    return res
        

def getMaxRes(faces, img, template):
    minValue = 0
    maxValue = 0
    face = None
    x, y = len(img[0]), len(img)
    for actualX,actualY, w, h in faces:
        imgToResize = img.copy()
        newSize = _getProportion(template, w, h)
        imgToResize = cv.resize(img, (int(x * newSize[0]), int(y * newSize[1])))
        actualRes = _getRes(imgToResize, template)
        actualMin, actualMax, _, _ = cv.minMaxLoc(actualRes)
        if abs(maxValue - minValue) < abs(actualMax - actualMin):
            maxValue, minValue = actualMax, actualMin
            face = (actualX,actualY,w,h)
    return face

In [None]:
def removeUnnecessaryFaces(faces, grayImage):
    eyeCascade = cv.CascadeClassifier('haarcascade_eye.xml')
    okayFaces = []
    for face in faces:
        (x, y, w, h) = face
        roi_gray = grayImage[y:y+h, x:x+w]
        roi_color = img[y:y+h, x:x+w]
        eyes = eyeCascade.detectMultiScale(roi_gray, 1.1, 3)
        if len(eyes) >0:
            okayFaces.append(face)
    return okayFaces if okayFaces else faces
def faceRecognition(imgs, template):
    faceCascade = cv.CascadeClassifier('haarcascade_frontalface_default.xml')
    for img in imgs:
        img = img.copy()
        grayImage = cv.cvtColor(img, cv.COLOR_RGB2GRAY)
        faces = faceCascade.detectMultiScale(grayImage, 1.1, 3)
        print(len(faces))
        faces = removeUnnecessaryFaces(faces, grayImage)
        print(len(faces))
        x,y,w,h = getMaxRes(faces, img, template)
        print(x,y,w,h)
        cv.rectangle(img, (x, y), (x+w, y+h), (255, 0, 0), 2)
        plotter(img, step = 100)

In [None]:
faceRecognition(imgs, template)

In [None]:
def faceRecognition2(imgs):
    faceCascade = cv.CascadeClassifier('haarcascade_frontalface_default.xml')
    eyeCascade = cv.CascadeClassifier('haarcascade_eye.xml')
    
    for img in imgs:
        grayImage = cv.cvtColor(img, cv.COLOR_RGB2GRAY)
        faces = faceCascade.detectMultiScale(grayImage, 1.1, 3)
        print(f"faces: {len(faces)}")
        for (x, y, w, h) in faces:
            roi_gray = grayImage[y:y+h, x:x+w]
            roi_color = img[y:y+h, x:x+w]
            eyes = eyeCascade.detectMultiScale(roi_gray, 1.1, 3)
            for (ex,ey,ew,eh) in eyes:
                #if (ex > x and ex < x + w) and (ey > y and ey < y + h):
                cv.rectangle(img, (x, y), (x+w, y+h), (255, 0, 0), 2)
                cv.rectangle(roi_color,(ex,ey),(ex+ew,ey+eh),(0,255,0),2)
            #Aca va tu funcion, si pasa el if, que haga el rectangulo de la linea de abajo
            #cv.rectangle(img, (x, y), (x+w, y+h), (255, 0, 0), 2)
        plotter(img)

In [None]:
faceRecognition2(imgs)