<img style="float:right" src="images/logo_va.png" /> 

# Visione Artificiale
## Esercitazione: Template matching

### Sommario
* Ricerca di un oggetto all'interno di un'immagine mediante template matching
* Ricerca di template multipli ottenuti modificando il fattore si scala di un template base
* Template matching su feature diverse dai semplici pixel dell'immagine
* Ricerca di più istanze dello stesso oggetto mediante template matching

Iniziamo con l'importazione dei moduli che ci serviranno: `NumPy`, `OpenCV`, `va`. Importiamo anche la funzione `interact` di Jupyter.

In [1]:
import numpy as np
import cv2 as cv
import va
from ipywidgets import interact

In questa esercitazione utilizzeremo alcune tecniche apprese a lezione, per risolvere un problema che per anni ha impegnato persone di ogni età in tutto il mondo: **la ricerca di Waldo**.
Consiste nel cercare il noto personaggio all'interno di un'immagine come quella che viene mostrata eseguendo la cella seguente.

In [None]:
img1 = cv.imread('tm/WhereIsWaldo1.jpg')
va.show(img1)

<img style="float:left" src="images/ar.png" />**Esercizio 1** - Utilizzando il template matching, cercare all'interno dell'immagine `img1`, creata dalla cella precedente, il template contenuto nell'immagine "tm/t1.png". La misura del grado di somiglianza può essere effettuata con il metodo che si preferisce, purchè sia efficace. Eventualmente eseguire dei test con più metodi. Completare la funzione `FindWaldo1` che deve restituire una tupla `(x, y, w, h)`, in cui `x, y` sono le coordinate del vertice superiore sinistro della posizione dell'oggetto dell'immagine e `w, h` sono le sue dimensioni (pari a quelle del template).  
Suggerimenti: la funzione `cv.minMaxLoc` può essere utile per cercare la posizione in cui la corrispondenza con il template è massima.

In [None]:
def genericWaldo(template, img, return_r = False):
    # trovare la posizione del template nell'immagine
    R = cv.matchTemplate(img, template, cv.TM_SQDIFF_NORMED)
    r_min, r_max, pos_min, pos_max = cv.minMaxLoc(R)
    x, y = pos_min
    h,w = 0,0
    if len(template.shape) == 3:
        h,w = template[...,0].shape
    else:
        h,w = template.shape
    
    if return_r:
        return x, y, w, h, r_min, r_max
    else:
        return x, y, w, h


In [None]:
# --- Svolgimento Esercizio 1: Inizio --- #

def FindWaldo1():
    template = cv.imread("tm/t1.png")
    return genericWaldo(template, img1)

# --- Svolgimento Esercizio 1: Fine --- #

<img style="float:left" src="images/in.png" />L'esecuzione della cella seguente consente di visualizzare il risultato ottenuto e di verificare che sia corretto.

In [None]:
rect = FindWaldo1()
va.test_tm_1(rect)
va.show(cv.rectangle(img1.copy(), rect[:2], (rect[0]+rect[2], rect[1]+rect[3]), (255,0,0), 3))

In [None]:
rect, img1.shape

L'obiettivo del prossimo esercizio è lo stesso del precedente: trovare la posizione di Waldo, utilizzando "tm/t2.png" come template nell'immagine "tm/WhereIsWaldo2.jpg". La differenza è che in questo caso il template fornito è un po' più piccolo rispetto all'immagine. Sarà necessario creare più copie del template modificandone il fattore di scala e cercare ciascuna di queste all'interno dell'immagine, per poi selezionare il template e la posizione che hanno ottenuto la massima somiglianza.

In [None]:
img2 = cv.imread('tm/WhereIsWaldo2.jpg')
va.show(img2)

In [None]:
template2 = cv.imread('tm/t2.png')
va.show(template2, enlarge_small_images=False)

<img style="float:left" src="images/ar.png" />**Esercizio 2** - Creare una lista di immagini `templates` a partire da `template2`, utilizzando i seguenti fattori di scala: 100%, 120%, 140% e 160%. Prestare particolare attenzione alla dimensione delle immagini: larghezza e altezza dovranno essere arrotondate all'intero più vicino in base al corrispondente fattore di scala. Questo può essere ottenuto, ad esempio, sfruttando con gli appropriati parametri una certa funzione OpenCV. Eseguire poi la cella successiva per controllare che le dimensioni delle immagini nella lista siano quelle attese.

In [None]:
# --- Svolgimento Esercizio 2: Inizio --- #

#                      img        size                                                 method               
templates = [cv.resize(template2, tuple([round(j*i) for j in template2[...,1].T.shape]), interpolation=cv.INTER_LINEAR) for i in [1,1.2,1.4,1.6]]

# --- Svolgimento Esercizio 2: Fine --- #

In [None]:
va.show(*templates, enlarge_small_images=False)
va.test_tm_2(templates)

<img style="float:left" src="images/ar.png" />**Esercizio 3** - Utilizzando il template matching, cercare, all'interno dell'immagine `img2`, ciascun template nella lista `templates` e restituire la posizione di quello che ha la massima somiglianza. Si suggerisce di utilizzare un metodo normalizzato per misurare il grado di somiglianza, in modo da essere indipendenti dalle dimensioni del template. Completare la funzione `FindWaldo2`, che deve restituire una tupla `(x, y, w, h)`, in cui `x, y` sono le coordinate del vertice superiore sinistro della posizione dell'oggetto dell'immagine e `w, h` sono le sue dimensioni (pari a quelle del template, fra tutti quelli nella lista, che è risultato più simile).

In [None]:
# --- Svolgimento Esercizio 3: Inizio --- #

def FindWaldo2():
    x, y, w, h = (0,0,0,0)
    r = None
    for t in templates:
        c_x, c_y, c_w, c_h, rmin, rmax = genericWaldo(t, img2, return_r=True)
        if r is None or rmin < r:
            r = rmin
            x, y, w, h = c_x, c_y, c_w, c_h
    # trovare la posizione del template più simile fra tutti quelli nella lista    
    
    return x, y, w, h

# --- Svolgimento Esercizio 3: Fine --- #

<img style="float:left" src="images/in.png" />L'esecuzione della cella seguente consente di visualizzare il risultato ottenuto e di verificare che sia corretto, sia come posizione che come dimensione del rettangolo.

In [None]:
rect = FindWaldo2()
va.test_tm_3(rect)
va.show(cv.rectangle(img2.copy(), rect[:2], (rect[0]+rect[2], rect[1]+rect[3]), (255,0,0), 3))

Nella terza e ultima ricerca di Waldo che affrontiamo, per un problema tecnico il template da cercare è costituito solo dai bordi: sarà necessario trovare un modo per risolvere anche questo problema. Le due celle seguenti, una volta eseguite, caricano l'immagine (`img3`) e il template da cercare (`template3`).

In [None]:
img3 = cv.imread('tm/WhereIsWaldo3.jpg')
va.show(img3)

In [None]:
template3 = cv.imread('tm/t3.png', cv.IMREAD_GRAYSCALE)
va.show(template3, enlarge_small_images=False)

<img style="float:left" src="images/ar.png" />**Esercizio 4** - Utilizzando il template matching, cercare, all'interno dell'immagine `img3`, il template `template3`. In primo luogo verificare che un semplice procedimento come quello del primo esercizio in questo caso non può portare al risultato desiderato; cercare quindi un modo di trasformare il template o l'immagine per poter applicare con successo il template matching. Completare la funzione `FindWaldo3`, che deve restituire una tupla `(x, y, w, h)`, in cui `x, y` sono le coordinate del vertice superiore sinistro della posizione dell'oggetto dell'immagine e `w, h` sono le sue dimensioni (pari a quelle del template).

In [None]:
def getEdgyImg3(t1, t2, s):
    blurred = cv.GaussianBlur(cv.cvtColor(img3, cv.COLOR_BGR2GRAY), (s, s), 0)
    # Algoritmo di Canny con soglie t1 e t2
    edges = cv.Canny(blurred, t1, t2)
    img_e = img3.copy()
    img_e[edges!=0] = (0,255,255)
    return edges

@interact(t1=(0,255), t2=(0,255), s=(3,21,2))
def test(t1,t2,s):
    va.show(getEdgyImg3(t1,t2,s))

In [None]:
# --- Svolgimento Esercizio 4: Inizio --- #

def FindWaldo3():

    # trovare la posizione del template nell'immagine
    
    return genericWaldo(template3, getEdgyImg3(100,30,7))

# --- Svolgimento Esercizio 4: Fine --- #

<img style="float:left" src="images/in.png" />L'esecuzione della cella seguente consente di visualizzare il risultato ottenuto e di verificare che sia corretto.

In [None]:
rect = FindWaldo3()
va.test_tm_4(rect)
va.show(cv.rectangle(img3.copy(), rect[:2], (rect[0]+rect[2], rect[1]+rect[3]), (255,0,0), 3))

Negli esercizi precedenti, in ogni immagine si doveva cercare *un solo oggetto*: era quindi sufficiente cercare il massimo (o il minimo, a seconda del metodo utilizzato) del valore di somiglianza su tutti i pixel. Nell'ultima parte dell'esercitazione affronteremo il caso in cui *più copie dell'oggetto di interesse siano presenti* e vadano individuate all'interno dell'immagine.  
Si considerino l'immagine e il template che sono caricati e visualizzati eseguendo la cella seguente.

In [3]:
img, template = cv.imread('tm/many_coins.png'), cv.imread('tm/coin.png')
va.show(img, template, enlarge_small_images=False)

<img style="float:left" src="images/ar.png" />**Esercizio 5** - Utilizzando il template matching, cercare, all'interno dell'immagine `img`, tutte le posizioni in cui compare il template `template`. Completare il codice nella cella seguente che deve creare una lista di tuple `(x, y, w, h)` (`rettangoli`), in cui, per ogni oggetto individuato, `x, y` sono le coordinate del suo vertice superiore sinistro e `w, h` sono le sue dimensioni (pari a quelle del template). In queso esercizio non è richiesto di trovare un solo rettangolo per ogni oggetto: è possibile che lo stesso oggetto sia trovato più volte, in posizioni molto vicine fra loro. Questo problema sarà poi affrontato nell'ultimo esercizio.  
Suggerimenti: sarà necessario determinare una soglia da applicare al valore di somiglianza dei pixel, per poi restituire tutte le posizioni il cui valore di somiglianza supera tale soglia (nell'ipotesi di utilizzare un metodo in cui i valori più alti indicano maggior somiglianza). Una possibile strategia per scegliere una soglia ragionevole può essere individuare il valore massimo di somiglianza e impostare la soglia relativamente a tale valore (ad esempio come 70% del valore massimo).

In [34]:
# --- Svolgimento Esercizio 5: Inizio --- #

# trovare tutte le posizioni del template nell'immagine
R = cv.matchTemplate(img, template, cv.TM_CCOEFF_NORMED)
threshold = 0.7*np.max(R)
coords = np.argwhere(R>=threshold)
h, w = template[...,1].shape
rettangoli = [(c[1], c[0], w, h) for c in coords]

# --- Svolgimento Esercizio 5: Fine --- #

<img style="float:left" src="images/in.png" />L'esecuzione della cella seguente consente di visualizzare il risultato ottenuto e di verificare che tutti gli oggetti siano individuati da almeno uno dei rettangoli nella lista.

In [35]:
va.test_tm_5(rettangoli)
tmp = img.copy()
for (x, y, w, h) in rettangoli:
    cv.rectangle(tmp, (x, y), (x+w, y+h), (0,0,255), 1)
va.show(tmp)

0
Controllo monete: 1296/71


<img style="float:left" src="images/ar.png" />**Esercizio 6** - A partire dalla lista `rettangoli`, ottenere una nuova lista `rettangoli_ok` che contenga un solo rettangolo per ogni oggetto da individuare. In altre parole, in caso di più rettangoli sovrapposti, è richiesto di considerarne solo uno: quello che corrisponde al valore di somiglianza più alto con il template.  
Suggerimenti: fra le possibili strategie, una consiste nello sfruttare la funzione OpenCV `cv.dnn.NMSBoxes` che, anche se fa parte del modulo sulle reti neurali, può essere utile in questo caso. Se si decide di procedere in questo modo, oltre a studiare la documentazione di tale funzione, è necessario assicurarsi che: 1) la lista di rettangoli passata a `cv.dnn.NMSBoxes` contenga tuple i cui valori sono tutti di tipo `int` Python e non di un tipo NumPy; 2) la lista di valori di somiglianza (scores) che tale funzione richiede contenga valori di tipo `float` Python.

In [71]:
# --- Svolgimento Esercizio 6: Inizio --- #

# selezionare un solo rettangolo per ogni oggetto
val = [float(R[r[1], r[0]]) for r in rettangoli]
keep = cv.dnn.NMSBoxes([tuple([int(j) for j in i]) for i in rettangoli], val, threshold, 0.2)
print([i[0] for i in keep])
rettangoli_ok = [rettangoli[i[0]] for i in keep]

# --- Svolgimento Esercizio 6: Fine --- #

[344, 334, 174, 57, 355, 349, 52, 360, 340, 46, 559, 565, 554, 41, 702, 150, 974, 1095, 366, 745, 180, 371, 185, 169, 585, 1086, 740, 1091, 1231, 986, 1099, 1109, 969, 1235, 673, 549, 1223, 866, 1105, 581, 847, 1243, 662, 1239, 1113, 163, 843, 982, 1226, 1248, 569, 155, 1081, 669, 830, 752, 890, 851, 159, 1255, 577, 1252, 838, 748, 978, 665, 776, 854, 573, 991, 965]


<img style="float:left" src="images/in.png" />L'esecuzione della cella seguente consente di visualizzare il risultato ottenuto e di verificare che tutti gli oggetti siano individuati, ciascuno da un solo rettangolo.

In [72]:
va.test_tm_6(rettangoli_ok)
tmp = img.copy()
for (x, y, w, h) in rettangoli_ok:
    cv.rectangle(tmp, (x, y), (x+w, y+h), (0,0,255), 1)
va.show(tmp)

0
Controllo monete: 71/71
