L’algorithme SURF est utilisé pour détecter et décrire les caractéristiques d’une image. Les caractéristiques sont des points d’intérêt dans l’image qui peuvent être utilisés pour la reconnaissance d’objets, la correspondance d’images et d’autres tâches de vision par ordinateur. L’algorithme SURF détecte les points d’intérêt en utilisant une approximation rapide du Laplacien de Gaussien pour trouver les régions de l’image qui ont des changements rapides d’intensité. Ensuite, il calcule une orientation pour chaque point d’intérêt en utilisant les réponses des ondelettes dans les directions horizontale et verticale. Enfin, il crée une description des caractéristiques pour chaque point d’intérêt en utilisant les réponses des ondelettes dans un voisinage autour du point. Cette description peut être utilisée pour trouver des correspondances entre les points d’intérêt dans différentes images.

Le Laplacien de Gaussien (LoG) est un opérateur de détection de contours dans le traitement d’images. Il calcule la seconde dérivée de l’image pour trouver les régions où l’intensité change rapidement, ce qui indique la présence d’un contour. Le LoG est calculé en convoluant l’image avec un noyau LoG, qui est la différence de deux gaussiennes (DoG) à des échelles différentes. Le LoG est souvent utilisé pour trouver les points d’intérêt dans une image en trouvant les maxima locaux dans l’espace d’échelle, qui est créé en appliquant le LoG à l’image à différentes échelles.

L’image ci-dessous montre une démonstration d’une approximation du Laplacien de Gaussien. Un grand avantage de cette approximation est que la convolution avec filtre de boîte peut être facilement calculée à l’aide d’images intégrales. Et cela peut être fait en parallèle pour différentes échelles. Les SURF s’appuient également sur le déterminant de la matrice hessoise pour l’échelle et l’emplacement.

<img src="img/surf_boxfilter.jpg" alt="" />

Pour l’assignation d’orientation, SURF utilise des réponses d’ondelettes dans le sens horizontal et vertical pour un voisinage de taille 6s. Des poids gaussiens adéquats lui sont également appliqués. Ensuite, ils sont tracés dans un espace comme indiqué dans l’image ci-dessous. L’orientation dominante est estimée en calculant la somme de toutes les réponses dans une fenêtre d’orientation glissante d’angle de 60 degrés. Ce qui est intéressant, c’est que la réponse en ondelettes peut être trouvée en utilisant des images intégrales très facilement à n’importe quelle échelle. Pour de nombreuses applications, l’invariance de rotation n’est pas nécessaire, donc pas besoin de trouver cette orientation, ce qui accélère le processus. SURF fournit une telle fonctionnalité appelée Upright-SURF ou U-SURF. Il améliore la vitesse et est robuste jusqu’à ±15∘. OpenCV prend en charge les deux, en fonction du drapeau, à la verticale. Si elle est égale à 0, l’orientation est calculée. Si elle est égale à 1, l’orientation n’est pas calculée et elle est plus rapide.

<img src="img/surf_orientation.jpg" alt="" />

Pour la description des fonctionnalités, SURF utilise les réponses en ondelettes dans le sens horizontal et vertical (encore une fois, l’utilisation d’images intégrales facilite les choses). Un voisinage de taille 20sX20s est pris autour du point clé où s est la taille. Il est divisé en sous-régions 4x4. Pour chaque sous-région, des réponses d’ondelettes horizontales et verticales sont prises et un vecteur est formé comme ceci, v=(∑dx,∑dy,∑|dx|,∑|dy|). Ceci, lorsqu’il est représenté sous forme de vecteur, donne un descripteur de fonction SURF avec un total de 64 dimensions. Réduisez la dimension, augmentez la vitesse de calcul et de correspondance, mais offrez un meilleur caractère distinctif des caractéristiques.

Pour plus de distinction, le descripteur de fonctionnalité SURF a une version étendue en 128 dimensions. Les sommes de dx et |dx| sont calculés séparément pour dy<0 et dy≥0. De même, les sommes de dy et |dy| sont divisés selon le signe de dx , doublant ainsi le nombre de fonctionnalités. Cela n’ajoute pas beaucoup de complexité de calcul. OpenCV prend en charge les deux en définissant la valeur de flag étendue avec 0 et 1 pour 64-dim et 128-dim respectivement (la valeur par défaut est 128-dim)

Une autre amélioration importante est l’utilisation du signe du laplacien (trace de la matrice hessienne) pour le point d’intérêt sous-jacent. Il n’ajoute aucun coût de calcul puisqu’il est déjà calculé lors de la détection. Le signe du laplacien distingue les taches lumineuses sur fond sombre de la situation inverse. Dans la phase de correspondance, nous ne comparons les entités que si elles ont le même type de contraste (comme indiqué dans l’image ci-dessous). Ces informations minimales permettent une correspondance plus rapide, sans réduire les performances du descripteur.

<img src="img/surf_matching.jpg" alt="" />

En bref, SURF ajoute beaucoup de fonctionnalités pour améliorer la vitesse à chaque étape. L’analyse montre qu’il est 3 fois plus rapide que SIFT alors que les performances sont comparables à SIFT. SURF est bon pour gérer les images avec flou et rotation, mais pas pour gérer le changement de point de vue et le changement d’éclairage.

----

### SURF dans OpenCV

OpenCV fournit des fonctionnalités SURF tout comme SIFT. Vous lancez un objet SURF avec des conditions optionnelles telles que des descripteurs 64/128 dim, Upright/Normal SURF, etc. Tous les détails sont bien expliqués dans les documents. Ensuite, comme nous l’avons fait dans SIFT, nous pouvons utiliser SURF.detect(), SURF.compute() etc. pour trouver des points clés et des descripteurs.

Tout d’abord, nous verrons une démonstration simple sur la façon de trouver des points clés et des descripteurs SURF et de le dessiner. Tous les exemples sont affichés dans le terminal Python car il est identique à SIFT uniquement.

In [None]:
import cv2
import matplotlib.pyplot as plt
import numpy as np

>>> img = cv.imread('fly.png', cv.IMREAD_GRAYSCALE)
# Créer un objet SURF. Vous pouvez spécifier des paramètres ici ou ultérieurement.
# Ici, j’ai fixé le seuil hessois à 400

>>> surf = cv.xfeatures2d.SURF_create(400)

# Trouvez des points clés et des descripteurs directement
>>> kp, des = surf.detectAndCompute(img,None)
>>> len(kp)
 699

1199 points clés, c’est trop pour être montré dans une image. Nous le réduisons à environ 50 pour le dessiner sur une image. Tout en faisant correspondre, nous aurons peut-être besoin de toutes ces fonctionnalités, mais pas maintenant. Nous augmentons donc le seuil de Hesse.

In [None]:
# Vérifiez le seuil actuel de Hesse
>>> print( surf.getHessianThreshold() )
400.0
# Nous l’avons fixé à environ 50000. Rappelez-vous, c’est juste pour représenter en image.
# Dans les cas réels, il est préférable d’avoir une valeur 300-500
>>> surf.setHessianThreshold(50000)
# Encore une fois, calculez les points clés et vérifiez son nombre.
>>> kp, des = surf.detectAndCompute(img,None)
>>> print( len(kp) ) )
47

C’est moins de 50. Dessinons-le sur l’image.

In [None]:
>>> img2 = cv.drawKeypoints(img,kp,Aucun,(255,0,0),4)
>>> plt.imshow(img2),plt.show()

Voir le résultat ci-dessous. Vous pouvez voir que SURF ressemble plus à un détecteur de blob. Il détecte les taches blanches sur les ailes du papillon. Vous pouvez le tester avec d’autres images.

<img src="img/surf_kp1.jpg" alt="" />

Maintenant, je veux appliquer U-SURF, afin qu’il ne trouve pas l’orientation.


In [None]:
# Vérifiez l’indicateur vertical, s’il est Faux, définissez-le sur Vrai
>>> print( surf.getUpright() )
Faux
>>> surf.setUpright(True)
# Recalculez les points de fonctionnalité et dessinez-les
>>> kp = surf.detect(img,None)
>>> img2 = cv.drawKeypoints(img,kp,None,(255,0,0),4)
>>> plt.imshow(img2),plt.show()

Voir les résultats ci-dessous. Toutes les orientations sont affichées dans la même direction. C’est plus rapide que précédemment. Si vous travaillez sur des cas où l’orientation n’est pas un problème (comme l’assemblage panoramique), etc., c’est mieux.

<img src="img/surf_kp2.jpg" alt="" />

Enfin, nous vérifions la taille du descripteur et la changeons à 128 si elle n’est que de 64 dim.

In [None]:
# Trouver la taille du descripteur
>>> print( surf.descriptorSize() )
64
# Cela signifie drapeau, « étendu » est Faux.
>>> surf.getExtended()
 Faux
# Nous arrivons donc à True pour obtenir des descripteurs de 128 dim.
>>> surf.setExtended(True)
>>> kp, des = surf.detectAndCompute(img,None)
>>> print( surf.descriptorSize() )
128
>>> print( des.shape )
(47, 128)