# TP8 : Calculs de distance
Le but de ce TP est de vous remettre dans le bain de `python` et de préparer le TP suivant. Nous allons calculer des distances dans diverses circonstances.

## Exercices 1 : distance enclidenne entre deux points
On se place dans l'hyperespace ${\mathbb R}^n$ de dimension $n$. La _distance euclidienne_ entre deux points $x=(x_1,\dots ,x_n)$ et $y=(y_1,\dots, y_n)$ est donnée par

$$\sqrt{\sum\limits_{k=1}^n (y_k-x_k)^2}\:.$$

On suppose qu'un point est donné par la liste de ses coordonnées. Écrire une fonction `distance_euclidienne_points` qui prend en argument deux points de même dimension et renvoie leur distance.

In [None]:
import math
epsilon = 0.000001
assert(math.fabs(distance_euclidienne_points([0], [1]) - 1) < epsilon)
assert(math.fabs(distance_euclidienne_points([1,2,3], [1,2,3])) < epsilon)
assert(math.fabs(distance_euclidienne_points([1,2,3,4,5], [9,8,7,6,5]) - 10.954451150103322) < epsilon)

## Interlude : conversion entre un tableau de niveau de gris et une image
Dans la suite, on va travailler sur des images. Quand on aura une image, on commencera par la convertir en noir et blanc (ie en niveaux de gris), puis on produira une liste de listes contenant les niveaux de gris.

Pour cela, nous allons utiliser la fonction suivante :

In [None]:
from PIL import Image

def img2array(fic):
    """fic est le nom d'un fichier contenant une image
    la fonction renvoie une liste de listes d'entiers représentants des niveaux de gris"""
    im = Image.open(fic).convert('L')  ## chargement et passage en niveaux de gris
    tab = []
    i = 0
    for c in im.getdata():
        if i % im.width == 0: ## debut d'une nouvelle ligne dans l'image
            tab.append([])
        tab[-1].append(c)
        i += 1
    im.close()
    return tab

Pour récupérer un fichier image à partir d'une liste de listes de niveaux de gris, vous pouvez utiliser la fonction suivante:

In [None]:
from PIL import Image

def array2img(tab, fic):
    """fic est un nom de fichier avec un extension valide pour une image,
    tab est une liste de listes de niveaux de gris
    la fonction écrit l'image dans le fichier"""
    im = Image.new(size=(len(tab[0]), len(tab)), mode='L')
    for i in range(len(tab)):
        for j in range(len(tab[0])):
            im.putpixel((j, i), tab[i][j])
    im.save(fic)

## Exercice 2 : distance euclidienne entre deux images
Si on considère une image comme une matrice de points, on peut de la même manière calculer une distance euclidienne entre deux images de même dimension en regardant les distances pixels par pixels.

Écrire une fonction `distance_eclidienne_image` qui prend en arguments deux images (données sous la forme des noms des fichiers les contenant) supposées de même dimension et calcule la distance euclidienne entre ces deux images.

In [None]:
import math

epsilon = 0.000001
assert(math.fabs(distance_euclidienne_image('a.png', 'a.png')) < epsilon)
assert(math.fabs(distance_euclidienne_image('a.png', 'b.png') - 18031.22292025696) < epsilon)

## Exercice 3 : distance de Hausdorf entre deux images
Considérons les trois images suivantes:

(a) : ![](a.png)  (b) : ![](b.png)  (c) : ![](c.png)

La distance euclidienne n'est pas extrêmement satisfaisante car :

In [None]:
distance_euclidienne_image('a.png', 'b.png')

In [None]:
distance_euclidienne_image('b.png', 'c.png')

alors qu'on a envie de dire de façon intuitive que (a) est plus proche de (b) que (c).

On va considérer une autre distance appelée _distance de Hausdorf_.

L'idée de la distance de Hausdorf entre deux images `img1` et `img2` est de considérer pour chaque point de `img1` la distance (en distance euclidienne des coordonnées) minimale à un point identique de `img2`, et de prendre le maximum de cette valeur sur l'ensemble des points de `img2`. On considère que deux points sont identiques si leurs niveaux de gris respectifs ne diffèrent pas de plus de 10 au sens large.

1. Écrire une fonction `point_identique_le_plus_proche` qui prend en argument deux listes de listes d'entiers représentant deux images `img1` et `img2` en noir et blanc supposées de même dimension, et deux entiers représentant respectivemnt l'abscisse et l'ordonnée d'un point dans `img1` et renvoie les coordonnées du point identique de `img2` le plus proche. 

In [None]:
import math

apsilon = 0.000001
assert(math.fabs(distance_au_point_identique_le_plus_proche(img2array('b_petit.png'), img2array('c_petit.png'), 1, 1) - 19) < epsilon)

2. Écrire une fonction `distance_Hausdorf` qui prend en argument les noms de deux fichiers contenant des images supposées de même taille et renvoie leur distance de Hausdorf.

In [None]:
import math

epsilon = 0.000001
assert(math.fabs(distance_Hausdorf('a_petit.png', 'b_petit.png') - 10) < epsilon)

Pour les tests, la fonction `distance_Hausdorf` ayant une complexité assez mauvaise, nous les ferons sur les images suivantes:

(a) ![](a_petit.png) (b) : ![](b_petit.png) (c) : ![](c_petit.png)

Comparez :

In [None]:
distance_euclidienne_image('a_petit.png', 'b_petit.png')

In [None]:
distance_euclidienne_image('b_petit.png', 'c_petit.png')

In [None]:
distance_Hausdorf('a_petit.png', 'b_petit.png')

In [None]:
distance_Hausdorf('b_petit.png', 'c_petit.png')

Sur cet exemple, la distance de Hausdorf correcpond plus à l'idée qu'on se fait de la distance entre deux images. De même, si une a un peu bougé par rapport à l'original, ou si elle est un peu flou, on trouvera une distance pas trop grande.

## Exercice 4 : détection de contours [difficile]
La complexité de la fonction `distance_Hausdorf` est quadratique sur le nombre de pixels de l'image, donc en $O(n^4)$ si $n$ est le côté de l'image quand celle-ci est carrée. Ce qui la rend inutilisable en pratique. Pour diminuer le temps d'exécution, une approche possible est de ne pas faire un calcul pour chaque point de l'image, mais uniquement pour certains points remarquables, par exemple les points qui apparaissent sur les contours.

Le principe pour trouver le contour d'une image, est de repérer les points dont la couleur (ici le niveau de gris) varie particulièrement par rapport aux couleurs des voisins.

Pour cela, on regarde la variation par rapport au voisin du dessous et au voisin de droite (en fait par rapport au voisin obtenu en décrémentant l'abscisse et au voisin obtenu en décrémentant l'ordonnée, peu importe l'orientation de l'image).

1. Écrire une fonction `derivee` qui prend en argument une liste de listes de niveaux de gris `T`, et deux indices 'x' et 'y' qui ne sont pas sur les bords et calcule la dérivée en le point de coordonnées $(x, y)$, c'est-à-dire
$$\sqrt{\bigl(T(x,y)-T(x-1,y)\bigr)^2+\bigl(T(x,y)-T(x,y-1)\bigr)^2}$$

In [None]:
import math

epsilon = 0.000001
assert(math.fabs(derivee([[1,2,3], [9,8,7], [6,13,3]], 1, 1) - 6.082762530298219) < epsilon)

2. Écrivez une fonction `seuil` qui prend en argument une liste de listes de niveaux de gris `T` et un entier `s` et renvoie une liste `S` de coordonnées telle que $(x, y)$ appartient à cette liste si et seulement si la dérivée de `T` au point $(x, y)$ est définie et supérieure au seuil `s`.

3. Écrire une fonction `distance_au_point_identique_le_plus_proche_amelioree` qui est une variante de `distance_au_point_identique_le_plus_proche`: en plus des paramètres de `distance_au_point_identique_le_plus_proche`, elle prend en paramètre une liste de coordonnées et ne compare ce qui se passe au point $(x, y)$ qu'avec les points dont les coordonnées appartiennent à cette liste.

4. Écrire une fonction `distance_Hausdorf_amelioree` qui prend en argument les noms de deux fichiers contenant des images supposées de même taille et renvoie la variante de leur distance de Hausdorf qui comparent les points des contours des deux images à partir des listes obtenues par `seuil`.

In [None]:
import math

epsilon = 0.000001
assert(math.fabs(distance_Hausdorf_amelioree('a_petit.png', 'b_petit.png', 100) - 9.055385138137417) < epsilon)

On peut maintenant calculer les distances de Hausdorf améliorées sur les petites images:

In [None]:
distance_Hausdorf_amelioree('a_petit.png', 'b_petit.png', 100)

In [None]:
distance_Hausdorf_amelioree('b_petit.png', 'c_petit.png', 100)

Mais également sur les plus grandes:

In [None]:
distance_Hausdorf_amelioree('a.png', 'b.png', 100)

In [None]:
distance_Hausdorf_amelioree('b.png', 'c.png', 100)