# TD 3 - Représentation d'images et validation croisée
Dans ce TD, nous nous interesons à:
- la représentation d'images par leur [histogramme couleur](https://en.wikipedia.org/wiki/Color_histogram);
- la validation croisée de hyperparamètres.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

En indexation de donnée par le contenu, une problématique courante est la recherche par similarité de documents. Le but de trier l'ensemble des documents d'une base de donnée du plus similaire au moins similaire par rapport à un document requête en utilisant uniquement des informations extraites des documents.

Dans ce TD, nous voulons faire de la recherche par similarité d'images. Comme pour le texte, nous ne pouvons pas utiliser directement l'image. Nous devons dans un premier temps extraire des paramètres (features) des images. Puis nous utilisons une métrique pour mesurer la similarité entre les images. Nous pouvons alors trier les images par rapport à leur similarité avec l'image requête.

## Holidays dataset
Pour nos expériences, nous utilisons la base d'image [Holidays dataset](http://lear.inrialpes.fr/~jegou/data.php). Cette base de 1491 images provenant de photos de vacances. Les autres ont pris en compte de tester la robustesse de diverses attaques: les rotations, les changements de points de vue et d'éclairage, le flou, etc. L'ensemble de données comprend une très grande variété de types de scène (effets naturels, artificiels, d'eau et de feu, etc.). L'ensemble de données  sont regroupé en 500 groupes d'images, chacun représentant une scène ou un objet distinct. La première image de chaque groupe est l'image de requête et l'objectif est de récupérer en premier les autres images du groupe.

<center><img src="./Holidays.jpg" width=600px></center>

Le code suivant permet de crée la liste des images de la base :

In [None]:
import glob
import os

images_dir = './Holidays_dataset'

image_file_names = sorted([os.path.split(f)[1] for f in glob.glob(os.path.join(images_dir, '*.jpg'))])

N = len(image_file_names)

Le groupe des images et leurs indices dans le groupe sont codés dans leurs noms. Par exemple l'image `100502.jpg` est la $3^\text{éme}$ image du $6^\text{éme}$ groupe :
- `1`**`005`**`02.jpg` $\Rightarrow 6^\text{éme}$ groupe
- `1005`**`02`**`.jpg` $\Rightarrow 3^\text{éme}$ image du groupe
L'image qui est utilisé comme requête dans chaque groupe est la $1^\text{ére}$ image du groupe (`1005`**`00`**`.jpg`).

Le code suivant permet de récupéré les groupes de chaque image et les images requêtes:

In [None]:
y = np.asarray([int(f[1:4]) for f in image_file_names]) # verite terrain: recupere pour chaque imag le num de son groupe (ex:005 au dessus) 
queries = np.asarray([f.endswith('00.jpg') for f in image_file_names]) # vecteur de booléens : VRAI aux indices des images servant de requetes (celles finissant par 000)

- `y` $\in \mathbb{N}^N$ est le vecteur de l'indice de groupe pour chaque image.
- `queries` $\in \{\text{False},\text{True}\}^N$ est le vecteur booléen qui indique si l'image est une requête ou non.

**À faire -** Écrivez le code pour ouvrir toutes les images de la base et stockées les dans la liste `images`.

**Aide -** Regardez l'aide des fonctions : [`scipy.misc.imread`](https://docs.scipy.org/doc/scipy-0.19.0/reference/generated/scipy.misc.imread.html), [`os.path.join`](https://docs.python.org/3/library/os.path.html#os.path.join) et [les listes en python](https://docs.python.org/3/tutorial/datastructures.html#more-on-lists)

In [None]:
from scipy.misc import imread

images = []


**À faire** - À l'aide de la fonction [`matplotlib.pyplot.imshow`](https://matplotlib.org/api/pyplot_api.html#matplotlib.pyplot.imshow), visualisez un image de la base.

**À faire** - Affichez les dimentions de l'image ([`numpy.ndarray.shape`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.ndarray.shape.html))

**Question** - À quoi corresponde ces trois dimensions ?

- la première dimension est ????
- la deuxième dimension est ????
- la troisième dimension est ????

## Histogramme couleur

Pour représenté les images, nous utilisons l'histogramme de la proportion des couleurs dans l'image. 

Le codage [RGB](https://en.wikipedia.org/wiki/RGB_color_model) (Red, Green, Blue) sur 24 bits (3 canaux de 8 bits) permet de coder : 16777216 couleurs differentes.

**Question -** Est il judicieux d'utiliser toutes les couleurs pour calculer l'histogramme couleur des images ?

????

### Réduction du nombre de couleur
Nous voulons alors réduire le nombre de couleur utilisé. Pour cela, il est judicieux de rechercher les $P$ couleurs les plus couramment utilisées dans nos images et ensuite de remplacer pour chaque pixel de chaque image la couleur du pixel par la couleur la plus proche parmi les $P$ couleurs les plus courantes. Cette méthode s'appelle la [quantification couleur](https://en.wikipedia.org/wiki/Color_quantization) et elle est basé sur l'utilisation d'algorithme de [clustering](https://en.wikipedia.org/wiki/Cluster_analysis).

Pour trouver les couleurs les plus couramment utilisées, nous devons extraire des images l'ensemble des pixels de toute les images et les rassembler dans une matrice.

**À faire -** Ecrivez le code pour extraire tous les pixels de toutes les images stockées dans la matrice `rgb_samples` de dimension $\text{nombre total de pixel}\times 3$

**Aide -** Regardez l'aide des fonctions : [`numpy.reshape`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.reshape.html) (lire attentivement la description du paramètre `newshape`) et [`numpy.vstack`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.vstack.html)

In [None]:
rgb_samples = ???

Nous obtenons un échantillon de plus de 72 millions de couleurs RGB, c'est beaucoup trop. Nous allons en choisir aléatoirement un petit nombre.

**À faire -** Ecrivez le code pour choisir aléatoirement 100000 exemples de couleurs RGB dans la matrice `rgb_samples` et stockez les à nouveau dans la matrice `rgb_samples`.

**Aide -** Regardez l'aide de la fonction : [`numpy.random.choice`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.random.choice.html) (lire attentivement la description du paramètre `replace`)

Pour déterminer les $P$ couleur les plus courantes, nous allons utiliser l'algorithme [K-Means](https://en.wikipedia.org/wiki/K-means_clustering).

**À faire -** Ecrivez le code pour effectuer un clustering de 64 clusters ($P=128$) avec algorithme K-Means sur notre échantillon de couleur RGB `rgb_samples`.

**Aide -** Regardez l'aide de la fonction : [`sklearn.cluster.KMeans`](http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html)

**Conseil -** Fixez le paramète `n_init` à 1.

In [None]:
from sklearn.cluster import KMeans

P = 128

kms = ???

La fonction suivant permet de réorganiser les couleurs  obtenue par le clustering dans l'ordre des teintes du codage couleur [HSV](https://fr.wikipedia.org/wiki/Teinte_Saturation_Valeur)

In [None]:
import colorsys
def reorganize_clusters(kms):
    h = np.zeros((kms.n_clusters, ))
    for i in range(kms.n_clusters):
        r,g,b = kms.cluster_centers_[i,:]/255.0
        h[i] = colorsys.rgb_to_hsv(r, g, b)[0]
    idx = np.argsort(h)
    kms.cluster_centers_ = kms.cluster_centers_[idx,:]

Nous l'appliquons sur notre objet KMeans

In [None]:
reorganize_clusters(kms)

**À faire -** Ecrivez le code pour afficher l'image de la palette couleur obtenu avec le clustering (par exemple, une image de 8 ligne par ? pixels).

**Aide -** Regardez l'aide des fonctions : [`numpy.reshape`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.reshape.html) et [`matplotlib.pyplot.imshow`](https://matplotlib.org/api/pyplot_api.html#matplotlib.pyplot.imshow)

**Conseil -** Ajoutez le paramètre : `interpolation='nearest'` pour la fonction `imshow`.

In [None]:
palette = kms.cluster_centers_.astype(np.uint8)


Nous voulons voir l'effet de la quantification couleur sur une image.

**À faire -** Choisissez aléatoirement une des images et écrivez le code pour obtenir sa version quantifiée. Puis affichez les deux images pour les comparer.

**Aide -** Regardez l'aide des fonctions : [`sklearn.cluster.KMeans.predict`](http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html#sklearn.cluster.KMeans.predict), [`numpy.reshape`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.reshape.html) et [`matplotlib.pyplot.imshow`](https://matplotlib.org/api/pyplot_api.html#matplotlib.pyplot.imshow)

In [None]:
I = ????

Nous maintenant calculer, histogramme couleur d'un image avec les couleurs obtenu apres quantification.

**À faire -** Completez la fonction `def compute_hist(kmeans, I)` qui retourne un vecteur contenant la proportion de chaque couleur dans dans l'image `I`.

**Aide -** Regardez l'aide des fonctions : [`sklearn.cluster.KMeans.predict`](http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html#sklearn.cluster.KMeans.predict), [`numpy.reshape`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.reshape.html) et [`numpy.unique`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.unique.html) (lire attentivement la description du paramètre `return_counts`).

In [None]:
def compute_hist(kmeans, I):
    x = np.zeros((kmeans.n_clusters, ))
    idx = kmeans.predict(I.astype(np.float64).reshape((-1,3)))
    idv, v = np.unique(idx, return_counts=True)
    x[idv] = v
    return x/np.sum(x).astype(np.float32)

Nous voulons visualier l'histogramme couleur une image

**À faire -** Choisissez aléatoirement une des images, utilisez la fonction `def compute_hist(kmeans, I)` pour calculer son histogramme couleur et affichez le.

**Aide -** Regardez l'aide de la fonction : [`matplotlib.pyplot.bar`](https://matplotlib.org/api/pyplot_api.html#matplotlib.pyplot.bar)


**Conseil -** Ajoutez les paramètres : `width = 1`, `color=palette/255.0` et `edgecolor = 'none'` pour la fonction `bar`.

In [None]:
I = ????

**À faire -** Ecrivez le code pour calculer l'histogramme couleur de toutes les images et stockez les dans la matrice `X`.

In [None]:
X = np.zeros((len(images), kms.n_clusters), dtype=np.float32)

## Recherche par similarité

**À faire -** Ecrivez le code pour calculer la distance Euclidienne entre les images requetes et toutes les images, stockez les resultats dans la matrice `dist`.

**Aide -** Regardez l'aide de la fonction : [`sklearn.metrics.pairwise.euclidean_distances`](http://scikit-learn.org/stable/modules/generated/sklearn.metrics.pairwise.euclidean_distances.html)

In [None]:
from sklearn.metrics.pairwise import euclidean_distances

dist = ????

**À faire -** Ecrivez le code pour afficher la matrice des distance `dist`.

**Aide -** Regardez l'aide de la fonction : [`matplotlib.pyplot.matshow`](https://matplotlib.org/api/pyplot_api.html#matplotlib.pyplot.matshow)

**À faire -** Choisissez une requete et ecrivez le code pour afficher les 15 images les plus similaire a la requete.

**Aide -** Regardez l'aide des fonctions : [`numpy.argsort`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.argsort.html), [`matplotlib.pyplot.imshow`](https://matplotlib.org/api/pyplot_api.html#matplotlib.pyplot.imshow) et [`matplotlib.pyplot.subplot`](https://matplotlib.org/api/pyplot_api.html#matplotlib.pyplot.subplot)

Pour evaluer la performance de notre representation et de la metrique que nous utilisons pour calculer la distance entre les images, nous utilisons la mesure de performence officiler de la base Holidays le mAP ([mean Average Precision](https://en.wikipedia.org/wiki/Information_retrieval#Mean_average_precision)).

La fonction `def score_map(dist, y, queries)` retourne le mAP pour la matrice de distance `dist`.

In [None]:
def score_ap_from_ranks_1 (ranks, nres):
    ap=0.0
    recall_step=1.0/nres
    for ntp,rank in enumerate(ranks):
        if rank==0: 
            precision_0=1.0
        else:
            precision_0=ntp/float(rank)
        precision_1=(ntp+1)/float(rank+1)
        ap+=(precision_1+precision_0)*recall_step/2.0
    return ap

def score_map(dist, y, queries):
    queries_label = -1*np.ones(queries.shape)
    queries_label[queries] = y[queries]
    
    idxsortdist = np.argsort(dist, axis=1)
    
    mAP = 0.0;

    for r in y[queries]:
        y_r = y[idxsortdist[r,:]]
        queries_label_r = queries_label[idxsortdist[r,:]]
        
        nres = np.sum(np.logical_and(y == r, queries_label != r))
        
        tp_ranks = np.sort(np.where(y_r[queries_label_r != r] == r)[0])
        
        ap = score_ap_from_ranks_1 (tp_ranks, nres)

        mAP += ap
    return mAP/ np.sum(queries) * 100.0

**À faire -** Ecrivez le code pour calculer la performence de notre representation avec la distance euclidienne.

Nous pouvons nous comparer aux performances de l'état de l'art sur le [site de la base Holidays](http://lear.inrialpes.fr/~jegou/holidays_state_of_art.html) (section : Global descriptors)

## Apprentisage de métrique et Validation croisée

Nous voyons que la performance de notre représentation avec la métrique Euclidienne n'est pas très bonne en comparaisons aux méthodes de l'états de l'art. Mais elle est tout de même bien meilleure que le hasard qui donne en moyenne un mAP de 0.337%.

Nous pouvons améliorer la performance de notre représentation par l'histogramme couleur des images en apprenant une métrique adaptée à notre problème de recherche par similarité.

### Distance de Mahalanobis

Pour ce TD, nous utiliserons la [distance de Mahalanobis](https://en.wikipedia.org/wiki/Mahalanobis_distance) qui a pour équation :
\begin{equation}
d_\mathbf{W}(\mathbf{x}, \mathbf{y})^2 = (\mathbf{x} - \mathbf{y})\mathbf{W}(\mathbf{x} - \mathbf{y})^\top
\end{equation} 
avec $\mathbf{x} \in \mathbb{R}^P$, $\mathbf{x} \in \mathbb{R}^P$ et $\mathbf{W} \in \mathcal{M}_{P \times P}$.

La distance de Mahalanobis est donc un métrique paramétrable par la matrice $\mathbf{W}$, nous allons donc chercher le meilleur $\mathbf{W}$ pour obtenir les meilleurs performances en recherche par similarité avec notre représentation par histogramme couleur.

Nous voyons que la distance de Mahalanobis est une extention de la [distance Euclidienne](https://en.wikipedia.org/wiki/Euclidean_distance), en effet si nous posons $\mathbf{W}$ égale à la matrice identité, nous obtenons :

\begin{equation}
d_\mathbf{I}(\mathbf{x}, \mathbf{y})^2 = (\mathbf{x} - \mathbf{y})\mathbf{I}(\mathbf{x} - \mathbf{y})^\top = (\mathbf{x} - \mathbf{y})(\mathbf{x} - \mathbf{y})^\top = \|\mathbf{x} - \mathbf{y}\|_2^2
\end{equation}

Une contrainte difficile à prendre en compte quand on veut apprendre une métrique avec la distance de Mahalanobis est la contrainte de semi-positivité de la matrice $\mathbf{W} \succcurlyeq 0$. Cette contrainte permet de garantir que la distance de Mahalanobis est toujours supérieur ou égale à zéro : $d_\mathbf{W}(\mathbf{x}, \mathbf{y})^2 \geqslant 0$. Pour éviter ce probleme nous faisons le changement de variable suivant : $\mathbf{W} = \mathbf{U}^\top\mathbf{U}$ avec $\mathbf{U} \in \mathcal{M}_{p \times P}$ une matrice et $0 < p \leqslant P$. Nous obtenons alors la distance suivante :

\begin{equation}
d_{\mathbf{U}^\top\mathbf{U}}(\mathbf{x}, \mathbf{y})^2 = (\mathbf{x} - \mathbf{y})\mathbf{U}^\top\mathbf{U}(\mathbf{x} - \mathbf{y})^\top
\end{equation}

De plus, il est possible de réécrire cette distance pour utiliser directement le distance Euclidienne :
\begin{eqnarray}
d_{\mathbf{U}^\top\mathbf{U}}(\mathbf{x}, \mathbf{y})^2 & = &(\mathbf{x} - \mathbf{y})\mathbf{U}^\top\mathbf{U}(\mathbf{x} - \mathbf{y})^\top\\
& = & (\mathbf{x}\mathbf{U}^\top - \mathbf{y}\mathbf{U}^\top)(\mathbf{x}\mathbf{U}^\top - \mathbf{y}\mathbf{U}^\top)^\top\\
& = & d(\mathbf{x}\mathbf{U}^\top, \mathbf{y}\mathbf{U}^\top)^2
\end{eqnarray}


### Apprentisage de métrique

Pour apprendre la métrique la plus adaptée à notre problème de recherche par similarité nous allons chercher à apprendre une métrique qui respecte l'ensemble des contraintes suivant :
\begin{equation}
\left\{ d_{\mathbf{U}^\top\mathbf{U}}(\mathbf{x}_{i1}, \mathbf{x}_{i2})^2 < d_{\mathbf{U}^\top\mathbf{U}}(\mathbf{x}_{j1}, \mathbf{x}_{j2})^2 \right\}_{(\mathbf{x}_{i1}, \mathbf{x}_{i2})\in \mathcal{S}, (\mathbf{x}_{j1}, \mathbf{x}_{j2})\in \mathcal{D}}
\end{equation}
avec $\mathcal{S}$ l'ensemble des couples d'images similaires  et $\mathcal{D}$ l'ensemble des couples d'images dissimilaires.

En clair nous voulons que la distance entre deux images similaire soit toujours plus petite que la distance entre deux images dissimilaire.

Pour apprendre notre métrique, nous allons utiliser l'ensemble des images qui ne sont pas des requêtes, le code suivant permet de créer l'ensemble d'entrainement  :

In [None]:
#rs: indice des images chaque groupe, et counts = le nombre de photos dans chaque groupe (sans la requete)
rs, counts = np.unique(y[~queries], return_counts=True)
# on elimine les indices des groupes ne contenant qu'une seule image
mask = np.any(np.equal(y[:,np.newaxis], rs[counts > 1][np.newaxis,:]),axis=1)

y_train = y[mask] # indice
X_train = X[mask, :] # nombre de couleurs

Nous devons maintenant crée l'ensemble des couples d'images similaire $\mathcal{S}$ et l'ensemble des couples d'images dissimilaire $\mathcal{D}$ que nous utiliserons pour apprendre notre métrique.

Le code suivant permet de créer les ensembles $\mathcal{S}$ et $\mathcal{D}$.

In [None]:
G = np.equal(y_train[:, np.newaxis], y_train[np.newaxis, :])
S = np.vstack(np.where(np.logical_and(G, np.tri(y_train.shape[0], k=-1, dtype=bool))))
D = np.vstack(np.where(np.logical_and(np.logical_not(G), np.tri(y_train.shape[0], k=-1, dtype=bool))))

print("Nombre de couple d'images similaire :", S.shape[1])
print("Nombre de couple d'images dissimilaire :",D.shape[1])

Nous voyons que le nombre de couple d'image dissimilaire est beaucoup plus grand que le nombre de couple d'image similaire, cela est normal mais pour des raisons de temps de calcul nous allons réduire le nombre de couple d'image dissimilaire.

Le code suivant échantillons aléatoirement 8000 couple d'images dissimilaire parmi les 455641 d'origine.

In [None]:
D = D[:, np.random.choice(D.shape[1], 8000, replace=False)]

Pour apprendre notre métrique nous voulons trouver le parametre $\mathbf{U}$ qui minimise la fonction objective suivante :
\begin{equation}
f(\mathbf{U}) = \sum_{(\mathbf{x}_{i1}, \mathbf{x}_{i2})\in \mathcal{S}}\sum_{(\mathbf{x}_{j1}, \mathbf{x}_{j2})\in \mathcal{D}} \max(0, d_{\mathbf{U}^\top\mathbf{U}}(\mathbf{x}_{i1}, \mathbf{x}_{i2}) - d_{\mathbf{U}^\top\mathbf{U}}(\mathbf{x}_{j1}, \mathbf{x}_{j2}) + 1) + \lambda \|\mathbf{U}\|_F^2
\end{equation} 
avec $\mathbf{U} \in \mathcal{M}_{p \times P}$ le parametre à apprendre, $\|\cdot\|_F^2$ la [norme de Frobenius](https://fr.wikipedia.org/wiki/Norme_matricielle#Norme_de_Frobenius), $\mathcal{S}$ l'ensemble des couples d'images similaires, $\mathcal{D}$ l'ensemble des couples d'images dissimilaires et $\lambda$ un hyperparamètre.

La partie $+ \lambda \|\mathbf{U}\|_F^2$ de la fonction objective est une partie de régularisation qui permet d'éviter les problèmes de surapprentissage.

Notre fonction objetctive a donc deux hyperparamètres :
- $\lambda$ : pour la régularisation
- $p$, le nombre de ligne de la matrice $\mathbf{U}$

La classe suivante permet de calculer la fonction objective et son gradient. A la construction de la classe, nous lui donnons l'ensemble des représentations d'entrainements `X_train`, les couples d'image similaires `S`, les couples d'images dissimilaire `D` et la dimensions de la matrice `U`.

In [None]:
class metric_learning:
    def __init__(self, X, S, D, U_shape):
        self.X = X
        self.S = S
        self.D = D
        self.U_shape = U_shape
        
        self.dXs = self.X[self.S[0,:],:] - self.X[self.S[1,:],:]
        self.dXd = self.X[self.D[0,:],:] - self.X[self.D[1,:],:]

    def compute_objective_func(self, U, lambda_coef = 1000):
        U = np.reshape(U,self.U_shape)
        dYs = np.dot(self.dXs, U.T)
        dYd = np.dot(self.dXd, U.T)

        dp = np.sum(np.power(dYs,2),axis=1)
        dn = np.sum(np.power(dYd,2),axis=1)
        
        dp_max = np.max(dp)
        dn_min = np.min(dn)
        
        mask_dp = dp - dn_min + 1 > 0
        mask_dn = dp_max - dn + 1 > 0
        
        f = np.sum(np.maximum(0, dp[mask_dp, np.newaxis] - dn[np.newaxis, mask_dn] + 1))
        f = f + lambda_coef * np.linalg.norm(U,'fro')**2
        return f
    
    def compute_gradient_func(self, U, lambda_coef = 1000):
        
        U = np.reshape(U,self.U_shape)
        
        dYs = np.dot(self.dXs, U.T)
        dYd = np.dot(self.dXd, U.T)

        dp = np.sum(np.power(dYs,2),axis=1)
        dn = np.sum(np.power(dYd,2),axis=1)
        
        dp_max = np.max(dp)
        dn_min = np.min(dn)
        
        mask_dp = dp - dn_min + 1 > 0
        mask_dn = dp_max - dn + 1 > 0
        
        
        h = dp[mask_dp, np.newaxis] - dn[np.newaxis, mask_dn] >= -1
         
        Gp = np.dot(np.multiply(dYs[mask_dp,:].T, np.sum(h,axis=1)),self.dXs[mask_dp,:])
        Gn = np.dot(np.multiply(dYd[mask_dn,:].T, np.sum(h,axis=0)),self.dXd[mask_dn,:])
        G = (Gp - Gn)
        G = G + lambda_coef * U
        G = 2*G.flatten()
        return G

**À faire -** Utilisez la fonction d'optimisation [`scipy.optimize.fmin_cg`](https://docs.scipy.org/doc/scipy-0.19.0/reference/generated/scipy.optimize.fmin_cg.html) pour trouvé la valeur optimale de $\mathbf{U}$. Nous fixons dans un premier temps les  hyperparamètres à $p=8$ et $\lambda = 100$

**Aide -** Regardez l'aide des fonctions : [`scipy.optimize.fmin_cg`](https://docs.scipy.org/doc/scipy-0.19.0/reference/generated/scipy.optimize.fmin_cg.html) (lire attentivement la description du paramètre args) et [`sklearn.decomposition.PCA`](http://scikit-learn.org/stable/modules/generated/sklearn.decomposition.PCA.html).


**Conseil -** Utilisez les vecteurs de la PCA `PCA.components_` sur les données `X_train` comme point de départ `U0` et ajoutez le paramètre : `gtol=10` pour la fonction `fmin_cg`.

In [None]:
from sklearn.decomposition import PCA
from scipy.optimize import fmin_cg

p = 8
lambda_coef = 100


**À faire -** Ecrivez le code pour calculer la performance (mAP) en recherche pas similarité avec la metrique de Mahalanobis obtenu.

### Validation croisée

Nous avons appris une métrique adaptée à notre problème de recherche par similarité mais nous avons choisi arbitrairement les valeurs des hyperparamètres. Nous voyons que la performance obtenue est moins bonne que celle obtenu avec la distance Euclidienne. Il nous faut donc chercher les meilleures valeurs pour les hyperparamètres.

Pour cela, nous allons tester plusieurs valeurs pour $p$ et $\lambda$ et choisir les valeurs qui donne la meilleure performance sur notre ensemble de validation (Pour TD, nous considérerons l'ensemble des requêtes de test comme notre ensemble de validation, ce qui n'est pas correcte dans la pratique).

**À faire -** Ecrivez un code pour tester toute les combinaisons possibles pour les hyperparamètres avec $p \in \{8, 16, 32\}$ et $\lambda \in \{10,10^{1.25},10^{1.5},10^{1.75},10^{2},10^{2.25},10^{2.5},10^{2.75},10^{3},10^{3.25},10^{3.5}\}$ et qui choisit la meilleur.

**Conseil -** Ajoutez le paramètre : `disp=0` pour la fonction `fmin_cg`.


In [None]:
ps = (8, 16, 32)
lambda_coefs = (10**1, 10**1.25, 10**1.5, 10**1.75, 10**2, 10**2.25, 10**2.5, 10**2.75, 10**3, 10**3.25, 10**3.5)

best_mAP = 0.0