# Machine Learning avancé

# Examen pratique du 07/12/22

Cet examen pratique se compose de trois exercices indépendants

## Exercice 1 : Deux algorithmes de réduction de dimension

**Question 1**

a) Charger dans $\texttt{sklearn}$ le "wine" dataset.

b) Quelle est la dimension canonique du nuage de points associé ?

c) Représenter dans le plan la projection de ce dataset sur les deux premières coordonnées; puis sur les deux dernières.

In [None]:
import matplotlib.pyplot as plt
import numpy as np




**Question 2**

a) Appliquer aux données l'analyse en composantes principales afin d'obtenir une représentation en dimension $p=2$

b) Quel est le rôle du paramètre svd\_solver ? Dans quel cas, convient-il de lui attribuer la valeur 'randomized' ?

c) Représenter le nuage de points projeté dans les deux directions privilégiées.

d) Afficher les vecteurs correspondants à ces deux directions principales identifiées par la méthode. Expliquer

**Question 3**

a) Appliquer aux données l'algorithme MDS afin d'obtenir une représentation en dimension $p=2$

b) Représenter les données transformées dans le plan. Que remarquez-vous ?

c) Appliquer aux données l'algorithme Isomap afin d'obtenir une représentation en dimension $p=1$

d) Représenter adéquatement le nuage de points associé dans un espace dont on précisera la dimension.

e) Que conclure des représentations précédentes ? (en terme de réductibilité de dimension)

## Exercice 2 : Réseaux de neurones récurrents pour la prédiction

L'objectif de cet exercice est de proposer un modèle simple de RNN pour un problème de prédiction de séries temporelles multi-pas de temps.

Plus précisément, il s'agira *in fine* de construire un modèle qui à chaque temps $t$ puisse prédire
$
(x_{t+1}, x_{t+2}, x_{t+3},x_{t+4}) \ \mbox{a partir de } (x_s)_{0 \leq s \leq t}.
$


Afin d'entrainer et évaluer ce modèle, on commence par générer un **dataset synthétique** selon l'équation ci-dessous.

$$
\forall t \in \mathbb{N}, \ x_t= 0.5t + 0.2  \sin \left(100 f_1 (t-\varphi_1) \right) + 0.5 * \sin \left( 400 f_2 (t - \varphi_2) \right) + 0.1 c $$
avec

$$ f_1,f_2, \varphi_1, \varphi_2 \sim \mathcal{U} (\left[0,1 \right]) \ \mbox{et} \ c \sim \mathcal{U} ([-1,1 ]).
$$


**Question 1**

a) Générer un ensemble de 5000 trajectoires indépendantes $(x_t)_{0 \leq t \leq 203}$.

Attention : ces trajectoires contiennent les valeurs à prédire pour le "dernier pas de temps" $t= 199$

b) Représenter graphiquement un échantillon de cinq trajectoires indépendantes.






**Question 2**

a) Proposer un modèle de prédiction le plus simple possible (pas de réseau de neurones à ce stade) pour le problème



> Prédire $y=(x_{200}, x_{201}, x_{202}, x_{203})$ sachant $(x_t)_{0 \leq t \leq 199}$



b) Evaluer l'erreur absolue moyenne associée à ce modèle de prédiction pour les données générées à la question 1.


**Question 3:**

a) Proposer un RNN incluant deux couches récurrentes simples, chacune composée de 20 neurones,  pour le même problème que précédemment :

> Prédire $y=(x_{200}, x_{201}, x_{202}, x_{203})$ sachant $(x_t)_{0 \leq t \leq 199}$

b) Constituer des échantillons d'entrainement et de validation à partir des trajectoires générées à la question 1 selon les proportions (0.8, 0.2)

c) Représenter l'évolution de l'erreur quadratique moyenne pour les lots d'entrainement et de validation aucours des 20 premières époques

**Question 4:**

a) Proposer un RNN incluant deux couches récurrentes simples, chacune composée de 20 neurones, pour le problème  :

> Prédire $y_t=(x_{t+1}, x_{t+2}, x_{t+3}, x_{t+4})$ sachant $(x_s)_{0 \leq s \leq t}$ pour tout $0 \leq t \leq 199$

- Quelle différence avec le problème précédent ?

b) Constituer des échantillons d'entrainement et de validation à partir des trajectoires générées à la question 1 selon les proportions (0.8, 0.2).

Attention : à des fins d'entrainement, une sortie (correspondant à la prédiction) doit être associée à chaque pas de temps.

c) Représenter l'évolution de l'erreur quadratique moyenne pour les lots d'entrainement et de validation aucours des 20 premières époques

## Exercice 3 : Réduction de dimension et classification

L'objectif de cet exercice est de discuter dans le cadre d'un problème simple la perte de précision résultant de l'application d'une technique de réduction de dimension préalablement à la résolution d'un problème de classification.

**Question 1:**

Le code suivant permet de charger le dataset cifar10.

a) Afficher les dimensions des tenseurs train\_ images  et test\_images

b) A quoi correspondent les premières et dernières coordonnées de ces tenseurs ?

c) Convertir ces images **normalisées** au format grayscale. Quel impact sur la dimension des tenseurs concernés ?

**A des fins de test, dans la suite de l'exercice, on n'incluera dans le lot d'entrainement uniquement 10000 images et 2000 dans le lot de test.**


In [None]:
import time
import matplotlib.pyplot as plt
import tensorflow as tf
from tf import datasets


## Chargement du dataset

(X_train, y_train), (X_test, y_test) = datasets.cifar10.load_data()


....



**Question 2:**

Afin d'établir un élément de référence, on commence par résoudre le problème de classification en ayant recours à un problème "micro"

a) Proposer un réseau convolutif simple adapté au problème de classification des images de cifar10 (grayscale)

b) Quelle est la dimension de la dernière "représentation" des données au sein du réseau ?

c) Déterminer la fonction de perte appropriée pour ce type de problème.

d) En vous aidant de $\texttt{time}$ mesurer le temps nécessaire à l'entrainement d'un tel modèle pour un niveau de précision donnée.

In [None]:
## Construction du modèle "macro"



In [None]:
## Entrainement du modèle "macro"
loss_fn =

**Question 3**

On souhaite à présent comparer les résultats précédents avec les résultats obtenus via une approche différente. On applique dans un premier temps aux données d'entrainement un algorithme de réduction de dimension dans $\texttt{sklearn}$.

a) Transformer le tenseur X\_train afin de pouvoir lui appliquer une méthode de type $\texttt{fit}$ dans $\texttt{sklearn.decomposition}$ ou $\texttt{sklearn.manifold}$

b) Appliquer aux données ainsi transformées un algorithme de plongement spectral afin d'obtenir un nouveau jeu de données dans un espace de dimension $p$. (la valeur de $p$ est à discuter). Mesurer le temps nécessaire à l'application de la méthode pour la valeur de $p$ retenue.

c) Concevoir un réseau de neurones à propagation pour le problème de classification dont les inputs sont les plongements des images grayscale dans $\mathbb{R}^p$ obtenus à la question précédente. Mesurer le temps nécessaire à l'entrainement du réseau.

d) Estimer la performance de ce modèle dans le cadre du problème de classification.

In [None]:
## Première transformation

In [None]:
## Seconde transformation


In [None]:
## Représentation graphique

In [None]:
## Modèle "réduit"

In [None]:
## Entrainement du modèle "réduit"

