# Stage TalENS - Challenge MNIST par caractéristiques moyennes

# I Introduction

On commence par importer les données dont nous aurons besoin.

In [None]:
from utilitaires_chargement_ import *

## I.1 Rappels Python

### Le type list

On définit une liste à l'aide de crochets (rajoutez des print après chaque définition)  : 

In [None]:
# liste vide :
liste_vide = []
# une liste peut contenir n'importe quel objet :
liste = [1, 5.4, True]

On accède à l'élément $i$ d'une liste en faisant 
ma_liste[i-1] : 

In [None]:
print(liste[0])

Pour ajouter des éléments à une liste, on peut utiliser la méthode `append` :

In [None]:
liste.append(8)

### Boucle for

On rappelle la syntaxe d'une boucle for en Python :

```
for element in sequence:
    instructions
```
    
Par exemple, pour calculer la somme des entiers de 1 à $n$ on écrit :
```
somme = 0
for i in range(n+1): # range(N) correspond à la séquence d'entiers 1, ..., N-1
    somme = somme + i
```

In [None]:
# Essais libres :


### Fonction

On rappelle également la syntaxe d'une fonction qui renvoie un certain résultat à partir de paramètres :
```
def ma_fonction(liste de paramètres):
    instructions
    return resultat
```

Ainsi, pour définir une fonction qui retourne la valeur des entiers de 1 à $n$ on écrit :
```
def somme(n):
    compteur = 0
    for i in range(n+1):
        compteur = compteur + i
    return compteur
```

Calculez la valeur des entiers de 1 à $n$ pour différents $n$ à l'aide de cette fonction et vérifiez qu'ils correspondent bien à la valeur $n(n+1)/2$. On rappelle qu'on affiche des données en Python avec la fonction `print`.

In [None]:
def somme(n):
    compteur = 0
    for i in range(n+1): # range(N) correspond à la séquence d'entiers 1, ..., N-1
        compteur = compteur + i
    return compteur

# n = ....
# Affichage de la valeur de la somme
print(somme(n))

## I.2 Image numérique

Une image en niveaux de gris se représente numériquement comme un tableau bidimensionnel de $H \times L$ pixels. La valeur de chaque pixel est un entier compris entre 0 et 255. Commençons par manipuler une image de taille $28 \times 28$ stockée dans la variable `x` que nous avons importée. Elle représente le chiffre 0 et fait partie des bases de données sur lesquelles nous travaillerons.

Nous avons créé une fonction `affichage`, vous pouvez directement l'appliquer à la variable `x` :

In [None]:
# Affichez la représentation graphique de la variable x :


<strong>Pour les curieux</strong> : pour créer la fonction `affichage` on a utilisé des fonctions (et en particulier `imshow`) de la bibliothèque `matplotlib.pyplot`, que l'on appelle dans ce notebook par le préfixe `plt.`. Les pixels dont la valeur est 0 sont affichés en noir, tandis que ceux dont la valeur est 255 sont affichés en blanc. Les pixels dont les valeurs sont intermédiaires sont affichés dans un gris d'autant plus foncé que leur valeur est proche de 0, et clair quand leur valeur est proche de 255. Le code de la fonction affichage est alors :

```
def affichage(image):
    plt.imshow(image, cmap='gray')
    plt.show()
    plt.close()
```

On pourrait aussi faire l'affichage directement : vous pouvez utiliser dans la cellule de code ci-dessous les lignes  suivantes : 

```
plt.imshow(x, cmap='gray')
plt.show()
plt.close()
```

Une idée pour faire apparaître des couleurs ? 

### Accéder à un pixel particulier

On accède à la valeur du pixel $(i,j)$ à la $i+1$-ème ligne et $j+1$-ème par la commande `x[i,j]`. Par exemple, pour accéder à la valeur du pixel central (14,14) on écrit simplement `x[14,14]`. On peut ensuite afficher cette valeur avec `print`.

In [None]:
# Vérifiez que pour notre image x, le pixel central est de valeur 0 et apparaît donc noir


### Avancé : accéder à une « tranche » de pixels 


On peut également extraire une partie des pixels de l'image grâce au slicing Python. Ainsi, pour extraire les pixels de `a` à `b-1` (inclus) le long du premier axe qui correspond à l'axe vertical (lignes) de l'image, et de `c` à `d-1` le long du second axe qui correspond à l'axe horizontal (colonnes) de l'image, on entre `x[a:b,c:d]`. On récupère ainsi un tableau de taille $(b-a) \times (d-c)$. Lorsque l'on veut récupérer tous les pixels d'un axe, par exemple le premier, on utilise seulement `:`au lieu de `a:b`. Ainsi `x[:,c:d]` extrait tous les pixels des colonnes `c` à `d-1` de l'image. Dans l'exemple suivant, on vous demande d'extraire les colonnes 11 à 23 de notre image, que l'on visualise ensuite.

In [None]:
# Visualisez les colonnes 11 à 23 de l'image x :


On peut directement afficher la valeur de tous les pixels d'une image avec la fonction `print` : toutefois afin que la sortie soit lisible, l'image doit être de petite taille (quelques dizaines de pixels). C'est par exemple le cas de notre image extraite `x[:,11:24]` dont on peut afficher les pixels, et visualiser la correspondance avec sa représentation en niveaux de gris.

In [None]:
# Affichez directement les pixels de l'image extraite avec print :


On peut afficher la taille d'une image à l'aide de l'attribut `shape`:

In [None]:
# Affichage de la taille de l'image :
print(x.shape)

In [None]:
# Affichez la taille de l'image extraite précédente :


# II Challenge MNIST-2 : classifier les chiffres 0 et 1

La base de données MNIST-2 contient des images de 0 et de 1 de taille $28 \times 28$ en niveaux de gris. Le but du challenge est de construire un algorithme qui classifie au mieux ces images et reconnaît le chiffre $y \in \{0,1\}$ figurant sur les images $x$ de cette base de données.  

La base de données se décline en deux ensembles d'images : 
* la base de données d'images d'entraînement, contenue au sein de ce notebook dans la variable `x_train_2` 
* la base de données d'images de test, contenue au sein de ce notebook dans la variable `x_test_2`. 

Les chiffres $y \in \{0,1\}$ des images d'entrainement sont connus et contenus au sein de ce notebook dans la variable `y_train_2`. Comme leur nom l'indique, les images d'entrainement servent à entrainer et optimiser notre algorithme, pour ensuite pouvoir estimer les chiffres des images de test qui ne nous sont pas connus. Ces estimations sont alors comparées aux vrais chiffres stockés dans une variable `y_test_2`sur la plateforme Challenge Data, et les erreurs quantifiées par une fonction de score.

Les variables `x_train_2` et `x_test_2` sont chacune des tableaux tri-dimensionnels de taille $N \times 28 \times 28$, où le nombre $N$ correspond au nombre d'images dans l'ensemble considéré, et varie donc selon que l'on travaille avec les images d'entraînement `x_train_2` ou de test `x_test_2`.

Ces tableaux sont donc indexés par trois indices $(k,i,j)$, où $k \in \{0,\ldots,N-1\}$ correspond au numéro de l'image et $(i,j) \in \{0,\ldots,27\}^2$ correspond à la position du pixel de l'image. 

Pour accéder à la valeur du pixel $(i,j)$ de la $k$-ème image, on entre ainsi simplement : `x[k,i,j]`, où `x` est `x_train_2` ou `x_test_2`.

Pour accéder à l'ensemble des pixels de la $k$-ème image, on entre `x[k]` ou de manière équivalente `x[k,:,:]`.

### Visualisation de quelques images

`x_train_2` et `x_test_2` sont donc des listes d'images. En reprenant la fonction que nous avions utilisée précédemment, affichez les trois premières images de `x_train_2`:

In [None]:
# Affichez la première image de `x_train_2` :

# Affichez la deuxième image de `x_train_2` :

# Affichez la troisième image de `x_train_2` :


Pour visualiser plus facilement les 10 premières, vous pouvez utiliser la fonction `affichage_dix` directement sur les listes d'images `x_train_2` ou `x_test_2`:

In [None]:
# Affichez les 10 premières images de x_train_2 ou x_test_2 :


Les variables de sortie `y_train_2` et `y_test_2` sont, elles, de taille $N$ (le $N$ correspondant à celui de `x_train_2`ou `x_test_2`)

`y_train_2[k]` (resp. `y_test_2[k]`) avec $k \in \{0,\ldots,N-1\}$ correspond ainsi au chiffre représenté par la $k$-ème image `x_train_2[k]` (resp. `x_test_2[k]`).

On dispose également en mémoire d'une variable d'indices `ID_test_2` identifiant de manière unique les images de test qu'il faudra intégrer au fichier .csv contenant les estimations des chiffres des images de test afin de pouvoir le soumettre sur la plateforme Challenge Data.

## II.1 Caractéristique discriminante d’une image 

Définissez une caractéristique discriminante d'une image (au choix) de `x_train_2` et calculez-la : 

In [None]:
# Calculez la caractéristique d'une image au choix


Mettez ce calcul sous la forme d'une fonction (et vérifier que lorsque vous l'appliquez à la même image, vous obtenez le même résultat !)

In [None]:
def car(image):
    pass

Appliquer cette fonction à toute la liste des images de `x_train_2` et stokez les résultats dans une liste (vous pouvez utiliser la méthode `append`)

In [None]:
# On commence par définir cette liste (vide au début)
car_x_train = []

# On la remplit à l'aide d'une boucle :
for x in x_train_2:
    pass

De la même façon créez la liste `car_x_test` à partir de `x_test_2` :

In [None]:
# Calculez la caractéristique de `x_test_2`
car_x_test = []


## II.2 Classification de chiffres 

Définissez un algorithme qui décide si une image va être considérée comme un $0$ ou un $1$. Mettez-le sous forme d'une fonction qui prend une image et renvoie l'entier $0$ ou l'entier $1$ : 

In [None]:
# Définissez un algorithme de classification

def mon_algo(image):
    pass

Appliquez cette fonction à `x_train_2` et à `x_test_2` et stockez les estimations respectivement dans des listes nommées `y_est_train` et `y_est_test`.

In [None]:
# A compléter
y_est_train = ...
y_est_test = ...

## II.3 Erreur d'entraînement

Programmez la fonction de score qui est égale au pourcentage d’erreur des prédictions de votre algorithme par rapport aux vrais chiffres et calculez le score de votre algorithme sur les images d'entraînement à partir de vos estimations `y_est_train`.

In [None]:
def score(y_estime, y_vrai):
    ...

                         
# Affichez votre score (application de la fonction précédente à y_est_train et y_train_2)


## II.4 Erreur de test


On sauve et télécharge à présent vos estimations `y_est_test` sur les images de test dans un fichier .csv à l'aide de la fonction `sauver_et_telecharger_mnist_2`. Soumettez ce fichier sur la plateforme Challenge Data afin d'obtenir votre erreur de test en cliquant sur **[le lien suivant](https://challengedata.ens.fr/participants/challenges/116/)**. 

In [None]:
# Sauvez et téléchargez vos estimations y_est_test, en entrant le nom du fichier que vous souhaitez
sauver_et_telecharger_mnist_2(y_est_test, 'votre_nom_de_fichier.csv')

## II.5 Comprendre les erreurs

Afin de comprendre l'origine des erreurs, visualisez les histogrammes de votre caractéristique à l'aide de la fonction `visualiser_histogrammes_mnist_2` en exécutant la cellule ci-dessous.

In [None]:
# Visualisation des histogrammes
visualiser_histogrammes_mnist_2(car_x_train)

Pouvez-vous déterminer l'origine de vos erreurs de classification à partir de ces histogrammes ? 

## II.6 Introduction au challenge MNIST-4 : classifier les chiffres 0, 1, 4, 8

Le challenge MNIST-4 consiste à reconnaître les chiffres $y \in \{0,1, 4, 8\}$ figurant sur les images $x$ de cette base de données. La structure de MNIST-4 est similaire à celle déjà détaillée pour MNIST-2, qui en est d'ailleurs un sous-ensemble. En particulier, les images sont de taille $28 \times 28$, et on nomme de manière similaire `x_train_4` et `x_test_4` les images des bases d'entraînement et de test, et `y_train_4` et `y_test_4` les chiffres associés.

Afin de bien identifier la structure de ces différentes catérogies d'images, visualisez des images de la base de données d'entraînement `x_train_4` à l'aide des fonctions `affichage` ou `affichage_dix` appliquées à `x_train_4` ou `x_test_4`.

In [None]:
# Visualisez des images de MNIST-4


Nous allons voir que ce challenge est plus difficile que le précédent, et que les caractéristiques que vous avez définies dans la section précédente ont des taux d'erreur plus élevés sur cette base de données. Nous commencer par calculer les caractéristiques précédemment définies sur cette nouvelle base de données.

In [None]:
# On commence par définir cette liste (vide au début)
car_x_train = []

# On la remplit à l'aide d'une boucle :
for x in x_train_4:
    pass

De la même façon créez la liste `car_x_test` à partir de `x_test_4` :

# Calculez la caractéristique de `x_test_4`
car_x_test = []

### Algorithme 
Définissez un algorithme qui décide si une image va être considérée comme un $0$, un $1$, un $4$ ou un $8$. Mettez-le sous forme d'une fonction qui prend une image et renvoie l'entier $0$, l'entier $1$, l'entier $4$ ou l'entier $8$ : 

In [None]:
# Définissez un algorithme de classification

def mon_algo(image):
    pass

Appliquez cette fonction à `x_train_4` et à `x_test_4` et stockez les estimations respectivement dans des listes nommées `y_est_train` et `y_est_test`.

In [None]:
# A compléter
y_est_train = ...
y_est_test = ...

### Erreur d'entraînement
Calculez l'erreur d'entraînement de votre algorithme à l'aide de la fonction de score que vous avez implémentée en II.3

In [None]:
# Calculez et affichez votre score


### Erreur de test 
On sauve et télécharge vos estimations `y_est_test` sur les images de test dans un fichier .csv à l'aide de la fonction `sauver_et_telecharger_mnist_4`. Soumettez ce fichier sur la plateforme Challenge Data afin d'obtenir votre erreur de test en cliquant sur **[le lien suivant](https://challengedata.ens.fr/participants/challenges/117/)**. 

In [None]:
# Sauvez et téléchargez vos estimations y_est_test, en entrant le nom du fichier que vous souhaitez
sauver_et_telecharger_mnist_4(y_est_test, 'votre_nom_de_fichier.csv')

Afin de comprendre l'origine des erreurs, visualisez les histogrammes de votre caractéristique à l'aide de la fonction `visualiser_histogrammes_mnist_4` en exécutant la cellule ci-dessous.

In [None]:
# Visualisation des histogrammes
visualiser_histogrammes_mnist_4(car_x_train)