# Chargement du dataset mnist de keras pour entraîner un FNN (Fully connected Neural Network) à la reconnaissance d'images

Le dataset mnist de keras contient un **training_dataset** et un **testing_dataset** de respectivement **60 000** et **10 000** images d'un chiffre dessiné à la main. Chaque image est décomposée en un quadrillage de 28 x 28 "cases", chaque case étant associée à une valeur de pixel. **x_train** est donc une **matrice 3D** de shape: **60 000 x 28 x 28**. Chaque indice de zero à 59 000 de x_train correspond ainsi à une matrice 2D de 28 listes de 28 valeurs, chaque valeur correspondant à un nombre de pixels compris entre environ 0 et 250. Pour chaque indice de 0 à 59 000 la valeur de **y_train** correspondante est **le label/la class** (et l'output) de l'image: **soit un chiffre de 1 à 10**.



In [None]:
import tensorflow as tf

mnist = tf.keras.datasets.mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data() # chargement du jeu de données

# (x_train, y_train) = training set : jeu de données utilisé pour la phase d'apprentissage du cnn
# (x_test, y_test) = testing set : jeu de données utilisé pour la phase de test du cnn (vérification de sa fiabilité)


## Visualisation du jeu de données:

import pandas as pd
import matplotlib.pyplot as plt

print(x_train.shape)

print(x_train[0])
print(y_train[0])
plt.imshow(x_train[0], cmap = plt.cm.binary)
plt.show()

print(x_train[59000])
print(y_train[59000])
plt.imshow(x_train[59000], cmap = plt.cm.binary)
plt.show()

In [None]:
## Normalisation des données inputs entre 0 et 1 (vivement conseillé)

x_train = tf.keras.utils.normalize(x_train, axis=1)
x_test = tf.keras.utils.normalize(x_test, axis=1)

## Visualisation du jeu de données après normalisation:

print(x_train[0])
print(y_train[0])
plt.imshow(x_train[0], cmap = plt.cm.binary)
plt.show()

print(x_train[59000])
print(y_train[59000])
plt.imshow(x_train[59000], cmap = plt.cm.binary)
plt.show()


In [None]:
## Définition du modèle (= architecture du cnn) avec keras ##

model = tf.keras.models.Sequential() # modèle sequentiel
model.add(tf.keras.layers.Flatten()) # input layer --> reshaped à une dimension (et non plus 2D (matrice 28 x 28))
model.add(tf.keras.layers.Dense(128, activation = tf.nn.relu)) # 1st inner layer definition : 128 neurones 
model.add(tf.keras.layers.Dense(128, activation = tf.nn.relu)) # 2nd inner layer definition : 128 neurones
# dense par opposition à flatten : plusieurs dimensions pour l'input reçu 
# Par défaut c'est la fonction d'activation ReLu (si x < 0, y = 0; si x >= 0, y = x) qui est utilisé pour les inner layers
model.add(tf.keras.layers.Dense(10, activation = tf.nn.softmax)) # outpout layer
# Nombre de neurones = nombre de classes/outputs possibles : ici 10
# Pour un cnn utilisé pour faire de la classification (= probability distribution) c'est la fontion softmax qu'on utilise comme fonction d'activation de l'oupout layer

## définition des paramètres de training du modèle:
model.compile(optimizer = 'adam', # adam est l'optimizer par défaut
              loss = 'sparse_categorical_crossentropy', # loss aurait pu être binary pour une classification à 2 classes
              metrics = ['accuracy'])
## Training:
model.fit(x_train, y_train, epochs = 3)

## " Epoch is just a "full pass" through the entire training dataset. 
## So if we train on 1 epoch, the neural network sees each unique sample once. 
## 3 epochs means it passed over our data set 3 times

In [None]:
val_loss, val_acc = model.evaluate(x_test, y_test)
print(val_loss, val_acc)

In [None]:
model.save('digits_pictures')
new_model = tf.keras.models.load_model('digits_pictures')
predictions = new_model.predict([x_test])
print(predictions) #imprime une distribution de probabilités pour les 10 classes pour les 10 000 images du dataset test
print(predictions[0])


In [None]:
import numpy as np
print (np.argmax(predictions[0])) # permet d'imprimer la valeur y_test[0]