### Description de MNIST "Handwritten Digit Recognition Problem"

MNIST est un jeu de données développé par Yann LeCun, Corinna Cortes et Christopher Burges pour évaluer les modèles d’apprentissage automatique sur la classification des chiffres manuscrits.

Ce jeu de données a été construit à partir de plusieurs ensembles de documents numérisés provenant du National Institute of Standards and Technology (NIST). Nommé **Modified NIST**, ou **MNIST**.

Chaque image est un carré de **28×28 pixels** (soit **784 pixels** au total). Une division standard du jeu de données est utilisée pour l'évaluation et la comparaison des modèles : **60 000 images** servent à l'entraînement du modèle, et un ensemble distinct de **10 000 images** est utilisé pour le tester.

Il s'agit d'une tâche de reconnaissance de chiffres. Il y a donc **dix chiffres** (de 0 à 9), soit **dix classes** à prédire. 

Voici le schéma d’architecture des réseaux de neurones que nous allons réaliser dans ce workshop. 

<img src="Image1.png" width="900">

Import dependencies

In [None]:
import tensorflow as tf
from tensorflow import keras
import numpy as np
import matplotlib.pyplot as plt
import numpy as np
from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras.models import Sequential
import os

1. Charger la dataset MNIST

In [None]:
(x_train, y_train), (x_test, y_test) = #A COMPLETER

print(f"forme des images {x_train.shape}")  

Pour commencer, nous devons spécifier quelques paramètres pour l'apprentissage:
<ul>
    <li>La longueur et la largeur des images. </li>
    <li>La taille du batch.</li>
</ul>

In [3]:
image_h, image_w = x_train.shape[1], x_train.shape[2]
batch_s = 32

2. Data processing :Normalisation des images (mise à l'échelle entre 0 et 1)

In [4]:
x_train, x_test = #A COMPLETER

3. Construire les modèles

In [9]:
def build_small_model(): # create small model
    model = Sequential()
    #A COMPLETER
    return model

def build_medium_model(): # create medium model
    model = Sequential()
    #A COMPLETER
    return model

def build_large_model(): # create large model
    model = Sequential()
    #A COMPLETER
    return model

4. Entraîner les modèles

In [None]:
models = {"small": build_small_model(), "medium": build_medium_model(), "large": build_large_model()}
histories = {}

SAVE_DIR = "mnist_results"
os.makedirs(SAVE_DIR, exist_ok=True)

for name, model in models.items():
    model.compile(
        #A COMPLETER
    )
    history = model.fit(x_train, y_train, epochs=10, validation_data=(x_test, y_test))
    histories[name] = history.history
    model.save(os.path.join(SAVE_DIR, f"{name}_model.h5"))
    np.save(os.path.join(SAVE_DIR, f"{name}_history.npy"), history.history)

5. Validation : Plot Accuracy & Loss

In [None]:
# Plot Accuracy & Loss for all models
def plot_all_metrics(histories):
    plt.figure(figsize=(12,5))
    
    # Accuracy Plot
    plt.subplot(1,2,1)
    for name, history in histories.items():
        plt.plot(history['accuracy'], label=f'{name} Train Accuracy')
        plt.plot(history['val_accuracy'], label=f'{name} Validation Accuracy', linestyle='dashed')
    plt.xlabel('Epochs')
    plt.ylabel('Accuracy')
    plt.legend()
    plt.title('Model Accuracy Comparison')
    
    # Loss Plot
    plt.subplot(1,2,2)
    for name, history in histories.items():
        plt.plot(history['loss'], label=f'{name} Train Loss')
        plt.plot(history['val_loss'], label=f'{name} Validation Loss', linestyle='dashed')
    plt.xlabel('Epochs')
    plt.ylabel('Loss')
    plt.legend()
    plt.title('Model Loss Comparison')
    
    plt.savefig(os.path.join(SAVE_DIR, "models_accuracy_loss_plot.png"))
    plt.show()

plot_all_metrics(histories)

In [None]:
results = {}
for name, model in models.items():
    scores = model.evaluate(x_test, y_test, verbose=0)
    results[name] = {"accuracy": scores[1] * 100, "error_rate": 100 - scores[1] * 100}

print(results)

### Analyse comparative des optimizers pour MNIST

Nous avons utilisé 'Adam' comme algorithme d’optimisation. Cependant, d’autres optimizers peuvent avoir un impact différent sur la convergence et la précision du modèle. Testez au moins trois autres optimizers parmi les suivants :

In [None]:
# Liste tous les optimizers disponibles dans TensorFlow
optimizers = [opt for opt in dir(tf.keras.optimizers) if not opt.startswith("__")]
print(optimizers)

In [None]:
# Executer cette ligne pour voir la documentation de chaque optimizer
help(tf.keras.optimizers.Adam)

1. Comparez leurs performances en traçant les courbes de perte et d’accuracy sur l’ensemble d'entraînement et de validation.

2. Analysez la vitesse de convergence et la précision finale de chaque optimizer.

3. Quel optimizer semble le plus efficace pour ce problème et pourquoi ?