Bienvenue dans le **Tuto Keras** !

A travers **5 parties** vous aurez l'occasion de parcourir et de découvrir quelques outils très utiles disponible grâce au **framework Keras**.

Chaque partie du tutoriel est divisée en sous-parties **"Cours"** et **"Exercice"** :

**Parties "Cours"** : Elles présentent les concepts et les codes fondamentaux pour construire un modèle de reconnaissance de chiffres. **Attention**, ces codes ne sont pas toujours complets et nécessitent des adaptations pour fonctionner.

**Parties "Exercice"** : Elles vous mettent au défi d'appliquer les concepts appris en complétant ou modifiant les codes du cours. C'est en réalisant ces exercices que vous comprendrez et maîtriserez réellement les techniques.

L'objectif principal de ce tutoriel est de vous faire **apprendre par la pratique**. Si les codes du cours étaient complets et exécutables tels quels, vous seriez tenté de les copier-coller sans véritablement les comprendre.

Les parties "Exercice" vous incitent à :

- Réfléchir aux concepts présentés dans le cours.
- Chercher les informations nécessaires pour compléter les codes.
- Expérimenter différentes solutions et paramètres.

N'hésitez pas à vous référer aux parties "Cours" pour trouver des indications et des exemples de code. Mais gardez à l'esprit que vous devrez les adapter pour répondre aux exigences des exercices.

Nous allons pouvoir commencer avec la première partie, **bon apprentissage** !

# Partie 1 : Importation de Keras et du dataset

## 1.1 Importations des packages pour Keras

In [None]:
import tensorflow as tf
from tensorflow.keras import datasets, layers, models
import numpy as np
import matplotlib.pyplot as plt

(1) Nous importons tensorflow pour utiliser le framework qui nous intéresse : Keras

-> tensorflow est ce qu'on appelle une API, elle nous permet de créer des modèles de réseaux de neurones

(2) Depuis tensorflow.keras on importe datasets, layers, et models

-> datasets : fournit une collection de datasets
-> layers : permet de construire un réseau de neurones couche par couche
-> models : pour construire, compiler et entraîner un modèle de réseau de neurones

(3) numpy est importé pour la manipulation des matrices

(4) matplotlib.pyplot nous permet de visualiser les images

## 1.2 Importation du dataset et normalisation

In [None]:
(train_images, train_labels), (test_images, test_labels) = datasets.mnist.load_data()

# Normalisation
train_images, test_images = train_images / val_norm, test_images / val_norm

(1) La fonction datasets.mnist.load_data() charge le dataset MNIST qui est divisé en deux ensembles : un ensemble d’entraînement (60 000 images) et un ensemble de test (10 000 images)
-> Le dataset MNIST contient des images de chiffres manuscrits (de 0 à 9), utilisées couramment pour tester des modèles d'apprentissage supervisé. Chaque image mesure 28x28 pixels et est en nuances de gris.

(1) train_images et test_images contiennent les images (28x28 pixels) des chiffres écrits à la main

(1) train_labels et test_labels contiennent les étiquettes associées aux images (les chiffres réels que les images représentent)

(2) Les images sont initialement dans une plage de valeurs entre 0 et 255. Pour faciliter l'entraînement du modèle, nous normaliserons les valeurs des pixels. Cela est illustrer dans le code par la division par val_norm. On veut que cela transforme les valeurs dans un intervalle de [0 ; 1], pour aider à la convergence du modèle.

# Exercice 1 :

Dans cette partie exercice vous serez mis à l'épreuve afin de produire votre propre code sur votre ordinateur.

## 1.1 Exercice : Importation des packages pour Keras

En reprenant le code dans la partie cours (1.1 Importation des packages pour Keras), importer les packages utiles pour l'utilisation de Keras.

**Question** : A quoi nous sert les modules importer depuis tensorfow.keras ? **Relier** les modules avec leurs fonctions :

A. datasets •      • 1. construire, compiler et entraîner un modèle de réseau de neurones

B. layers   •      • 2. fournit une collection de datasets

C. models   •      • 3. construire un réseau de neurones couche par couche

## 1.2 Exercice : Importation du dataset et normalisation

Sur votre ordinateur personnel, reprendre le code de la partie cours (1.2 Importation du dataset et normalisation). Définir la valeur de val_norm afin de normaliser nos données.

# Partie 2 : Le modèle

## 2.1 Initialisation du modèle

In [None]:
model = models.Sequential([
    layers.Flatten(input_shape=(28, 28)),
    layers.Dense(nbr_cc, activation='activation_function'),
    layers.Dense(nbr_cs, activation='activation_function')
])

(1) Sequential : Crée un modèle linéaire empilant les couches les unes après les autres.

(2) Ajout d'une couche
-> Elle transforme une image 28x28 en un vecteur de 784 valeurs (28 * 28).
-> Permet de passer d'une image 2D à une liste de valeurs pour le réseau de neurones.

(3) nbr_cc = nombre de neuronnes dans la couche cachée

(3) activation='activation_function' : Choix de la fonction d'activation ( ReLU, sigmoïde, ...)

(4) nbr_cs = nombre de neuronnes dans la couche de sortie

## 2.2 Compilation

In [None]:
model.compile(optimizer='optimizer',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

(1) optimizer='optimizer' : Algorithme d'optimisation

(2) loss='sparse_categorical_crossentropy' : Fonction de perte adaptée à la classification multi-classes avec des labels sous forme d'entiers.

(3) metrics=['accuracy'] : Mesure la performance du modèle en termes de précision.

# Exercice 2 : Le modèle

## 2.1 Exercice : Initialisation du modèle

En reprenant le code dans la partie cours (2.1 Initialisation du modèle) :

- On fixera d'abord le nombre de neuronnes par couche caché de 128 et le nombre de neuronnes pour la couche de sortie de 10 car 10 est le nombre de classes (0 à 9 pour le dataset MNIST).

- Puis on choisira pour les couches cachées, la fonction d'activation 'relu' (ReLU : Rectified Linear Unit) qui permet d'introduire la non-linéarité. Nous ne metterons aucune fonction d'activation pour la couche de sortie car le résultat brut est traité par la fonction de perte.

## 2.2 Exercice : Compilation

Reprendre le code dans la partie cours (2.2 Compilation), on choisira l'algorithme d'optimisation 'adam', basé sur la descente de gradient adaptative.

# Partie 3 : Entraînement et Évaluation

## 3.1 Entraînement

In [None]:
model.fit(train_images, train_labels, epochs=nbr_epochs)

(1) epochs=nbr_epochs : le nombre de fois que le modèle parcourt l'ensemble du jeu de données

## 3.2 Évaluation

test_loss, test_acc = model.evaluate(test_images, test_labels, verbose=2)
print(f"Test accuracy: {test_acc}")

Le modèle est testé sur des données jamais vues pour mesurer sa performance.

test_loss : la valeur de la fonction de perte (loss) sur les données de test, c'est une mesure de l’erreur moyenne

test_acc : la précision du modèle, c’est-à-dire la proportion de bonnes réponses

On observe généralement que test_acc < train_acc mais si test_acc est largement inférieur à train_acc alors on est probablement en situation de surapprentissage.

Dans l'idéal on souhaiterait un test_acc qui tend vers 1 et un test_loss bas.

# Exercice 3 :

## 3.1 Exercice : Entraînement

Essayer le code de la partie cours (3.1 Entraînement) avec un nombre fixé d'epochs = 5

## 3.2 Exercice : Évaluation

Reprendre le code de la partie cours (3.2 Évaluation) et déterminer le cas dans lequel nous sommes :

- Situation de surapprentissage
- Situation normale
- Situation de très bonne précision du modèle

# Partie 4 : Réseau de Neuronnes CNN

Après avoir compris le fonctionnement d’un modèle dense simple sur MNIST, nous allons maintenant construire un **modèle CNN** (Convolutional Neural Network) plus adapté à l’analyse d’images. Les CNN sont capables de **détecter automatiquement** des motifs visuels utiles (bords, textures, formes...) dans les images, sans qu’on ait besoin de les décrire à la main.

Ce que tu vas apprendre dans cette partie :

- Créer un CNN avec **Conv2D et MaxPooling2D**.

- Comprendre comment chaque couche transforme les images.

- Utiliser un **outil interactif** (ipywidgets) pour tester différents paramètres du modèle sans modifier le code manuellement.

- **Évaluer** visuellement les **performances** du réseau après entraînement.

- **Tester** une **image aléatoire** du jeu de test et afficher la **prédiction du modèle**.

## 4.1 Prétraitement des données

Dans le réseau de neuronnes précédent, les images étaient traitées comme des vecteurs de taille 784 (car 28×28 = 784).
Mais dans un réseau convolutionnel (CNN), les couches Conv2D attendent des images à 3 dimensions

In [None]:
train_images = train_images.reshape((train_images.shape[0], 28, 28, 1))
test_images = test_images.reshape((test_images.shape[0], 28, 28, 1))

## 4.2 Le modèle CNN

In [None]:
def create_model(filters_1, filters_2, filters_3, epochs):
    model = models.Sequential([
        layers.Conv2D(filters_1, (3, 3), activation='relu', input_shape=(28, 28, 1)),
        layers.MaxPooling2D((2, 2)),

        layers.Conv2D(filters_2, (3, 3), activation='relu'),
        layers.MaxPooling2D((2, 2)),

        layers.Conv2D(filters_3, (3, 3), activation='relu'),

        layers.Flatten(),
        layers.Dense(64, activation='relu'),
        layers.Dense(10)
    ])

    model.compile(optimizer='adam',
                  loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
                  metrics=['accuracy'])


    history = model.fit(train_images, train_labels, epochs=epochs, validation_data=(test_images, test_labels))


    test_loss, test_acc = model.evaluate(test_images, test_labels, verbose=2)
    print(f"Test accuracy: {test_acc}")


    plt.plot(history.history['accuracy'], label='accuracy')
    plt.plot(history.history['val_accuracy'], label = 'val_accuracy')
    plt.xlabel('Epochs')
    plt.ylabel('Accuracy')
    plt.legend(loc='lower right')
    plt.show()

La fonction create_model initialise, compile, entraîne et teste un réseau de neurones convolutif (CNN) à 3 couches Conv2D, en utilisant les paramètres fournis par l'utilisateur :

- filters_1 : nombre de filtre dans la 1ere couche convolutive
- filters_2 : nombre de filtre dans la 2eme couche convolutive
- filters_3 : nombre de filtre dans la 3eme couche convolutive
- epochs : Nombre d’époques (itérations) pour entraîner le modèle


L'initialisation du modèle s'effectue presque de la même manière que précédemment, on ajoutera cependant 3 couches convolutive (Conv2D) et 2 couches de MaxPooling pour réduire la taille de l’image.

La compilation, l'entraînement et la phase d'évaluation sont identiques.

## 4.3 Prédiction

In [None]:
def predict_image(model):

    random_index = np.random.randint(0, test_images.shape[0])
    image = test_images[random_index]
    label = test_labels[random_index]


    plt.imshow(image.reshape(28, 28), cmap=plt.cm.binary)
    plt.title(f"Vrai label: {label}")
    plt.show()


    image = image.reshape((1, 28, 28, 1))
    prediction = model.predict(image)
    predicted_label = tf.argmax(prediction, axis=1).numpy()[0]

    print(f"Prédiction : {predicted_label}")

Cette fonction a pour objectif de tester un modèle entraîné en affichant une image de test choisie aléatoirement et en comparant la prédiction du modèle avec le vrai label. C’est une mise en pratique directe pour vérifier visuellement les performances du réseau.

(2) np.random.randint(...) tire un indice au hasard dans le dataset de test.

(3) image : récupère l’image

(4) label : récupère le vrai label correspondant à l'image.

(5) plt.imshow : redimensionne l’image pour l’afficher en 2D (28x28).

(8) Le modèle retourne un vecteur de scores (logits) pour les 10 classes (chiffres de 0 à 9).

(9) tf.argmax(..., axis=1) : donne l’indice (la classe) avec le plus grand score.

(9) .numpy()[0] : transforme le résultat TensorFlow en entier Python.

(10) Affiche la classe prédite par le réseau dans la console

# Exercice 4 : Le modèle CNN

Après avoir copié puis collé l'ensemble des codes de la partie 4 nous serons en mesure de mettre en place une interface interactive pour tester facilement des combinaisons d’hyperparamètres et comprendre visuellement leur impact.

Autrement dit, cela permettra de tester différentes architectures de CNN (en modifiant le nombre de filtres) et différentes durées d'entraînement, de façon très simple, sans écrire une ligne de plus.

In [None]:
import ipywidgets as widgets
from ipywidgets import interact

In [None]:
filters_1 = widgets.IntSlider(value=32, min=16, max=64, step=16, description='Filters (Conv1):')
filters_2 = widgets.IntSlider(value=64, min=32, max=128, step=32, description='Filters (Conv2):')
filters_3 = widgets.IntSlider(value=64, min=32, max=128, step=32, description='Filters (Conv3):')
epochs = widgets.IntSlider(value=5, min=1, max=20, step=1, description='Epochs:')


interact(create_model, filters_1=filters_1, filters_2=filters_2, filters_3=filters_3, epochs=epochs)

Quels sont les paramètres qui ont offert la meilleure performance à ton modèle ?

Reprends le code ci-dessous pour faire la partie prédiction, en remplaçant val_filtre1 val_filtre2 et val_filtre3 ainsi que val_epochs par les valeurs trouvées.

In [None]:
def model_perf():
    model = models.Sequential([
        layers.Conv2D(val_filtre1, (3, 3), activation='relu', input_shape=(28, 28, 1)),
        layers.MaxPooling2D((2, 2)),

        layers.Conv2D(val_filtre2, (3, 3), activation='relu'),
        layers.MaxPooling2D((2, 2)),

        layers.Conv2D(val_filtre3, (3, 3), activation='relu'),

        layers.Flatten(),
        layers.Dense(64, activation='relu'),
        layers.Dense(10)
    ])

    model.compile(optimizer='adam',
                  loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
                  metrics=['accuracy'])

    model.fit(train_images, train_labels, epochs=val_epochs, validation_data=(test_images, test_labels))

    return model

predict_image(model)

# Partie 5 : Utilisation de VGG16 avec MNIST

VGG16 est un **réseau convolutif profond**, pré-entraîné sur le dataset **ImageNet** (1,2M images, 1000 classes).
Il est très utilisé pour le **transfert learning**, qui consiste à réutiliser ce qu’il a appris pour d'autres tâches. Même si MNIST est simple, c’est un bon exercice pour **comprendre comment adapter un modèle existant** à un autre type de données.


## 5.1 Nouvelles importation de packages

In [None]:
from tensorflow.keras.applications import VGG16
from tensorflow.keras.preprocessing import image
from tensorflow.keras.applications.vgg16 import preprocess_input

(1) VGG16 : Import du modèle VGG16 pré-entraîné

(2) image : Pour manipuler les images (resize, conversion)

(3) preprocess_input : Prétraitement des images pour VGG16

## 5.2 Réduction du jeu de données

In [None]:
train_images = train_images[:500]
train_labels = train_labels[:500]
test_images = test_images[:100]
test_labels = test_labels[:100]

Dans cette partie, nous nous limiterons volontairement à un petit sous-ensemble pour gagner du temps et économiser de la mémoire.

## 5.3 Conversion en RGB

In [None]:
train_images_rgb = np.stack([np.stack([img]*3, axis=-1) for img in train_images])
test_images_rgb = np.stack([np.stack([img]*3, axis=-1) for img in test_images])

- VGG16 attend des images avec 3 canaux (rouge, vert, bleu).
- On duplique le canal des niveaux de gris pour créer une image RGB artificielle.

## 5.4 Redimensionnement des images

In [None]:
train_images_resized = np.array([image.array_to_img(img).resize((224, 224)) for img in train_images_rgb])
test_images_resized = np.array([image.array_to_img(img).resize((224, 224)) for img in test_images_rgb])

- On redimensionne chaque image à l'aide de la fonction `resize` car VGG16 attend des images de 224x224 pixels.

## 5.5 Conversion en tableaux NumPy

In [None]:
train_images_resized = np.stack([np.array(img) for img in train_images_resized])
test_images_resized = np.stack([np.array(img) for img in test_images_resized])

On convertit les images PIL en tableaux numériques (`np.array`) pour qu’ils soient utilisables dans le modèle.

## 5.6 Prétraitement pour VGG16

In [None]:
train_images_resized = preprocess_input(train_images_resized)
test_images_resized = preprocess_input(test_images_resized)

- Le modèle VGG16 attend des images normalisées selon les statistiques du dataset ImageNet.
- Cette fonction fait le bon prétraitement automatique.

## 5.7 Chargement de VGG16 sans la dernière couche

In [None]:
vgg16_model = VGG16(weights='imagenet', include_top=False, input_shape=(224, 224, 3))

- `weights='imagenet'` → On utilise les poids appris sur ImageNet.
- `include_top=False` → On enlève la dernière couche de classification pour mettre la nôtre.

## 5.8 Défiger certaines couches (fine-tuning)

In [None]:
vgg16_model.trainable = True
for layer in vgg16_model.layers[:10]:
    layer.trainable = False

- On rend les couches entraînables, sauf les 10 premières.
- Cela permet de réadapter VGG16 à notre tâche sans tout casser.

## 5.9 Construction du modèle final

In [None]:
model = models.Sequential([
    vgg16_model,                        # Base du modèle pré-entraîné
    layers.Flatten(),                  # Aplatit les sorties du bloc convolutif
    layers.BatchNormalization(),       # Normalise les activations pour stabiliser l'entraînement
    layers.Dense(64, activation='relu'),  # Couche dense classique avec ReLU
    layers.Dense(10, activation='softmax')  # Couche de sortie (10 classes MNIST)
])

##  11. Compilation du modèle


model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

##  12. Entraînement du modèle


history = model.fit(train_images_resized, train_labels, epochs=5,
                    validation_data=(test_images_resized, test_labels))

## 5.10 Évaluation et visualisation

In [None]:
test_loss, test_acc = model.evaluate(test_images_resized, test_labels, verbose=2)
print(f"\n✅ Test accuracy: {test_acc:.4f}")

Évalue les performances du modèle sur des données **jamais vues**.

In [None]:
plt.plot(history.history['accuracy'], label='Accuracy (train)')
plt.plot(history.history['val_accuracy'], label='Accuracy (val)')
plt.xlabel('Epochs')
plt.ylabel('Accuracy')
plt.title('Courbe de précision - VGG16 fine-tuné sur MNIST')
plt.legend()
plt.show()

Affiche les courbes d'entraînement et de validation pour suivre l'apprentissage.

# Exercice 5

La particularité de la partie 5 est qu'elle n'est pas revenue sur les notions déjà vu précédement. Ainsi dans cet exercice nous vous mettons au défis de mettre en pratique toutes les connaissances acquises jusqu'à maintenant pour construire, à l'aide de VGG16, un modèle de classification d'images MNIST.

1) Importer les bibliothèques

- tensorflow, keras, numpy, matplotlib.pyplot,
- les modules spécifiques à VGG16 (VGG16, preprocess_input, image)

2) Chargement et prétraitement des données MNIST

- Charger MNIST
- Réduire les données
- Convertir les images en RGB
- Redimensionner les images pour VGG16
- Prétraiter les images

3) Construction du modèle

4) Compilation du modèle

5) Entraînement du modèle

6) Évaluation et visualisation

