In [None]:
{
  "cells": [
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "# CNN pour la classification d'images - MNIST\n",
        "\n",
        "## BTS SIO SLAM - Séance 2: Types de réseaux de neurones\n",
        "\n",
        "Ce notebook vous guidera à travers l'implémentation et l'utilisation d'un réseau de neurones convolutif (CNN) pour la classification d'images, en utilisant le célèbre dataset MNIST des chiffres manuscrits.\n",
        "\n",
        "### Objectifs d'apprentissage:\n",
        "- Comprendre l'architecture et le principe des réseaux convolutifs (CNN)\n",
        "- Implémenter un CNN avec TensorFlow/Keras pour la reconnaissance d'images\n",
        "- Visualiser et interpréter les filtres et feature maps\n",
        "- Analyser les performances du modèle et les cas d'erreur\n",
        "- Explorer l'intégration d'un modèle CNN dans une application web\n",
        "\n",
        "### Prérequis:\n",
        "- Connaissances de base en Python\n",
        "- Notions fondamentales de réseaux de neurones\n",
        "- Avoir suivi la séance 1 d'introduction au Deep Learning"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "## 1. Configuration de l'environnement\n",
        "\n",
        "Commençons par importer les bibliothèques nécessaires et configurer notre environnement."
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "import numpy as np\n",
        "import matplotlib.pyplot as plt\n",
        "import tensorflow as tf\n",
        "from tensorflow.keras.models import Sequential\n",
        "from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout\n",
        "from tensorflow.keras.utils import to_categorical\n",
        "from tensorflow.keras.datasets import mnist\n",
        "import time\n",
        "import seaborn as sns\n",
        "from sklearn.metrics import confusion_matrix\n",
        "\n",
        "# Configuration pour reproductibilité\n",
        "np.random.seed(42)\n",
        "tf.random.set_seed(42)\n",
        "\n",
        "# Vérifier la version de TensorFlow\n",
        "print(f\"TensorFlow version: {tf.__version__}\")"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "## 2. Chargement et préparation du dataset MNIST\n",
        "\n",
        "Le dataset MNIST contient 70,000 images de chiffres manuscrits de taille 28x28 pixels. Il est divisé en 60,000 images d'entraînement et 10,000 images de test."
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "print(\"Chargement des données MNIST...\")\n",
        "(X_train, y_train), (X_test, y_test) = mnist.load_data()\n",
        "\n",
        "# Afficher les dimensions des données\n",
        "print(f\"Dimensions de X_train: {X_train.shape}\")\n",
        "print(f\"Dimensions de y_train: {y_train.shape}\")\n",
        "print(f\"Dimensions de X_test: {X_test.shape}\")\n",
        "print(f\"Dimensions de y_test: {y_test.shape}\")\n",
        "\n",
        "# Afficher les premières valeurs de y_train\n",
        "print(f\"Classes dans y_train: {y_train[:20]}\")\n",
        "print(f\"Nombre de classes: {len(np.unique(y_train))}\")"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "### Préparation des données pour le CNN\n",
        "\n",
        "Pour utiliser nos images avec un CNN, nous devons :\n",
        "1. Ajouter une dimension pour le canal (les images sont en niveaux de gris, donc 1 seul canal)\n",
        "2. Normaliser les valeurs de pixels entre 0 et 1\n",
        "3. Convertir les étiquettes en format one-hot encoding (pas toujours nécessaire, mais souvent utile)"
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "# Redimensionnement et normalisation\n",
        "X_train = X_train.reshape(-1, 28, 28, 1) / 255.0\n",
        "X_test = X_test.reshape(-1, 28, 28, 1) / 255.0\n",
        "\n",
        "# Conversion des étiquettes en catégories one-hot\n",
        "y_train_onehot = to_categorical(y_train, 10)\n",
        "y_test_onehot = to_categorical(y_test, 10)\n",
        "\n",
        "print(f\"Nouvelle forme de X_train: {X_train.shape}\")\n",
        "print(f\"Nouvelle forme de y_train_onehot: {y_train_onehot.shape}\")\n",
        "print(f\"Exemple de label encodé en one-hot: {y_train_onehot[0]} représente le chiffre {y_train[0]}\")"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "### Visualisation de quelques exemples\n",
        "\n",
        "Regardons à quoi ressemblent nos données."
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "plt.figure(figsize=(10, 5))\n",
        "for i in range(10):\n",
        "    plt.subplot(2, 5, i+1)\n",
        "    plt.imshow(X_train[i].reshape(28, 28), cmap='gray')\n",
        "    plt.title(f\"Chiffre: {y_train[i]}\")\n",
        "    plt.axis('off')\n",
        "plt.tight_layout()\n",
        "plt.show()"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "## 3. Création d'un modèle CNN\n",
        "\n",
        "Nous allons maintenant créer un réseau de neurones convolutif. Les CNN sont particulièrement adaptés au traitement d'images grâce à leur capacité à apprendre des caractéristiques spatiales hiérarchiques."
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "def create_cnn_model():\n",
        "    model = Sequential([\n",
        "        # Première couche de convolution\n",
        "        Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1), name='conv1'),\n",
        "        MaxPooling2D((2, 2), name='pool1'),\n",
        "        \n",
        "        # Deuxième couche de convolution\n",
        "        Conv2D(64, (3, 3), activation='relu', name='conv2'),\n",
        "        MaxPooling2D((2, 2), name='pool2'),\n",
        "        \n",
        "        # Aplatissement pour passer aux couches denses\n",
        "        Flatten(name='flatten'),\n",
        "        \n",
        "        # Couches denses (fully connected)\n",
        "        Dense(128, activation='relu', name='dense1'),\n",
        "        Dropout(0.5, name='dropout1'),  # Régularisation\n",
        "        Dense(10, activation='softmax', name='output')  # 10 classes (chiffres 0-9)\n",
        "    ])\n",
        "    \n",
        "    # Compilation du modèle\n",
        "    model.compile(\n",
        "        optimizer='adam',\n",
        "        loss='categorical_crossentropy',  # Pour les étiquettes one-hot\n",
        "        metrics=['accuracy']\n",
        "    )\n",
        "    \n",
        "    return model\n",
        "\n",
        "# Créer le modèle\n",
        "model = create_cnn_model()\n",
        "\n",
        "# Afficher le résumé de l'architecture\n",
        "model.summary()"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "### Explication de l'architecture du CNN\n",
        "\n",
        "Notre architecture CNN comprend :\n",
        "\n",
        "1. **Couches de convolution (Conv2D)** :\n",
        "   - Appliquent des filtres qui glissent sur l'image pour détecter des caractéristiques (bords, textures, formes)\n",
        "   - Premières couches : caractéristiques simples (lignes, bords)\n",
        "   - Couches profondes : caractéristiques complexes (formes, parties de chiffres)\n",
        "\n",
        "2. **Couches de pooling (MaxPooling2D)** :\n",
        "   - Réduisent la dimension spatiale (downsampling)\n",
        "   - Rendent le modèle plus robuste aux variations de position\n",
        "   - Diminuent le nombre de paramètres\n",
        "\n",
        "3. **Flatten** :\n",
        "   - Convertit les feature maps 2D en un vecteur 1D\n",
        "   - Nécessaire pour passer aux couches denses\n",
        "\n",
        "4. **Couches denses (Dense)** :\n",
        "   - Combinent toutes les caractéristiques extraites\n",
        "   - Effectuent la classification finale\n",
        "\n",
        "5. **Dropout** :\n",
        "   - Technique de régularisation\n",
        "   - Désactive aléatoirement 50% des neurones pendant l'entraînement\n",
        "   - Prévient le surapprentissage\n",
        "\n",
        "Cette architecture est similaire au célèbre LeNet-5, mais avec plus de filtres et l'ajout de Dropout."
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "## 4. Entraînement du modèle\n",
        "\n",
        "Entraînons maintenant notre modèle CNN sur les données MNIST."
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "# Mesure du temps d'entraînement\n",
        "start_time = time.time()\n",
        "\n",
        "# Entraînement du modèle\n",
        "history = model.fit(\n",
        "    X_train, \n",
        "    y_train_onehot, \n",
        "    batch_size=128, \n",
        "    epochs=5,  # Nombre réduit d'époques pour la démonstration\n",
        "    validation_split=0.2,  # 20% des données d'entraînement pour la validation\n",
        "    verbose=1\n",
        ")\n",
        "\n",
        "training_time = time.time() - start_time\n",
        "print(f\"\\nTemps d'entraînement: {training_time:.2f} secondes\")"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "### Visualisation de l'évolution de l'entraînement\n",
        "\n",
        "Observons comment la précision et la perte ont évolué au cours de l'entraînement."
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "plt.figure(figsize=(12, 4))\n",
        "\n",
        "# Graphique de précision\n",
        "plt.subplot(1, 2, 1)\n",
        "plt.plot(history.history['accuracy'], label='Entraînement')\n",
        "plt.plot(history.history['val_accuracy'], label='Validation')\n",
        "plt.title('Évolution de la précision')\n",
        "plt.xlabel('Époque')\n",
        "plt.ylabel('Précision')\n",
        "plt.legend()\n",
        "plt.grid(True, linestyle='--', alpha=0.6)\n",
        "\n",
        "# Graphique de perte\n",
        "plt.subplot(1, 2, 2)\n",
        "plt.plot(history.history['loss'], label='Entraînement')\n",
        "plt.plot(history.history['val_loss'], label='Validation')\n",
        "plt.title('Évolution de la perte')\n",
        "plt.xlabel('Époque')\n",
        "plt.ylabel('Perte')\n",
        "plt.legend()\n",
        "plt.grid(True, linestyle='--', alpha=0.6)\n",
        "\n",
        "plt.tight_layout()\n",
        "plt.show()"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "## 5. Évaluation du modèle\n",
        "\n",
        "Évaluons maintenant notre modèle sur l'ensemble de test."
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "# Évaluation sur l'ensemble de test\n",
        "test_loss, test_acc = model.evaluate(X_test, y_test_onehot, verbose=1)\n",
        "print(f\"Précision sur l'ensemble de test: {test_acc*100:.2f}%\")\n",
        "\n",
        "# Prédictions\n",
        "y_pred = model.predict(X_test)\n",
        "y_pred_classes = np.argmax(y_pred, axis=1)\n",
        "\n",
        "# Matrice de confusion\n",
        "conf_mat = confusion_matrix(y_test, y_pred_classes)\n",
        "plt.figure(figsize=(10, 8))\n",
        "sns.heatmap(conf_mat, annot=True, fmt='d', cmap='Blues')\n",
        "plt.xlabel('Prédit')\n",
        "plt.ylabel('Réel')\n",
        "plt.title('Matrice de confusion')\n",
        "plt.show()"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "### Visualisation des exemples mal classifiés\n",
        "\n",
        "Explorons quelques exemples que notre modèle a mal classifiés pour comprendre ses faiblesses."
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "# Identifier les erreurs\n",
        "misclassified_indices = np.where(y_pred_classes != y_test)[0]\n",
        "misclassified_count = len(misclassified_indices)\n",
        "print(f\"Nombre total d'erreurs: {misclassified_count} sur {len(y_test)} images de test\")\n",
        "\n",
        "# Afficher quelques exemples mal classifiés\n",
        "num_examples = min(10, misclassified_count)\n",
        "plt.figure(figsize=(15, 6))\n",
        "\n",
        "for i, idx in enumerate(misclassified_indices[:num_examples]):\n",
        "    plt.subplot(2, 5, i+1)\n",
        "    plt.imshow(X_test[idx].reshape(28, 28), cmap='gray')\n",
        "    plt.title(f\"Réel: {y_test[idx]}\\nPrédit: {y_pred_classes[idx]}\")\n",
        "    plt.axis('off')\n",
        "    \n",
        "plt.tight_layout()\n",
        "plt.show()"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "### 🧠 Réflexion sur les erreurs\n",
        "\n",
        "**Question**: En observant les exemples mal classifiés, quelles pourraient être les raisons de ces erreurs? Notez vos observations et hypothèses ci-dessous."
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "*Écrivez vos observations ici...*"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "## 6. Visualisation des filtres et feature maps\n",
        "\n",
        "Une des grandes forces des CNNs est leur interprétabilité visuelle. Explorons ce que le réseau \"voit\" réellement."
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "# Fonction pour visualiser les filtres de convolution\n",
        "def visualize_filters(model, layer_name, num_filters=8):\n",
        "    \"\"\"Visualise les filtres d'une couche de convolution\"\"\"\n",
        "    \n",
        "    # Récupérer les poids du filtre de la couche spécifiée\n",
        "    filters, biases = model.get_layer(layer_name).get_weights()\n",
        "    \n",
        "    # Normaliser les filtres pour une meilleure visualisation\n",
        "    f_min, f_max = filters.min(), filters.max()\n",
        "    filters = (filters - f_min) / (f_max - f_min)\n",
        "    \n",
        "    # Afficher les premiers filtres\n",
        "    plt.figure(figsize=(12, 4))\n",
        "    for i in range(num_filters):\n",
        "        plt.subplot(2, 4, i+1)\n",
        "        # Pour la première couche de convolution, les filtres sont 3D (hauteur, largeur, canaux)\n",
        "        # Nous affichons le filtre pour le premier canal (0)\n",
        "        plt.imshow(filters[:, :, 0, i], cmap='viridis')\n",
        "        plt.title(f'Filtre {i+1}')\n",
        "        plt.axis('off')\n",
        "    plt.suptitle(f'Filtres de la couche {layer_name}')\n",
        "    plt.tight_layout()\n",
        "    plt.show()\n",
        "\n",
        "# Visualiser les filtres de la première couche de convolution\n",
        "visualize_filters(model, 'conv1')"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "### Visualisation des feature maps (cartes d'activation)"
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "def visualize_feature_maps(model, image, layer_name, num_features=8):\n",
        "    \"\"\"Visualise les feature maps (activations) d'une couche pour une image donnée\"\"\"\n",
        "    \n",
        "    # Créer un modèle qui renvoie les activations de la couche spécifiée\n",
        "    layer_model = tf.keras.Model(inputs=model.input, outputs=model.get_layer(layer_name).output)\n",
        "    \n",
        "    # Obtenir les activations pour une image\n",
        "    feature_maps = layer_model.predict(image.reshape(1, 28, 28, 1))\n",
        "    \n",
        "    # Afficher les premières cartes d'activation\n",
        "    plt.figure(figsize=(12, 4))\n",
        "    for i in range(min(num_features, feature_maps.shape[3])):\n",
        "        plt.subplot(2, 4, i+1)\n",
        "        plt.imshow(feature_maps[0, :, :, i], cmap='viridis')\n",
        "        plt.title(f'Feature {i+1}')\n",
        "        plt.axis('off')\n",
        "    plt.suptitle(f'Feature Maps de la couche {layer_name}')\n",
        "    plt.tight_layout()\n",
        "    plt.show()\n",
        "\n",
        "# Choisir une image de test\n",
        "sample_idx = 12  # Vous pouvez essayer avec différents indices\n",
        "sample_image = X_test[sample_idx]\n",
        "\n",
        "# Afficher l'image originale\n",
        "plt.figure(figsize=(3, 3))\n",
        "plt.imshow(sample_image.reshape(28, 28), cmap='gray')\n",
        "plt.title(f\"Chiffre: {y_test[sample_idx]}\")\n",
        "plt.axis('off')\n",
        "plt.show()\n",
        "\n",
        "# Visualiser les feature maps pour chaque couche de convolution\n",
        "print(\"Feature maps de la première couche de convolution:\")\n",
        "visualize_feature_maps(model, sample_image, 'conv1')\n",
        "\n",
        "print(\"Feature maps de la deuxième couche de convolution:\")\n",
        "visualize_feature_maps(model, sample_image, 'conv2')"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "### 💡 Interprétation des feature maps\n",
        "\n",
        "Les feature maps nous montrent ce que \"voit\" chaque filtre de convolution :\n",
        "\n",
        "- **Première couche** : Détecte principalement des caractéristiques de base comme les bords et les contours\n",
        "- **Deuxième couche** : Combine ces caractéristiques de base pour détecter des formes plus complexes\n",
        "\n",
        "Cette hiérarchie de représentations est ce qui rend les CNNs si puissants pour la vision par ordinateur."
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "## 7. Test du modèle avec des images bruitées\n",
        "\n",
        "Testons la robustesse de notre modèle face à des perturbations."
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "# Fonction pour ajouter du bruit aux images\n",
        "def add_noise(images, noise_level=0.2):\n",
        "    \"\"\"Ajoute du bruit gaussien aux images\"\"\"\n",
        "    noisy_images = images.copy()\n",
        "    noise = np.random.normal(0, noise_level, images.shape)\n",
        "    noisy_images = noisy_images + noise\n",
        "    # Assurer que les valeurs restent entre 0 et 1\n",
        "    return np.clip(noisy_images, 0, 1)\n",
        "\n",
        "# Créer des versions bruitées de quelques images de test\n",
        "num_test_images = 10\n",
        "test_samples = X_test[:num_test_images]\n",
        "noisy_samples = add_noise(test_samples, noise_level=0.3)\n",
        "\n",
        "# Visualiser les images originales et bruitées\n",
        "plt.figure(figsize=(15, 6))\n",
        "for i in range(num_test_images):\n",
        "    # Image originale\n",
        "    plt.subplot(2, num_test_images, i+1)\n",
        "    plt.imshow(test_samples[i].reshape(28, 28), cmap='gray')\n",
        "    plt.title(f\"Original: {y_test[i]}\")\n",
        "    plt.axis('off')\n",
        "    \n",
        "    # Image bruitée\n",
        "    plt.subplot(2, num_test_images, i+num_test_images+1)\n",
        "    plt.imshow(noisy_samples[i].reshape(28, 28), cmap='gray')\n",
        "    plt.axis('off')\n",
        "    \n",
        "plt.tight_layout()\n",
        "plt.show()\n",
        "\n",
        "# Prédire sur les images bruitées\n",
        "noisy_predictions = model.predict(noisy_samples)\n",
        "noisy_pred_classes = np.argmax(noisy_predictions, axis=1)\n",
        "\n",
        "# Afficher les résultats\n",
        "print(\"Résultats des prédictions sur les images bruitées:\")\n",
        "for i in range(num_test_images):\n",
        "    confidence = noisy_predictions[i][noisy_pred_classes[i]] * 100\n",
        "    status = \"✓\" if noisy_pred_classes[i] == y_test[i] else \"✗\"\n",
        "    print(f\"Image {i+1} - Réel: {y_test[i]}, Prédit: {noisy_pred_classes[i]}, \"  \n",
        "          f\"Confiance: {confidence:.1f}% {status}\")\n",
        "\n",
        "# Calculer la précision sur les images bruitées\n",
        "accuracy_on_noisy = np.mean(noisy_pred_classes == y_test[:num_test_images]) * 100\n",
        "print(f\"\\nPrécision sur les images bruitées: {accuracy_on_noisy:.1f}%\")

# Comparaison avec la précision sur les données originales
original_accuracy = np.mean(y_pred_classes[:num_test_images] == y_test[:num_test_images]) * 100
print(f\"Précision sur les images originales (pour le même sous-ensemble): {original_accuracy:.1f}%\")
print(f\"Baisse de précision due au bruit: {original_accuracy - accuracy_on_noisy:.1f} points de pourcentage\")"
      ]
    },
    {
      "cell_type": "markdown",
      "metadata": {},
      "source": [
        "## 8. Prédictions détaillées sur de nouvelles images\n",
        "\n",
        "Voyons comment notre modèle prédit des images spécifiques et quelles sont les probabilités pour chaque classe."
      ]
    },
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {},
      "outputs": [],
      "source": [
        "def predict_and_visualize_probabilities(model, image, true_label=None):\n",
        "    \"\"\"Prédit et visualise les probabilités pour chaque classe\"\"\"\n",
        "    \n",
        "    # Prédiction\n",
        "    prediction = model.predict(image.reshape(1, 28, 28, 1))[0]\n",
        "    predicted_class = np.argmax(prediction)\n",
        "    \n",
        "    # Visualisation\n",
        "    plt.figure(figsize=(12, 4))\n",
        "    \n",
        "    # Afficher l'image\n",
        "    plt.subplot(1, 2, 1)\n",
        "    plt.imshow(image.reshape(28, 28), cmap='gray')\n",
        "    if true_label is not None:\n",
        "        title = f\"Image (Vrai: {true_label})\"\n",
        "    else:\n",
        "        title = \"Image\"\n",
        "    plt.title(title)\n",
        "    plt.axis('off')\n",
        "    \n",
        "    # Afficher les probabilités\n",
        "    plt.subplot(1, 2, 2)\n",
        "    bars = plt.bar(range(10), prediction, color='skyblue')\n",
        "    \n",
        "

      ## 9. Exportation et intégration du modèle dans une application web

Dans cette section, nous allons voir comment exporter notre modèle CNN entraîné et l'intégrer dans une application web simple.

### Sauvegarde du modèle

Commençons par sauvegarder notre modèle entraîné pour pouvoir le réutiliser ultérieurement.

```python
# Sauvegarder le modèle complet (architecture + poids)
model.save('mnist_cnn_model.h5')
print("Modèle sauvegardé avec succès!")

# Sauvegarder uniquement les poids (si nécessaire)
model.save_weights('mnist_cnn_weights.h5')
print("Poids du modèle sauvegardés avec succès!")
```

### Conversion du modèle pour le web (TensorFlow.js)

Pour intégrer notre modèle dans une application web, nous pouvons utiliser TensorFlow.js. Il faut d'abord convertir notre modèle Keras en format TensorFlow.js.

```python
# Installer tensorflowjs (si pas déjà installé)
!pip install tensorflowjs

# Convertir le modèle pour TensorFlow.js
import tensorflowjs as tfjs
tfjs.converters.save_keras_model(model, 'tfjs_mnist_model')
print("Modèle converti pour TensorFlow.js!")
```

### Création d'une application web simple

Voici un exemple de code HTML et JavaScript pour créer une application web simple permettant aux utilisateurs de dessiner un chiffre et d'obtenir une prédiction de notre modèle CNN.

```html
<!DOCTYPE html>
<html lang="fr">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Reconnaissance de chiffres manuscrits</title>
    <script src="https://cdn.jsdelivr.net/npm/@tensorflow/tfjs@3.11.0/dist/tf.min.js"></script>
    <style>
        body {
            font-family: Arial, sans-serif;
            text-align: center;
            margin: 20px;
        }
        #canvas-container {
            display: flex;
            justify-content: center;
            margin: 20px 0;
        }
        canvas {
            border: 2px solid #333;
            cursor: crosshair;
        }
        button {
            margin: 10px;
            padding: 10px 20px;
            font-size: 16px;
            cursor: pointer;
        }
        #result {
            font-size: 24px;
            margin: 20px;
            font-weight: bold;
        }
        .confidence-bar {
            height: 20px;
            background-color: #4CAF50;
            text-align: left;
            margin: 5px 0;
            color: white;
            font-weight: bold;
            padding-left: 5px;
        }
    </style>
</head>
<body>
    <h1>Reconnaissance de chiffres manuscrits avec CNN</h1>
    <p>Dessinez un chiffre (0-9) dans le cadre ci-dessous:</p>
    
    <div id="canvas-container">
        <canvas id="drawingCanvas" width="280" height="280"></canvas>
    </div>
    
    <div>
        <button id="predictBtn">Prédire</button>
        <button id="clearBtn">Effacer</button>
    </div>
    
    <div id="result">Résultat: -</div>
    
    <div id="confidences" style="width: 300px; margin: 0 auto;"></div>
    
    <script>
        // Configuration du canvas
        const canvas = document.getElementById('drawingCanvas');
        const ctx = canvas.getContext('2d');
        ctx.lineWidth = 15;
        ctx.lineCap = 'round';
        ctx.strokeStyle = 'black';
        ctx.fillStyle = 'white';
        ctx.fillRect(0, 0, canvas.width, canvas.height);
        
        // Variables pour le dessin
        let isDrawing = false;
        let lastX = 0;
        let lastY = 0;
        
        // Chargement du modèle
        let model;
        async function loadModel() {
            model = await tf.loadLayersModel('tfjs_mnist_model/model.json');
            console.log('Modèle chargé!');
        }
        loadModel();
        
        // Fonctions de dessin
        function startDrawing(e) {
            isDrawing = true;
            [lastX, lastY] = [e.offsetX, e.offsetY];
        }
        
        function draw(e) {
            if (!isDrawing) return;
            ctx.beginPath();
            ctx.moveTo(lastX, lastY);
            ctx.lineTo(e.offsetX, e.offsetY);
            ctx.stroke();
            [lastX, lastY] = [e.offsetX, e.offsetY];
        }
        
        function stopDrawing() {
            isDrawing = false;
        }
        
        // Event listeners pour le dessin
        canvas.addEventListener('mousedown', startDrawing);
        canvas.addEventListener('mousemove', draw);
        canvas.addEventListener('mouseup', stopDrawing);
        canvas.addEventListener('mouseout', stopDrawing);
        
        // Prétraitement de l'image
        function preprocessCanvas() {
            // Redimensionner à 28x28 (taille attendue par le modèle)
            const imageData = ctx.getImageData(0, 0, canvas.width, canvas.height);
            const tempCanvas = document.createElement('canvas');
            tempCanvas.width = 28;
            tempCanvas.height = 28;
            const tempCtx = tempCanvas.getContext('2d');
            tempCtx.drawImage(canvas, 0, 0, canvas.width, canvas.height, 0, 0, 28, 28);
            
            // Convertir en niveaux de gris et normaliser (0-1)
            const tempImageData = tempCtx.getImageData(0, 0, 28, 28);
            const data = tempImageData.data;
            const grayscale = new Float32Array(28 * 28);
            
            for (let i = 0; i < 28 * 28; i++) {
                // Inverser les couleurs (fond blanc -> 0, trait noir -> 1)
                grayscale[i] = (255 - data[i * 4]) / 255.0;
            }
            
            // Créer un tenseur au format attendu par le modèle
            return tf.tensor(grayscale).reshape([1, 28, 28, 1]);
        }
        
        // Prédiction
        async function predict() {
            if (!model) {
                alert('Le modèle n\'est pas encore chargé. Veuillez patienter.');
                return;
            }
            
            // Prétraiter l'image
            const input = preprocessCanvas();
            
            // Faire la prédiction
            const predictions = await model.predict(input).data();
            
            // Trouver la classe avec la plus haute probabilité
            let maxProb = 0;
            let predictedClass = -1;
            
            for (let i = 0; i < predictions.length; i++) {
                if (predictions[i] > maxProb) {
                    maxProb = predictions[i];
                    predictedClass = i;
                }
            }
            
            // Afficher le résultat
            document.getElementById('result').textContent = `Résultat: ${predictedClass} (${(maxProb * 100).toFixed(2)}%)`;
            
            // Afficher les probabilités pour chaque classe
            const confidencesDiv = document.getElementById('confidences');
            confidencesDiv.innerHTML = '';
            
            for (let i = 0; i < predictions.length; i++) {
                const prob = predictions[i] * 100;
                const barDiv = document.createElement('div');
                barDiv.className = 'confidence-bar';
                barDiv.style.width = `${prob}%`;
                barDiv.textContent = i + ': ' + prob.toFixed(1) + '%';
                confidencesDiv.appendChild(barDiv);
            }
        }
        
        // Effacer le canvas
        function clearCanvas() {
            ctx.fillStyle = 'white';
            ctx.fillRect(0, 0, canvas.width, canvas.height);
            document.getElementById('result').textContent = 'Résultat: -';
            document.getElementById('confidences').innerHTML = '';
        }
        
        // Event listeners pour les boutons
        document.getElementById('predictBtn').addEventListener('click', predict);
        document.getElementById('clearBtn').addEventListener('click', clearCanvas);
    </script>
</body>
</html>
```

### Déploiement de l'application

Pour déployer cette application, suivez ces étapes:

1. Créez un dossier pour votre application web
2. Placez le code HTML ci-dessus dans un fichier `index.html`
3. Copiez le dossier `tfjs_mnist_model` (créé lors de la conversion) dans le même répertoire
4. Utilisez un serveur web pour servir ces fichiers (pour éviter les problèmes CORS)
   
Exemple avec Python:

```python
# Lancer un serveur web simple avec Python
!python -m http.server 8000
```

Vous pouvez alors accéder à votre application à l'adresse `http://localhost:8000`.

### Améliorations possibles

Voici quelques idées pour améliorer cette application:

1. **Augmenter la robustesse**:
   - Ajouter un prétraitement plus avancé pour centrer et normaliser les dessins
   - Implémenter l'augmentation de données côté client

2. **Améliorer l'expérience utilisateur**:
   - Ajouter une animation pendant le chargement du modèle
   - Permettre le dessin sur mobile (événements tactiles)
   - Ajouter un historique des prédictions

3. **Optimisations**:
   - Quantifier le modèle pour réduire sa taille
   - Utiliser la détection de changements pour prédire automatiquement après le dessin

## 10. Conclusion et perspectives

Dans ce notebook, nous avons:

- Compris l'architecture et le principe des réseaux convolutifs (CNN)
- Implémenté un CNN avec TensorFlow/Keras pour la reconnaissance d'images MNIST
- Visualisé et interprété les filtres et feature maps
- Analysé les performances du modèle et les cas d'erreur
- Exploré l'intégration d'un modèle CNN dans une application web

### Perspectives et extensions possibles

- **Améliorer le modèle**:
  - Expérimenter avec des architectures plus complexes (VGG, ResNet, etc.)
  - Utiliser des techniques d'augmentation de données pour améliorer la robustesse
  - Appliquer l'apprentissage par transfert

- **Applications à d'autres jeux de données**:
  - Fashion MNIST (vêtements)
  - CIFAR-10 (objets colorés)
  - ImageNet (classification à grande échelle)

- **Techniques avancées**:
  - Détection d'objets (YOLO, SSD)
  - Segmentation sémantique (U-Net)
  - Style transfer

Les réseaux de neurones convolutifs sont aujourd'hui la base de nombreuses applications de vision par ordinateur. La compréhension de leur fonctionnement est essentielle pour tout développeur souhaitant exploiter le potentiel de l'IA dans ce domaine.

## Exercices supplémentaires

1. Modifiez l'architecture du CNN pour améliorer sa précision (ajoutez des couches, modifiez les hyperparamètres)
2. Implémentez l'augmentation de données pour améliorer la robustesse du modèle
3. Testez le modèle sur vos propres dessins de chiffres
4. Adaptez ce notebook pour classifier le dataset Fashion MNIST
5. Créez une version web plus élaborée avec une interface utilisateur améliorée