# MNIST : RdN - CNN

In [1]:
import numpy as np
import tensorflow as tf
from tensorflow.keras import layers, models
from keras.datasets import mnist
from tensorflow.keras.utils import to_categorical

In [2]:
# Load nos données 
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

In [3]:
# Préparer les données 
train_images = train_images.reshape((60000, 28, 28, 1)).astype('float32') / 255
test_images = test_images.reshape((10000, 28, 28, 1)).astype('float32') / 255

train_labels = to_categorical(train_labels, 10)
test_labels = to_categorical(test_labels, 10)

Un CNN typique comprend plusieurs types de couches :

**Couches de convolution** : Ces couches utilisent un ensemble de filtres qui effectuent une opération de convolution sur l'entrée pour extraire des caractéristiques. Chaque filtre produit une **carte d'activation** qui réagit à la présence de caractéristiques spécifiques à un emplacement donné dans l'entrée.

```python
layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
```

**Couches de pooling** (sous-échantillonnage) : Après la convolution, les couches de pooling sont utilisées pour réduire les dimensions spatiales des cartes d'activation. = aide à rendre le modèle plus robuste aux variations de position des caractéristiques dans les entrées et réduit la quantité de calculs nécessaires.

```python
layers.MaxPooling2D((2, 2))
```

Couches entièrement connectées : Après plusieurs couches de convolution et de pooling, les cartes d'activation sont aplaties en un vecteur et passées à une ou plusieurs couches entièrement connectées (similaires à celles des MLP) pour la classification ou la régression.

```python
layers.Flatten(),
    layers.Dense(64, activation='relu'),
    layers.Dense(10, activation='softmax')
```

Avantages :
- Invariance spatiale : Grâce aux couches de pooling, les CNN sont capables de détecter des caractéristiques indépendamment de leur position dans l'entrée, ce qui est crucial pour des tâches comme la reconnaissance d'objets.
- Excellente performance : Sur des tâches de vision par ordinateur et autres tâches similaires, les CNN surpassent souvent les autres types de réseaux de neurones et sont le choix standard pour la détection et la reconnaissance d'objets, la segmentation d'images, etc.

In [4]:
# On built le modèle CNN
model = models.Sequential([
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.Flatten(),
    layers.Dense(64, activation='relu'),
    layers.Dense(10, activation='softmax')
])

In [5]:
# Compile the model
model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])


In [6]:
model.fit(train_images, train_labels, epochs=5, batch_size=64)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x293afec70>

In [7]:
# Tester le modèle
test_loss, test_acc = model.evaluate(test_images, test_labels)
print("Test accuracy:", test_acc)

Test accuracy: 0.9925000071525574


# Pour télécharger le modèle : (voir fichier TrainedModel.ipynb pour utilisation)

In [8]:
model.save('cnn_model_mnist.model3')

INFO:tensorflow:Assets written to: cnn_model_mnist.model2/assets


INFO:tensorflow:Assets written to: cnn_model_mnist.model2/assets
