# Réseau neuronal convolutif (CNN)

Cet exercice illustre la formation d'un réseau de neurones convolutifs (CNN) pour classer les images CIFAR. On utilise l'API séquentielle Keras. La création et la formation de votre modèle ne prendront que quelques lignes de code.

In [None]:
import tensorflow as tf

from tensorflow.keras import datasets, layers, models
import matplotlib.pyplot as plt

### Télécharger et préparer le jeu de données CIFAR10

L'ensemble de données CIFAR10 contient 60 000 images couleur dans 10 classes, avec 6 000 images dans chaque classe. L'ensemble de données est divisé en 50 000 images d'entraînement et 10 000 images de test. 

In [None]:
(train_images, train_labels), (test_images, test_labels) = datasets.cifar10.load_data()

# Normalize pixel values to be between 0 and 1
train_images, test_images = train_images / 255.0, test_images / 255.0

### Vérifier les données

Pour vérifier que l'ensemble de données semble correct, traçons les 25 premières images de l'ensemble d'apprentissage et affichons le nom de la classe sous chaque image :

In [None]:
class_names = ['airplane', 'automobile', 'bird', 'cat', 'deer',
               'dog', 'frog', 'horse', 'ship', 'truck']

plt.figure(figsize=(10,10))
for i in range(25):
    plt.subplot(5,5,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(train_images[i])
    # The CIFAR labels happen to be arrays, 
    # which is why you need the extra index
    plt.xlabel(class_names[train_labels[i][0]])
plt.show()

### Créer la base convolutive
Les 6 lignes de code ci-dessous définissent la base convolutive en utilisant un modèle commun : une pile de couches Conv2D et MaxPooling2D .

En entrée, un CNN prend des tenseurs de forme (image_height, image_width, color_channels), en ignorant la taille du lot. Si vous débutez avec ces dimensions, color_channels fait référence à (R,G,B). Dans cet exemple, vous allez configurer votre CNN pour traiter les entrées de forme (32, 32, 3), qui est le format des images CIFAR. Vous pouvez le faire en passant l'argument input_shape à votre première couche.

[Documentation de la classe Sequential](https://keras.io/api/models/sequential/)

In [None]:
model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))

**Instructions**: Affichez l'architecture de votre modèle jusqu'à présent.
Utilisez pour cela la méthode `.summary()``


In [None]:
# Code ici

### Ajouter des couches denses sur le dessus
Pour compléter le modèle, vous allez alimenter le dernier tenseur de sortie de la base convolutive (de forme (4, 4, 64)) dans une couche dense pour effectuer la classification. 

Les couches denses prennent des vecteurs en entrée (qui sont 1D), tandis que la sortie actuelle est un tenseur 3D. 

* Tout d'abord, vous allez aplatir (ou dérouler) la sortie 3D en 1D, puis 
* ajouter un calques Dense par-dessus. 
* CIFAR a 10 classes de sortie, vous utilisez donc une couche Dense finale avec 10 sorties.

In [None]:
model.add(layers.Flatten())
model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(10))

In [None]:
model.summary()

Le résumé du réseau montre que (4, 4, 64) les sorties ont été aplaties en vecteurs de forme (1024) avant de passer par deux couches Dense.

### Compiler et entraîner le modèle

**Notes**

> [Documentation pour les fonctions de cout](https://keras.io/api/losses/probabilistic_losses/#categoricalcrossentropy-class)


**QUESTIONS**

Quelle est la taille par défaut d'un Batch (i.e., nombre d'échantillons par mise-à-jour du gradient) lorsqu'on entraine le modèle? ([Model.fit(...)](https://keras.io/api/models/model_training_apis/)) 

Pour 50000 images d'entrainement (pour chaque Epoch), combien de fois mettons à jour les gradients?

In [None]:
model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

history = model.fit(train_images, train_labels, epochs=10, 
                    validation_data=(test_images, test_labels))

### Évaluer le modèle

Visualisez l'évolution de l'Accuracy en fonction des Epoch

In [None]:
plt.plot(history.history['accuracy'], label='accuracy')
plt.plot(history.history['val_accuracy'], label = 'val_accuracy')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.ylim([0.5, 1])
plt.legend(loc='lower right')

test_loss, test_acc = model.evaluate(test_images,  test_labels, verbose=2)

**Instructions**

Visualisez l'évolution de la foction de perte en fonction des Epoch

In [None]:
## CODE ICI

**QUESTIONS**

Qu'observez-vous?

Essayez d'entrainer le modèle plus longtemps (augmentez le nombre d'Epoch)

Que se passe-t-il si on entraine trop longtemps le modèle?


### Analyse des Erreurs de Classification
#### Matrice de Confusion Multi-Classes

**Instruction**: Créer la [matrice de confusion multi-classes](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.confusion_matrix.html)

In [None]:
from sklearn.metrics import confusion_matrix, classification_report
import numpy as np
import seaborn as sns

#Prédire les classes pour les images de test
predictions = model.predict(test_images)
predicted_classes = np.argmax(predictions, axis=1)
true_classes = test_labels.reshape(-1)

# Créer la matrice de confusion
## CODE ICI
conf_matrix = None

# Afficher la matrice de confusion sous forme de heatmap
plt.figure(figsize=(12, 10))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues', 
            xticklabels=class_names, yticklabels=class_names)
plt.xlabel('Prédictions')
plt.ylabel('Vraies classes')
plt.title('Matrice de confusion')
plt.savefig('matrice_confusion.png', dpi=300, bbox_inches='tight')
plt.show()

**Instruction:** Créez et affichez le [rapport de classification](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.classification_report.html) incluant le Précision, le Rappel et le F1-Score pour chacune des 10 classes

In [None]:
# Afficher quelques métriques supplémentaires (Précision, Rappel, F1-score)
print("Rapport de classification :\n")
## CODE ICI

# Analyser les erreurs de classification
# Identifier les exemples mal classés
misclassified_indices = np.where(predicted_classes != true_classes)[0]

# Sélectionner un échantillon aléatoire d'exemples mal classés
sample_size = min(25, len(misclassified_indices))
sample_indices = np.random.choice(misclassified_indices, sample_size, replace=False)

# Afficher les exemples mal classés
plt.figure(figsize=(12, 12))
for i, idx in enumerate(sample_indices):
    plt.subplot(5, 5, i + 1)
    plt.imshow(test_images[idx])
    plt.title(f"Vraie: {class_names[true_classes[idx]]}\nPrédite: {class_names[predicted_classes[idx]]}")
    plt.axis('off')
plt.tight_layout()
plt.savefig('erreurs_classification.png', dpi=300, bbox_inches='tight')
plt.show()

# Calculer les taux d'erreur par classe
error_rates = []
for i in range(10):
    class_indices = np.where(true_classes == i)[0]
    class_errors = np.sum(predicted_classes[class_indices] != i)
    error_rate = class_errors / len(class_indices)
    error_rates.append(error_rate)

# Afficher les taux d'erreur par classe
plt.figure(figsize=(12, 6))
bars = plt.bar(class_names, error_rates, color='salmon')
plt.xlabel('Classes')
plt.ylabel('Taux d\'erreur')
plt.title('Taux d\'erreur par classe')
plt.xticks(rotation=45)

# Ajouter les valeurs sur les barres
for bar in bars:
    height = bar.get_height()
    plt.text(bar.get_x() + bar.get_width()/2., height + 0.01,
             f'{height:.2f}', ha='center', va='bottom')

plt.tight_layout()
plt.savefig('taux_erreur_par_classe.png', dpi=300, bbox_inches='tight')
plt.show()

# Analyser les confusions les plus fréquentes
confusion_pairs = []
for i in range(10):
    for j in range(10):
        if i != j:
            confusion_pairs.append((i, j, conf_matrix[i, j]))

# Trier par nombre de confusions (du plus grand au plus petit)
confusion_pairs.sort(key=lambda x: x[2], reverse=True)

# Afficher les 10 confusions les plus fréquentes
print("\nLes 10 confusions les plus fréquentes :")
for true_class, pred_class, count in confusion_pairs[:10]:
    print(f"Vraie classe: {class_names[true_class]}, Prédite comme: {class_names[pred_class]}, Nombre: {count}")


### Améliorations techniques possibles
1. **Architecture plus profonde**: Ajout de couches supplémentaires pour capturer des caractéristiques plus complexes
2. **Dropout**: Désactive aléatoirement des neurones pour réduire le surapprentissage
3. **Augmentation de données**: Rotation, zoom, décalage et retournement horizontal pour améliorer la généralisation
4. **Optimisation des hyperparamètres**:
   - Taille de batch optimisée (64)
   - Taux d'apprentissage

## Références
[Convolutional Neural Network (CNN)](https://www.tensorflow.org/tutorials/images/cnn)

[Computer Vision - TenserFlow Tutorials](https://www.tensorflow.org/tutorials/images)