# CNN (Convolutional Neural Network) avec *tf.keras*

Dans ce notebook, nous allons créer des réseaux de neurones pour classifier les images du jeu de données [CIFAR10 small image classification](https://keras.io/datasets/)

**Objectifs**
- Dans un premier temps, nous chargerons les données et nous les préparerons.
- Puis nous implémenterons un réseau fully connected
- Enfin, nous comparerons avec une implémentation CNN
- Et pour finir, nous optimiserons le CNN.

#◢ Import & Vérification des versions des librairies

In [None]:
%matplotlib inline
%tensorflow_version 2.x

In [None]:
import tensorflow as tf
from tensorflow import keras  # tf.keras
import sys
import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt

#◢ Chargement du jeu de données CIFAR10 small image classification

Keras permet de charger de nombreux datasets avec `keras.datasets`.
Nous utiliserons le jeu de données CIFAR10 small image classification, qui est une base de données de 60000 images regroupant 10 catégories d'images ("avion","voiture", "oiseau","chat","cerf","chien","grenouille","cheval","bateau","camion").

Elle regroupe 50000 images d'apprentissage et 10000 images de test
Ces images sont en couleur et de 32 pixels de côté.

In [None]:
classes = [
    "avion",
    "voiture", 
    "oiseau",
    "chat",
    "cerf",
    "chien",
    "grenouille",
    "cheval",
    "bateau",
    "camion"
]

Chargez le jeu de données en utilisant `keras.datasets.cifar10.load_data()`
Séparez le en :
- un jeu d'entrainement de 45000 images
- un jeu de validation de 5000 images
- un jeu de test de 10000 images

In [None]:
cifar10 = keras.datasets.cifar10
(X_train_full, y_train_full), (X_test, y_test) = cifar10.load_data()

# TODO : Compléter
X_valid, X_train = X_train_full[XXX], X_train_full[XXX]
y_valid, y_train = y_train_full[XXX], y_train_full[XXX]

#◢ Pré-Processing
Réduisez les valeurs des pixels entre 0 et 1.

In [None]:
X_train = X_train / 255
X_valid = X_valid / 255
X_test = X_test / 255


Affichez quelques images en utilisant la fonction de la librairie matplot `plt.imshow()` et affichez la classe. 

In [None]:
plt.figure(figsize=(25, 25))
n_rows, n_cols = 10, 5
for row in range(n_rows):
    for col in range(n_cols):
        i = row * n_cols + col
        plt.subplot(n_rows, n_cols, i + 1)
        plt.imshow(X_train[i])
        plt.xlabel(classes[y_train[i][0]], fontsize=30)
plt.tight_layout()
plt.show()

#◢ Construction d'un modèle Fully Connected

Construction d'un modèle avec l'API `keras.models.Sequential`, sans aucun argument, et avec 5 couches:
  * Une couche `Flatten` (`keras.layers.Flatten`) pour convertir chaque image de taille 32x32x3 image en un simple tableau de 3072 pixels. Comme cette couche est la première de votre modèle, vous devez spécifier l'argument `input_shape`.
  * Trois couche `Dense` (`keras.layers.Dense`) avec 64 neurones (également appelés units), et la fonction d'activation `"relu"`.
  * Pour finir une couche `Dense` avec 10 neurones (1 par classe), et avec la fonction d'activation `"softmax"` pour s'assurer que la somme de toutes les probabilités des classes estimées pour chaque image est égale à 1.

In [None]:
# TODO : Compléter
model = keras.models.Sequential([
      XXX                           
])

Compilez le modèle en utilisant :
- la fonction loss `sparse_categorical_crossentropy`
- l'optimizer `keras.optimizers.SGD` avec un `learning rate` à 0.01
- la métrique `accuracy`

In [None]:
# TODO : Compléter
model.compile(XXX)

Entrainez le modèle avec 20 epochs.
Utilisez les données de validation

In [None]:
# TODO : Compléter
history = model.fit(XXX)

Affichez le graphe d'apprentissage du modèle

In [None]:
pd.DataFrame(history.history).plot()
plt.axis([0, 19, 0, 2])
plt.show()

Nous voyons sur cette courbe que le modèle atteint une accuracy d'environ 45% et que l'accuracy sur le jeu de validation a tendance à osciller (manque de généralisation du modèle).

Avant d'essayer de construire un modèle avec une architecture CNN,appelons la méthode `summary()` sur le modèle afin de noter le nombre de paramètres entrainables.

In [None]:
# TODO : Compléter
model.XXX

#◢ Construction d'un modèle CNN

Construction d'un modèle CNN avec l'API `keras.models.Sequential`:
- **la phase de feature learning** : Construisons 3 blocs VGG de type conv2D(filters=32) >> conv2D(filters=32) >> MaxPool2D (pool_size=2) >> conv2D(filters=64) >> conv2D(filters=64) >> MaxPool2D(pool_size=2) >> conv2D(filters=128) >> conv2D(filters=128) >> MaxPool2D(pool_size=2) <br>
Pour chaque couche `conv2D`, la `taille du kernel` est de `3`, le `padding` est à `same` et la `fonction d'activation` est `relu`
- **la phase de classification**  : flatten >> dense (128 units + relu) >> Dense (10 units + softmax)

Compilez le modèle en utilisant :
- la fonction loss `sparse_categorical_crossentropy`
- l'optimizer `keras.optimizers.SGD` avec un `learning rate` à 0.01
- la métrique `accuracy`

Entrainez le modèle avec 20 epochs. Utilisez les données de validation

In [None]:
# TODO : Compléter
model = keras.models.Sequential([
    XXX
])

model.compile(XXX)

history = model.fit(XXX)

In [None]:
pd.DataFrame(history.history).plot()
plt.axis([0, 19, 0, 2])
plt.show()

Nous notons que le modèle est instable et a tendance à overfiter. pour celà, que diriez-vous de modifier le learning rate (essayer 0.1 et 0.05). 

Si cela ne suffit pas, rajoutez une couche de dropout de 0.2 juste après chaque bloc VGG. (un bloc VGG étant conv2D >> conv2D >> MaxPool2D).

## Que remarquez-vous lors de l'entrainement du modèle ?

Appelez la méthode `summary()` sur le modèle

In [None]:
# TODO : Compléter
model.XXX

Comparez le nombre de paramètres entre le réseau fully connected et le CNN

#◢  Prédiction
Appelez la méthode `predict()` sur le modèle afin d'estimer la probabilité de chaque classe pour chaque instance (pour une meilleure lisibilité, utilisez la méthode `round()` sur les probabilités générées):

In [None]:
y_proba = model.predict(X_test)
y_proba[:10].round(3)

A partir des probabilités des différentes valeurs, déduisons-en la valeur prédite (celle qui a le % maximum => utilisez la fonction `argmax`)

In [None]:
y_pred = y_proba.argmax(axis=1)
y_pred

#◢ Visualisation des prédictions 

Méthodes utilitaires pour afficher une image et un bar chart représentant la probabilité des prédictions pour chaque chiffre de 0 à 9 (les prédictions en bleu sont les prédictions correctes et en rouge celles incorrectes)

In [None]:
def plot_prediction_image(predictions_array, true_label, img):

    plt.imshow(img, cmap=plt.cm.binary)

    predicted_label = np.argmax(predictions_array)
    if predicted_label == true_label:
        color = 'blue'
    else:
        color = 'red'

    plt.xlabel("Objet prédit {} {:2.0f}% ({})".format(classes[predicted_label],
                                                        np.max(predictions_array) *100,
                                                        classes[true_label[0]]),
                                                        color=color)
    
def plot_prediction_bar_chart(predictions_array, true_label, img):
    thisplot = plt.bar(classes, predictions_array, color="#777777")
    plt.ylim([0, 1])
    plt.grid(False)
    predicted_label = np.argmax(predictions_array)
    thisplot[predicted_label].set_color('red')
    thisplot[true_label[0]].set_color('blue')
    plt.xticks(classes, rotation=90)

Affichage de l'image à prédire et de la probabilité des prédictions pour chaque chiffre de 0 à 9 pour la première image

In [None]:
i = 1
plt.figure(figsize=(6,3))
plt.subplot(1,2,1)
plot_prediction_image(y_proba[i], y_test[i], X_test[i])
plt.subplot(1,2,2)
plot_prediction_bar_chart(y_proba[i], y_test[i], X_test[i])
plt.show()

## Affichons les 15 premières images et visualisons les prédictions 

In [None]:
num_rows = 5
num_cols = 3
plt.figure(figsize=(5*num_cols, 3*num_rows))
for row in range(num_rows):
    for col in range(num_cols):
        index = num_cols * row + col
        plt.subplot(num_rows, 2*num_cols, 2*index+1)
        plot_prediction_image(y_proba[index], y_test[index], X_test[index])
        plt.subplot(num_rows, 2*num_cols, 2*index+2)
        plot_prediction_bar_chart(y_proba[index], y_test[index], X_test[index])
plt.tight_layout()
plt.show()



## Focus sur les images mal prédites

In [None]:
y_test2 = y_test.reshape((1,-1))[0]

In [None]:
y_proba_false = y_proba[y_pred != y_test2]
y_test_false = y_test[y_pred != y_test2]
X_test_false = X_test[y_pred != y_test2]

In [None]:
num_rows = 5
num_cols = 3
plt.figure(figsize=(5*num_cols, 3*num_rows))
for row in range(num_rows):
    for col in range(num_cols):
        index = num_cols * row + col
        plt.subplot(num_rows, 2*num_cols, 2*index+1)
        plot_prediction_image(y_proba_false[index], y_test_false[index], X_test_false[index])
        plt.subplot(num_rows, 2*num_cols, 2*index+2)
        plot_prediction_bar_chart(y_proba_false[index], y_test_false[index], X_test_false[index])
plt.tight_layout()
plt.show()