# 👩‍💻 Activité 1 : réseaux de neurones convolutifs

<img src="https://cdn.pixabay.com/photo/2017/11/07/09/05/nerves-2926087_1280.jpg" alt="etoiles" width="400"/>

#### [Pierre-Loic BAYART](https://www.linkedin.com/in/pierreloicbayart/) - Formation développeur d'applications spécialisation data analyst - Webforce3 - Grenoble Ecole de Management

## 🔁 Révisions

> "Nous sommes ce que nous faisons à répétition. L’excellence n’est donc pas un acte mais une habitude."
> **Aristote**

### - A quoi sert la bibliothèque Keras ?
### - Qu'est-ce qu'une fonction d'activation ? 
### - Qu'est-ce qu'une fonction de perte ? 
### - Qu'est-ce que la couche de neurones d'entrée ? Par quoi est-elle définie ?
### - Qu'est-ce qu'une couche de neurones cachée ? Par quoi est-elle définie ?
### - Qu'est-ce que la couche de neurones de sortie ? Par quoi est-elle définie ?
### - Qu'est-ce qu'un optimiseur ? 
### - Qu'est-ce qu'une époque ? 
### - Qu'est-ce qu'un batch (lot) ?
### - Sous quelle forme est stockée une image en informatique ?
### - Qu'est-ce que l'encodage RGB (ou RVB en français) ?
### - Quels sont les différents formats d'images ?
### - Quelles sont les bibliothèques Python utiles pour manipuler des images ?
### - Si vous traitez des images couleur de résolution 3840 x 2160 (4K) avec un modèle de machine learning classique sans réduction de dimensions, comment y a-t-il des caractéristiques (features) à ce jeu de données d'images ?

## 🔍 Recherche d'informations

En recherchant sur le web, trouver les réponses aux questions suivantes :

### - A quoi servent les couches de neurones de convolution ?
___
Les **couches de convolution** permettent des détecter des **features** sur une image en faisant glisser un filtre sur l'image.
Illustration : [Convolutional Neural Networks](https://mukulrathi.com/demystifying-deep-learning/convolutional-neural-network-from-scratch/)

![Convolution](https://mukulrathi.com/aad8a78e265cb76c3b0ebe17a058b19c/conv-slide.gif)
___
### - A quoi servent les couches de neurones de pooling ?
___
Les **couches de pooling** sont en général placées **entre deux couches de convolution**. Elles permettent de **réduire la taille des images** en conservant les caractéristiques importantes.

Illustration : [Towards AI](https://pub.towardsai.net/introduction-to-pooling-layers-in-cnn-dafe61eabe34?gi=00ff04d9e8db)

![Pooling](https://miro.medium.com/max/1400/1*fXxDBsJ96FKEtMOa9vNgjA.gif)
___
### - A quoi servent les couches de neurones de dropout ?
___
Le **dropout** est une méthode qui permet de **réduire le surapprentissage** des réseaux de neurones. A **chaque époque**, un **déactive** une partie des neurones de manière **aléatoire**.

Illustration : [Medium](https://medium.com/@adityaraj_64455/it-all-started-with-cnns-alexnet-3023b21bb891)

![Dropout](https://miro.medium.com/max/1100/1*WPr205gm0CsQXGa0oltOew.gif)
___

## ✏️ Activités

### Détecter les chiffres sur une image sans couche de neurones de convolution

- Importer de la bibliothèque **Keras** le jeu de données [Fashion MNIST](https://keras.io/api/datasets/fashion_mnist/)

In [1]:
from tensorflow import keras
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

ModuleNotFoundError: No module named 'tensorflow'

In [None]:
fashion_mnist = keras.datasets.fashion_mnist
(X_train, y_train), (X_test, y_test) = fashion_mnist.load_data()

- **Analyser la taille** des jeux de données et le **type de données**

In [None]:
X_train.shape, X_test.shape

In [None]:
X_train.dtype

- Créer un jeu de données de **validation** à partir du jeu de données d'**entrainement**

In [None]:
X_valid, X_train = X_train[:5000], X_train[5000:]
y_valid, y_train = y_train[:5000], y_train[5000:]

- **Normer l'intensité des pixels** entre 0 et 1 pour les 3 jeux de données

In [None]:
X_train = X_train / 255.0
X_valid = X_valid / 255.0
X_test = X_test / 255.0

- Récupération des **étiquettes (labels)**

In [None]:
class_names = ["T-shirt", "Pantalon", "Pull-over", "Robe", "Manteau", "Sandales", "Chemise", "Baskets", "Sac", "Bottines"]

- Afficher la **classe** et l'**image** de la première donnée du jeu d'entrainement

In [None]:
class_names[y_train[0]]

In [None]:
plt.imshow(X_train[0])
plt.show()

- Créer un modèle **Keras séquentiel** avec l'architecture suivante :
    - Couche "Flatten" d'**entrée** en dimension **28x28**
    - Couche dense à **300 neurones** avec fonction d'activation **Relu**
    - Couche dense à **100 neurones** avec fonction d'activation **Relu**
    - Couche dense de **sortie** à **10 neurones** avec fonction d'activation **Softmax**

In [None]:
model = keras.models.Sequential([
    keras.layers.Flatten(input_shape=[28, 28]),
    keras.layers.Dense(300, activation="relu"),
    keras.layers.Dense(100, activation="relu"),
    keras.layers.Dense(10, activation="softmax"),
])

- Vérifier l'**architecture du modèle**

In [None]:
model.summary()

- **Compiler** le modèle avec comme **fonction de perte** "sparse_categorical_crossentropy", comme **optimiseur** "sgd" et comme **métrique** "accuracy"

In [None]:
model.compile(
    loss="sparse_categorical_crossentropy",
    optimizer="sgd",
    metrics=["accuracy"]
)

- **Entrainer** le modèle pour **50 époques** et afficher les **métriques de validation**. **Stocker le résultat** de l'entrainement dans une variable "history"

In [None]:
X_train.shape

In [None]:
history = model.fit(X_train, y_train, epochs=50, validation_data=(X_valid, y_valid))

- Afficher le **graphique de l'accuracy**

In [None]:
df = pd.DataFrame(history.history)
df.plot()
plt.gca().set_ylim(0, 1)
plt.show()

- Effectuer une **prédiction** sur les **3 premiers élèments** du jeu de test

In [None]:
model.predict(X_test[:3])

In [None]:
np.array(class_names)[np.argmax(model.predict(X_test[:3]), axis=1)]

In [None]:
np.array(class_names)[y_test[:3]]

In [None]:
plt.imshow(X_test[0])
plt.show()

In [None]:
plt.imshow(X_test[1])
plt.show()

In [None]:
plt.imshow(X_test[2])
plt.show()

### Détecter les chiffres sur une image avec des couches  de neurones de convolution

- Créer un modèle **Keras séquentiel** avec l'architecture suivante :
    - Couche de convolution "Conv2D" de dimension 64, de noyau 7, de padding "same" et de fonction d'activation "relu". Ajouter l'input shape des données d'entrée [28,28,1]
    - Couche de Maxpooling2D de noyau 2
    - 2 couches de convolution "Conv2D" de dimension 128, de noyau 3, de padding "same" et de fonction d'activation "relu"
    - Couche de Maxpooling2D de noyau 2
    - 2 couches de convolution "Conv2D" de dimension 256, de noyau 3, de padding "same" et de fonction d'activation "relu"
    - Couche de Maxpooling2D de noyau 2
    - Couche Flatten
    - Couche dense de 128 neurones avec une fonction d'activation "relu"
    - Couche de dropout à 0.5
    - Couche dense de 64 neurones avec une fonction d'activation "relu"
    - Couche de dropout à 0.5
    - Couche dense de 10 neurones avec une fonction d'activation "softmax"

In [None]:
model = keras.models.Sequential([
    keras.layers.Conv2D(64, 7, activation="relu", padding="same", input_shape=[28, 28, 1]),
    keras.layers.MaxPool2D(2),
    keras.layers.Conv2D(128, 3, activation="relu", padding="same"),
    keras.layers.Conv2D(128, 3, activation="relu", padding="same"),
    keras.layers.MaxPool2D(2),
    keras.layers.Conv2D(256, 3, activation="relu", padding="same"),
    keras.layers.Conv2D(256, 3, activation="relu", padding="same"),
    keras.layers.MaxPool2D(2),
    keras.layers.Flatten(),
    keras.layers.Dense(128, activation="relu"),
    keras.layers.Dropout(0.5),
    keras.layers.Dense(64, activation="relu"),
    keras.layers.Dropout(0.5),
    keras.layers.Dense(10, activation="softmax"),
])

- Vérifier l'**architecture du modèle**

In [None]:
model.summary()

- **Compiler** le modèle avec comme **fonction de perte** "sparse_categorical_crossentropy", comme **optimiseur** "sgd" et comme **métrique** "accuracy"

In [None]:
model.compile(
    loss="sparse_categorical_crossentropy",
    optimizer="sgd",
    metrics=["accuracy"]
)

- **Entrainer** le modèle pour **10 époques** et afficher les **métriques de validation**. **Stocker le résultat** de l'entrainement dans une variable "history"

In [None]:
history = model.fit(X_train, y_train, epochs=10, validation_data=(X_valid, y_valid))

- Afficher le **graphique de l'accuracy**

In [None]:
df = pd.DataFrame(history.history)
df.plot()
plt.gca().set_ylim(0, 1)
plt.show()

## 🚀 Pour aller plus loin

- [Build and Train a Convolutional Neural Network with TensorFlow's Keras API](https://www.youtube.com/watch?v=3V9YFPfgyAY)

___
*👨‍🏫 [Pierre-Loic BAYART](https://www.linkedin.com/in/pierreloicbayart/) - Formation développeur d'applications spécialisation data analyst - Webforce3 - Grenoble Ecole de Management*
___
Source images d'illustration : Image par Gerd Altmann de Pixabay