# Reconnaissance d'objets dans les images avec CNN (Réseaux de neurones convolutifs)
## Dataset CIFAR-10
Objectif c'est de <b>reconnaitre</b> des objets dans les images en utilisant <b>CNN</b> et le Dataset <b>CIFAR-10</b>

In [None]:
from IPython.display import Image
Image(filename = "cifar10.png", width=400, height=200)

: 

## 1. Installation et Configuration de TensorFlow

### 1.1. Installaion de TensorFlow

In [None]:
#!pip install -q tensorflow

### 1.2. Installer TensorFlow pour CPU

In [None]:
#!pip install tensorflow-cpu

### 1.3. Installer TensorFlow pour GPU

In [None]:
#!pip install -q tensorflow-gpu
#_____________Ou____________
!pip install -q tensorflow[and-cuda]

### 1.4. Version TensorFlow

In [None]:
import tensorflow as tf
print(tf.__version__)

### 1.5. Autres packages

In [None]:
import pandas as pd
import numpy as np #Manipuler le Dataset comme matrice
import matplotlib.pyplot as plt #Visualiser Les données

## 2. Data Preprocessing
### 2.1. CIFAR-10 - Object Recognition in Images
Dataset <b>CIFAR-10</b> : contient 60 000 images de <b>10 classes d'objets</b> (avions, voitures, oiseaux, chats, cerfs, chiens, grenouilles, chevaux, navires et camions). La répartition entre chaque classes est égale (6 000 images pour chaque classe). Les images sont en couleurs, mais en basse résolution (32x32 pixels)

### 2.1.1. Import CIFAR-10 from Kaggel:
https://www.kaggle.com/c/cifar-10/

### 2.1.2. Import CIFAR-10 from tensorflow:

In [None]:
from tensorflow.keras.datasets import cifar10

### 2.1.3. Charger le Dataset cifar10

In [None]:
(x_train, y_train), (x_test, y_test) = cifar10.load_data()

### 2.1.4. Comment peut-on voir les images dans le dataset?

In [None]:
#nbr des images d'entrainement = 50 000
#nbr des images de test = 10 000
len(x_train), len(x_test)

In [None]:
#dimenssion de x_train
x_train.shape

<b>50000</b> images d'<b>entraînement</b> et <b>10000</b> images de test
Les images sont de taille <b>32x32</b> et ont <b>3</b> canaux de couleur <b>(Red, Green, Blue)</b>.

Chaque <b>ligne</b> du tableau <b>x_train</b> stocke une image couleur 32x32. Les <b>1024 premières</b> entrées contiennent les valeurs du canal <b>rouge</b>, les <b>1024 suivantes</b> les valeurs <b>vertes</b> et les <b>1024 dernières</b> les valeurs <b>bleues</b>. L'image est stockée dans l'<b>ordre</b> des lignes principales, de sorte que les <b>32 premières entrées</b> du tableau sont les valeurs du canal <b>rouge</b> de la première <b>ligne</b> de l'image.

In [None]:
Image(filename = "imgMatrix.png", width=800, height=400)

In [None]:
#couleurs entre 0 et 255
x_train.max(), x_train.min()

La plages des couleurs est comprise entre <b>0</b> et <b>255</b>

### 2.1.5. Noms des classes du Dataset

Il y a <b>10 classes</b> des d'objets

In [None]:
y_train.max(), y_train.min()

In [None]:
#Les noms des classes
class_names = ['0: airplane', '1: automobile', '2: bird', '3: cat', '4: deer', 
               '5: dog', '6: frog', '7: horse', '8: ship', '9: truck']
class_names

### 2.1.6. Normalisation des données
Les <b>pixels</b> de l'image sont dans une plage de <b>0 à 255</b>, et nous devons <b>réduire</b> ces valeurs à une valeur comprise entre <b>0 et 1</b>.

In [None]:
# Normalisation des images
x_train = x_train / 255
x_test = x_test / 255

In [None]:
#Valeur comprise entre 0 et 1
x_train.max(), x_train.min()

### 2.1.7. Visualisation des images

In [None]:
# image de la ligne 1
plt.imshow(x_train[1])

In [None]:
# classe de l'image de la ligne 1
y_train[1]

In [None]:
class_names

#### classe 9 -> truck

In [None]:
# visualiser 25 premières images
fig, ax = plt.subplots(5, 5)
img = 0
for i in range(5):
    for j in range(5):
        ax[i][j].imshow(x_train[img])
        img += 1
plt.show()

## 3. CNN (Réseaux de Noreunes Convolutif)

### 3.1. Définition de l'objet

In [None]:
model = tf.keras.models.Sequential()

### 3.2. Construire le modèle
1- Nous allons utiliser un <b>CNN</b> pour entraîner le <b>modèle</b>,<br>
2- Cela comprend l'utilisation d'une couche de <b>convolution</b>, qui est la couche <b>Conv2d</b>,<br> 
3- Ainsi que des méthodes de <b>regroupement (pooling)</b> et de <b>normalisation</b>,<br>
4- Enfin, nous le passerons dans une <b>couche dense</b> et la couche <b>dense finale</b> qui est notre couche de <b>sortie</b>, <br>
5- Nous utilisons la fonction d'activation <b>relu</b>,<br> 
6- La couche de sortie utilise la fonction d'activation <b>softmax</b>.

### 3.3. Ajout de la première couche Conv2D

In [None]:
# 1) filters (kernel) = 32
# 2) kernal size = 3
# 3) padding = same
# 4) activation = ReLU
# 5) input shape = (32, 32, 3)
model.add(tf.keras.layers.Conv2D(filters=32, kernel_size=3, padding='same', activation='relu', input_shape = [32, 32, 3]))
#model.add(tf.keras.layers.Conv2D(filters=32, kernel_size=3, padding='same', activation='relu'))

In [None]:
#Architecture AlexNet
Image(filename = "alexnet.png", width=1000, height=2000)

### 3.4. Padding
<b>Padding : </b> est une technique utilisée par <b>CNN</b> pour préserver les dimensions spatiales des données d'entrée et éviter la perte d'informations sur les bords de l'image.<br>
Il consiste à <b>ajouter</b> des <b>lignes</b> et/ou des <b>colonnes</b> de pixels supplémentaires autour des bords des données d'entrée <b>avant convolution</b>.

In [None]:
Image(filename = "padding0.png", width=200, height=400)

In [None]:
Image(filename = "SVpadding.gif", width=300, height=600)

#### 3.4.1. Same Padding
#### On ne perd pas des infos

In [None]:
Image(filename = "padding1.png", width=400, height=800)

In [None]:
Image(filename = "padding2.png", width=400, height=800)

#### 3.4.2. Valid Padding
#### On perd des infos

In [None]:
Image(filename = "padding3.png", width=400, height=800)

### 3.5. Ajout de la deuxième couche Conv2D

In [None]:
# 1) filters (kernel) = 32
# 2) kernal size = 3
# 3) padding = same
# 4) activation = ReLU
model.add(tf.keras.layers.Conv2D(filters=32, kernel_size=3, padding='same', activation='relu'))

### 3.6. Ajout de la 3ème couche maxpool

<b>Pooling</b> : utilisées pour réduire les dimensions des <b>features</b>.</br>
La technique la plus utilisée est <b>Max Pool</b> : permettant de sélectionner l'élément <b>maximal</b> de la région du <b>feature</b> couverte par le <b>filtre</b>.<br>
Il existe une autre technique <b>Average Pool</b>

In [None]:
#Max Pool
Image(filename = "pooling.png", width=400, height=800)

In [None]:
#Average Pool
Image(filename = "pooling2.png", width=400, height=800)

In [None]:
# maxpool layer parameters,
# 1) pool size = 2
# 2) strides = 2
# 3) padding = valid

model.add(tf.keras.layers.MaxPool2D(pool_size=2, strides=2, padding='valid'))

### 3.7. Ajout de la 4ème couche Conv2D

In [None]:
# 1) filters (kernel) = 64
# 2) kernal size = 3
# 3) padding = same
# 4) activation = ReLU

model.add(tf.keras.layers.Conv2D(filters=64, kernel_size=3, padding='same', activation='relu'))

### 3.8. Ajout de la 5ème couche Conv2D et la 6ème couche maxpool

In [None]:
# 1) filters (kernel) = 64
# 2) kernal size = 3
# 3) padding = same
# 4) activation = ReLU

model.add(tf.keras.layers.Conv2D(filters=64, kernel_size=3, padding='same', activation='relu'))

# maxpool layer parameters,
# 1) pool size = 2
# 2) strides = 2
# 3) padding = valid

model.add(tf.keras.layers.MaxPool2D(pool_size=2, strides=2, padding='valid'))

### 3.9 Dropout:
L’<b>overfitting</b> est un problème fréquent lors de l’entraînement d’un <b>modèle de Deep Learning.</b><br>
Pour résoudre ce type de problème on utilise la technique de <b>Dropout.</b><br>
C’est une méthode de <b>Regularization</b> : qui permet à la fois d’<b>optimiser l’apprentissage</b> d’un modèle de Deep Learning et de <b>contrer l’overfitting.</b><br>
<b>Dropout :</b>c'est la <b>suppression de neurones</b> dans les couches d’un modèle de Deep Learning.<br>
On <b>désactive temporairement</b> certains neurones dans le réseau, ainsi que <b>toutes ses connexions</b> entrantes et sortantes :

In [None]:
Image(filename = "dropoutnet.png", width=500, height=250) 

Le choix des <b>neurones à désactiver est aléatoire</b>. On attribue une <b>probabilité p</b> à tous les neurones qui détermine leur activation.<br>
Lorsque <b>p = 0.1</b>, chaque neurone a une chance sur <b>10 d’être désactivé</b>.

In [None]:
# Adding the dropout layer
model.add(tf.keras.layers.Dropout(0.1))

### 3.10. Flattening layer
La couche <b>Flattening layer</b> est utilisée pour convertir une sortie <b>multidimensionnelle</b> de la couche précédente en un <b>vecteur unidimensionnel</b>

In [None]:
# Adding the Flattening layer
model.add(tf.keras.layers.Flatten())

### 3.11. Dense layer
La <b>couche dense</b> reçoit des entrées de tous les neurones précédents. Il forme donc une couche dense. Cette couche représente la <b>multiplication de vecteurs de matrice</b>.<br>
Les couches denses bien adaptées à des tâches telles que la <b>classification d'images</b>, où l'entrée est une image de <b>grande dimension</b> et la sortie est une <b>prédiction</b> de la <b>classe</b> de l'objet dans l'image.

In [None]:
# Adding first dense layer
model.add(tf.keras.layers.Dense(units=128, activation='relu'))

# Adding second dense layer (output layer)
#units=10 --> classes
model.add(tf.keras.layers.Dense(units=10, activation='softmax')) #couche de sortie

### 3.12 Résumé du CNN

In [None]:
model.summary()

## 4. Entrainement de CNN
### 4.1. Compiler le CNN

In [None]:
#loss = loss function
#optimizer = optimiser loss function
#metrics = accuracy du CNN
model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['sparse_categorical_accuracy'])

### 4.2. Entrainer le CNN

In [None]:
model.fit(x_train, y_train, batch_size=10, epochs=10)

## <font color="red"> Remarque : <font>
Pour obtenir une <font color="red"><b>meilleur accuracy</b></font> on peut changer les paramètres comme : <b>epochs</b>, <b>nbr de cnn layers</b>, <b>nbr de maxpool layers</b> et la <b>probabilité de droupout layer</b>

## 5. Evaluation la pérformance du CNN

In [None]:
test_loss, test_acc = model.evaluate(x_test, y_test)

In [None]:
print('Test Accuracy est : ', test_acc)

## 6. Prediction

In [None]:
#y_pred = model.predict_classes(x_test)
#y_pred = (model.predict(x_test) > 0.5).astype("int32")
#y_pred = model.predict(x_test)
y_pred = np.argmax(model.predict(x_test),axis=1)

### 6.1. Prediction d'une image individuelle

In [None]:
print(y_pred[2]), print(y_test[2]) #image 2

In [None]:
print(y_pred[50]), print(y_test[50]) #image 50
#...

### 6.2. Matrice de confusion 
La <b>matrice de confusion</b> (ou matrice d'<b>erreur</b>) est une méthode qui permet de visualiser les <b>résultats</b> d'un algorithme de <b>classification</b>.

#### 6.2.1. Comment interpréter une matrice de confusion

In [None]:
#Classification binaire
Image(filename = "cmb.png", width=400, height=400)

In [None]:
#Classification multiple
Image(filename = "cmm.png", width=400, height=400)

In [None]:
#Affichage de la matrice de confusion
from sklearn.metrics import confusion_matrix, accuracy_score
cm = confusion_matrix(y_test, y_pred)
print(cm)

#### 6.2.2. Calcule de l'accuracy

In [None]:
acc_cm = accuracy_score(y_test, y_pred)
print(acc_cm)

In [None]:
#Calcule de l'accuracy avec la matrice de confusion
Image(filename = "cmba.png", width=400, height=400)

In [None]:
np.sum(cm[i,i] for i in range(10))/np.sum(cm)

### 7. <font color = "red">Learning Curve ---> Après</font>