# Les réseaux convolutionnels

Réseau inspiré de http://yann.lecun.com/exdb/publis/pdf/lecun-98.pdf

## 1. Importation des librairies

In [7]:
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf

from tensorflow.keras.models import  Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout

## pour que les résultats soient reproductibles
#from numpy.random import seed
#seed(1)
#from tensorflow import set_random_seed
#set_random_seed(1)

## 2. Chargement et conditionnement des données d'apprentissage

Chargement et normalisation des données

In [8]:
mnist = tf.keras.datasets.mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()
train_images = train_images / 255.0

Pour les CNN : On rajoute une dimension pour spécifier qu'il s'agit d'imgages en NdG

In [9]:
train_images = train_images.reshape(60000,28,28,1)
test_images = test_images.reshape(10000,28,28,1)

One hot encoding

In [10]:
train_labels = tf.keras.utils.to_categorical(train_labels)
test_labels = tf.keras.utils.to_categorical(test_labels)

## 3. Architecture du réseau 

Concevoir un réseau inspiré LeNet5 http://yann.lecun.com/exdb/publis/pdf/lecun-98.pdf
![LeNet5](https://miro.medium.com/max/2000/1*1TI1aGBZ4dybR6__DI9dzA.png)


La structure globale sera conservée (nombre de couches, nombre de neurones par couche…) mais dans cette version :
- Les couches de convolution sont totalement connectées
- La sortie est une couche fully connected (FC) classique 
- La fonction de coût est l’entropie croisée


In [15]:
mnist_model = tf.keras.models.Sequential()

# CONV_1: add CONV layer with RELU activation and depth = 6 kernels
mnist_model.add(Conv2D(6, kernel_size=(5, 5), padding='same',activation='relu',input_shape=(28,28,1)))
# POOL_1: downsample the image to choose the best features 
mnist_model.add(MaxPooling2D(pool_size=(2, 2)))

# CONV_2: here we increase the depth to 16
mnist_model.add(Conv2D(16, (5, 5), activation='relu'))
# POOL_2: more downsampling
mnist_model.add(MaxPooling2D(pool_size=(2, 2)))

# flatten since too many dimensions, we only want a classification output
mnist_model.add(Flatten())

# FC_1: fully connected to get all relevant data
mnist_model.add(Dense(120, activation='relu'))

# FC_2: fully connected to get all relevant data
mnist_model.add(Dense(84, activation='relu'))

# FC_3: output a softmax to squash the matrix into output probabilities for the 10 classes
mnist_model.add(Dense(10, activation='softmax'))

# expliquer le nombre de paramètre de ce réseau
print(mnist_model.summary())

Model: "sequential_5"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d_6 (Conv2D)           (None, 28, 28, 6)         156       
                                                                 
 max_pooling2d_6 (MaxPooling  (None, 14, 14, 6)        0         
 2D)                                                             
                                                                 
 conv2d_7 (Conv2D)           (None, 10, 10, 16)        2416      
                                                                 
 max_pooling2d_7 (MaxPooling  (None, 5, 5, 16)         0         
 2D)                                                             
                                                                 
 flatten_3 (Flatten)         (None, 400)               0         
                                                                 
 dense_9 (Dense)             (None, 120)              

In [16]:
optim ='adam'

mnist_model.compile(loss='categorical_crossentropy', optimizer=optim, metrics=['accuracy'])

## 4. Apprentissage du réseau

In [17]:
mnist_model.fit(train_images, train_labels, epochs=10, 
                    validation_data=(test_images, test_labels))

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x1f74707eb80>

## 5. Evaluation du modèle sur la base de test

In [18]:
test_loss, test_acc = mnist_model.evaluate(test_images, test_labels)
print('Test accuracy:', test_acc)

Test accuracy: 0.9830999970436096


## 6. Visualisation des filtres appris prar me réseau

Compléter la fonction de visualisation des filtres suivante :

In [19]:
def displayConvFilers(model, layer_name, nb_filter=4, filter_size=(3,3), num_channel=0, fig_size=(2,2)):
    '''
    model : le réseau de neurone dont on souhaite visualiser les filtres
    nb_filter : le nombre de filtre que l'on souhaite visualiser
    filter size : la taille des filtres de la couche
    num_channel : le numéro du canal que l'on souaite visualiser 
    fig_size : les dimensions de la figure. Doivent être en cohérence avec nb_filter
    '''
    ...


Appeler deux fois la fonction pour afficher des filtres de la première couche et des filtres de la deuxième couche de convolution

In [None]:
displayConvFilers(...)

displayConvFilers(...)