# Cnn

In [4]:
from tensorflow.keras.layers import Conv2D
from tensorflow.keras.layers import MaxPooling2D

## Introduction convolution

[Video de presentation](https://www.loom.com/share/ab551e4390f84636917b363d66085e59)

## Convolution

Expliquer ce qu'est une convolution 2D en traitement d'image et le resultat d'une telle opération sur une image

La convolution 2D en traitement d'image est une opération mathématique qui consiste à appliquer un filtre (aussi appelé noyau ou kernel) sur une image pour en extraire des caractéristiques ou effectuer certaines transformations. Le filtre est une petite matrice de nombres qui se "déplace" sur l'image d'entrée. Pour chaque position du filtre, on effectue le produit terme à terme entre le filtre et la portion de l'image qu'il recouvre, puis on somme ces produits pour obtenir une valeur unique. Cette valeur est inscrite dans une nouvelle image de sortie, à la position correspondante du centre du filtre.

Résultat d'une telle opération sur une image :

Extraction de caractéristiques : La convolution peut être utilisée pour extraire des caractéristiques spécifiques d'une image, comme les bords, les textures ou les motifs. Le type de caractéristique extrait dépend de la nature du filtre utilisé.

Filtrage : Les convolutions peuvent appliquer divers types de filtrage sur une image, comme le lissage (réduction du bruit) ou le renforcement des bords (détection des contours).

Transformation : Outre le filtrage et l'extraction de caractéristiques, la convolution peut également être utilisée pour appliquer des transformations géométriques ou des effets spéciaux à une image.

En résumé, la convolution 2D est un outil puissant en traitement d'image, permettant de modifier ou d'analyser des images de manière significative. Dans le contexte des réseaux de neurones convolutifs (CNN), les convolutions jouent un rôle clé dans l'apprentissage automatique des caractéristiques pertinentes à partir des données visuelles.

## Couche Convolutionnelle

Les réseaux de neurones convolutionnels comportent deux parties : la première qui contient les couches convolutionnelles et la seconde qui est composées de couches Denses. 

Le code ci-dessous permet de créer une couche convolutionnelle, néanmoins la taille de la convolution est trop grande.

De plus, il contient un bug. 

Modifier le code pour que la taille soit de 3x3 et qu'il fonctionne

In [7]:
conv = Conv2D(10, kernel_size=(3, 3), activation="relu")

## Couche Convolutionnelle - stride

Les réseaux de neurones convolutionnels comportent deux parties : la première qui contient les couches convolutionnelles et la seconde qui est composées de couches Denses. 

Créer une couche convolutionnelle qui contient 30 neurones, un kernel_size de (3, 3) et un strides de 2x2

In [6]:
conv = Conv2D(30, kernel_size=(3, 3), strides=(2, 2), activation="relu")

## Couche de pooling

La partie convolutionnelle d'un réseau peut contenir ce qu'on appelle des couches de Pooling qui permettent de réduire la taille des images. 

Créer une couche une couche de Max pooling 2D avec comme argument pool_size = (3,3)

In [5]:
max_pool = MaxPooling2D(pool_size=(3, 3))

## Pooling

En faisant des recherches si besoin, expliquer ce que fait une couche de pooling.

Expliquer les avantages et les inconvénients d'utiliser le Pooling

Une couche de pooling dans un réseau de neurones convolutionnel (CNN) réduit la dimensionnalité spatiale (largeur et hauteur) des cartes de caractéristiques entrantes, tout en conservant les informations les plus importantes. Le pooling est généralement appliqué après une ou plusieurs couches de convolution.

Fonctionnement :

Max Pooling : Sélectionne la valeur maximale d'une région spécifiée (par exemple, un carré 2x2) dans la carte de caractéristiques.
Average Pooling : Calcule la moyenne de toutes les valeurs dans la région spécifiée de la carte de caractéristiques.
Avantages :

Réduction de la dimensionnalité : Diminue le nombre de paramètres et de calculs dans le réseau, ce qui réduit le risque de surapprentissage et améliore l'efficacité computationnelle.
Invariance à la translation : Aide le modèle à reconnaître des objets dans l'image indépendamment de leur position en conservant les caractéristiques dominantes.
Contrôle de l'overfitting : En réduisant la complexité du modèle, le pooling peut aider à prévenir l'overfitting.
Inconvénients :

Perte d'informations : Le pooling peut entraîner une perte d'informations fines, car il résume les caractéristiques de grandes régions en une seule valeur (max ou moyenne).
Moins de précision spatiale : En réduisant la résolution spatiale, il peut être plus difficile pour le réseau de détecter des objets de petite taille ou des détails fins.
Choix fixe : Le choix du type de pooling (max ou average) et de la taille de la région de pooling est fixe et peut ne pas être optimal pour toutes les applications ou toutes les parties de l'image.
En résumé, les couches de pooling sont un composant essentiel des CNNs pour réduire la complexité et améliorer l'efficacité, mais elles doivent être utilisées judicieusement pour équilibrer entre la réduction de dimensionnalité et la conservation des informations importantes.

## Preprocesser la data
Les couches convolutionnelles 2D  on besoin de Tenseur 4D ! 

La première dimension représente toujours le nombre d'exemples

La seconde et la troisième représentent les dimensions de l'image

La quatrième représente le nombre de cannaux (1 pour noir et blanc, 3 pour les couleurs)

Il y a quatre tableaux numpy chargés dans votre environnement:

x_train et x_test (images) et y_train et y_test (labels correspondants aux chiffres affichées par les images)

1. Afficher la taille de x_train et x_test

2. Avec la méthode reshape, modifier la taille de x_train et x_test pour que toutes les images passe d'une taille (28, 28) à (28, 28, 1)

In [12]:
# Modifier directement la taille de x_train et x_test
import numpy as np

# Créer un tableau x_test de taille (30, 28, 28)
x_test = np.random.rand(30, 28, 28)

# Créer un tableau x_train de taille (200, 28, 28)
x_train = np.random.rand(200, 28, 28)

x_train = x_train.reshape(x_train.shape[0], 28, 28, 1)
x_test = x_test.reshape(x_test.shape[0], 28, 28, 1)

# Afficher les tailles après modification pour vérification
print("Taille de x_train après redimensionnement:", x_train.shape)
print("Taille de x_test après redimensionnement:", x_test.shape)

Taille de x_train après redimensionnement: (200, 28, 28, 1)
Taille de x_test après redimensionnement: (30, 28, 28, 1)


## Créer le modèle CNN

Avec Keras créer un réseau de neurones avec les couches suivantes : 

Convolution avec filters=8 et kernel_size=(3, 3)
Flatten
Dense avec 10 neurones et une  activation softmax
Spécifier l'argument input_shape en supposant qu'on a des images en noir et blanc de taille 28 par 28

In [13]:
from keras.models import Sequential
from keras.layers import Conv2D, Flatten, Dense

# Création du modèle CNN
model = Sequential([
    # Couche de convolution
    Conv2D(filters=8, kernel_size=(3, 3), activation='relu', input_shape=(28, 28, 1)),
    # Aplatir les données pour la couche dense
    Flatten(),
    # Couche dense avec 10 neurones et activation softmax
    Dense(10, activation='softmax')
])

# Afficher le résumé du modèle
model.summary()

  super().__init__(


## Compiler le modèle

On a créé un réseau de neurone convolutionnel qui est stocké dans la variable   model

Compilez le avec l'optimiseur Adam, la fonction de coût sparse_categorical_crossentropy et la métrique accuracy. Il faudra mettre la métrique accuracy dans une liste (en effet Keras peut accepter plusieurs métriques)

In [17]:
# Compiler le modèle
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

## Entraîner le modèle

On a chargé un CNN dans la variable model et on l'a compilé.

Les variables model, x_train, x_test, y_train et y_test sont toutes chargées dans votre environnement.

Entrainez le modèle avec 6 époques (epoch). 


Keras permet également de mesurer régulièrement les performances du modèle sur un jeu de test au cours de l'entraînement. Faire ensorte que ça soit le cas. Pour cela vous devrez utiliser l'argument validation_data (cf : https://www.tensorflow.org/api_docs/python/tf/keras/Model)

In [18]:
import numpy as np

y_train = np.random.rand(200, 10)
y_test = np.random.rand(30, 10)

# Entraîner le modèle
history = model.fit(x_train, y_train, epochs=6, validation_data=(x_test, y_test))

Epoch 1/6


ValueError: Argument `output` must have rank (ndim) `target.ndim - 1`. Received: target.shape=(None, 10), output.shape=(None, 10)

## Différence couche Dense et Convolutionnelle

Expliquer la différence entre une couche Dense et convolutionnelle

GitHub Copilot
Les couches Dense et convolutionnelles sont deux types de couches utilisées dans les réseaux de neurones, mais elles servent des objectifs différents et fonctionnent de manière distincte :

Couche Dense (Fully Connected) : Dans une couche dense, chaque neurone est connecté à tous les neurones de la couche précédente. Cela signifie que l'information de l'entrée est traitée globalement. Les couches denses sont souvent utilisées pour apprendre des patterns non spatiaux dans les données ou pour la classification finale dans un réseau de neurones. Elles nécessitent que les données d'entrée soient de forme vectorielle (1D).

Couche Convolutionnelle : Les couches convolutionnelles appliquent un filtre (ou noyau) sur l'entrée pour créer une carte des caractéristiques (feature map), en préservant la structure spatiale des données. Cela les rend particulièrement adaptées pour traiter des données avec une forte corrélation spatiale, comme les images. Les couches convolutionnelles permettent de détecter des caractéristiques locales (comme les bords dans une image) en appliquant le même filtre sur différentes parties de l'entrée, ce qui les rend également efficaces en termes de nombre de paramètres à apprendre.

En résumé, la principale différence réside dans le fait que les couches convolutionnelles traitent les données de manière locale et spatiale, ce qui est idéal pour les données d'image, tandis que les couches denses traitent les données de manière globale, sans tenir compte de la structure spatiale, ce qui les rend plus adaptées pour la classification ou pour traiter des données déjà transformées en vecteurs.

## (Todo) Viz des métriques sur donnéees d'entrainement et de validation