# Convolutional neural network (CNN)

🚀 Décollage
Imaginez que vous êtes un robot super intelligent qui a été envoyé sur une mission pour comprendre les images. Votre outil principal pour cette mission est un réseau de neurones convolutif, ou CNN.

🧠 Le cerveau du robot
Un CNN est comme le cerveau du robot. Il est composé de plusieurs couches de neurones, chacune ayant une tâche spécifique. Les premières couches sont responsables de la détection des caractéristiques de base comme les lignes et les courbes, tandis que les couches plus profondes sont capables de reconnaître des formes plus complexes comme les visages ou les objets.

## Explication

### Couches de convolution

Les couches de convolution sont le bloc de construction principal d’un CNN. L’objectif de ces couches est de détecter différents types de caractéristiques dans les images qui sont entrées dans le réseau. Chaque neurone dans une couche de convolution est connecté à une petite région de l’image d’entrée. Un filtre (ou un noyau) est appliqué à cette région pour obtenir une valeur unique dans la carte des caractéristiques de sortie.


### Couches de pooling

Les couches de pooling servent principalement à réduire la quantité de paramètres et de calculs dans le réseau. Cela se fait en réduisant la dimensionnalité de chaque carte de caractéristiques tout en conservant les informations les plus importantes. Il existe plusieurs types de pooling, comme le max pooling, le min pooling et le mean pooling.


### Couches entièrement connectées

Après plusieurs couches de convolution et de pooling, les cartes de caractéristiques de haute dimension sont aplaties en un vecteur avant de passer par une ou plusieurs couches entièrement connectées. Ces couches fonctionnent de la même manière que dans un réseau de neurones artificiels traditionnel, où chaque neurone est connecté à tous les neurones de la couche précédente. La dernière couche entièrement connectée utilise une fonction d’activation softmax pour produire une distribution de probabilités pour les classes de sortie.


### Fonction d’activation ReLU

La fonction d’activation ReLU (Rectified Linear Unit) est la plus couramment utilisée dans les CNN. Elle est définie comme $f(x)=max(0,x)$
, ce qui signifie qu’elle passe simplement les valeurs positives et met à zéro les valeurs négatives. Cela ajoute la non-linéarité nécessaire qui permet au réseau d’apprendre à partir de données plus complexes.


### Backpropagation et optimisation

Comme pour les autres types de réseaux de neurones, les CNN utilisent la rétropropagation pour la mise à jour des poids. C’est un algorithme qui ajuste les poids du réseau en fonction de l’erreur obtenue à la sortie. L’optimisation, telle que la descente de gradient stochastique (SGD), est utilisée pour minimiser l’erreur en ajustant les poids du réseau.


## Exemple de code
Voici un exemple simple de CNN avec PyTorch et TensorFlow.


### PyTorch


In [9]:

import torch.nn as nn
import torch.nn.functional as F

class SimpleCNN(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.pool = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1, 16 * 5 * 5)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x


### Tensorflow


In [7]:
import tensorflow as tf
from tensorflow.keras import layers, models

class SimpleCNN(models.Model):
    def __init__(self):
        super().__init__()
        self.conv1 = layers.Conv2D(6, (5, 5), activation='relu', padding='same', input_shape=(32, 32, 3))
        self.pool = layers.MaxPooling2D((2, 2), strides=2)
        self.conv2 = layers.Conv2D(16, (5, 5), activation='relu', padding='same')
        self.flatten = layers.Flatten()
        self.fc1 = layers.Dense(120, activation='relu')
        self.fc2 = layers.Dense(84, activation='relu')
        self.fc3 = layers.Dense(10)

    def call(self, x):
        x = self.pool(self.conv1(x))
        x = self.pool(self.conv2(x))
        x = self.flatten(x)
        x = self.fc1(x)
        x = self.fc2(x)
        x = self.fc3(x)
        return x




Notez que dans TensorFlow, nous utilisons la fonction d’activation ReLU directement dans la couche de convolution, contrairement à PyTorch où nous l’appliquons dans la fonction forward. 

## Quand utiliser des CNN ? 

Les CNN sont principalement utilisés dans le domaine de la vision par ordinateur. Voici quelques exemples d’applications :

*Reconnaissance d’images* : Les CNN sont souvent utilisés pour classer les images dans différentes catégories.
Détection d’objets : Les CNN peuvent être utilisés pour identifier les objets dans une image et localiser où ils se trouvent.

*Segmentation sémantique* : Les CNN peuvent être utilisés pour classer chaque pixel d’une image, ce qui est utile pour comprendre exactement où se trouvent les objets.

*Reconnaissance faciale* : Les CNN sont couramment utilisés pour identifier les visages dans les images.
J’espère que cela vous aide à comprendre les réseaux de neurones convolutifs. Si vous avez d’autres questions, n’hésitez pas à demander !