# Convolutional neural network (CNN)

üöÄ D√©collage
Imaginez que vous √™tes un robot super intelligent qui a √©t√© envoy√© sur une mission pour comprendre les images. Votre outil principal pour cette mission est un r√©seau de neurones convolutif, ou CNN.

üß† Le cerveau du robot
Un CNN est comme le cerveau du robot. Il est compos√© de plusieurs couches de neurones, chacune ayant une t√¢che sp√©cifique. Les premi√®res couches sont responsables de la d√©tection des caract√©ristiques de base comme les lignes et les courbes, tandis que les couches plus profondes sont capables de reconna√Ætre des formes plus complexes comme les visages ou les objets.

## Explication

### Couches de convolution

Les couches de convolution sont le bloc de construction principal d‚Äôun CNN. L‚Äôobjectif de ces couches est de d√©tecter diff√©rents types de caract√©ristiques dans les images qui sont entr√©es dans le r√©seau. Chaque neurone dans une couche de convolution est connect√© √† une petite r√©gion de l‚Äôimage d‚Äôentr√©e. Un filtre (ou un noyau) est appliqu√© √† cette r√©gion pour obtenir une valeur unique dans la carte des caract√©ristiques de sortie.


### Couches de pooling

Les couches de pooling servent principalement √† r√©duire la quantit√© de param√®tres et de calculs dans le r√©seau. Cela se fait en r√©duisant la dimensionnalit√© de chaque carte de caract√©ristiques tout en conservant les informations les plus importantes. Il existe plusieurs types de pooling, comme le max pooling, le min pooling et le mean pooling.


### Couches enti√®rement connect√©es

Apr√®s plusieurs couches de convolution et de pooling, les cartes de caract√©ristiques de haute dimension sont aplaties en un vecteur avant de passer par une ou plusieurs couches enti√®rement connect√©es. Ces couches fonctionnent de la m√™me mani√®re que dans un r√©seau de neurones artificiels traditionnel, o√π chaque neurone est connect√© √† tous les neurones de la couche pr√©c√©dente. La derni√®re couche enti√®rement connect√©e utilise une fonction d‚Äôactivation softmax pour produire une distribution de probabilit√©s pour les classes de sortie.


### Fonction d‚Äôactivation ReLU

La fonction d‚Äôactivation ReLU (Rectified Linear Unit) est la plus couramment utilis√©e dans les CNN. Elle est d√©finie comme $f(x)=max(0,x)$
, ce qui signifie qu‚Äôelle passe simplement les valeurs positives et met √† z√©ro les valeurs n√©gatives. Cela ajoute la non-lin√©arit√© n√©cessaire qui permet au r√©seau d‚Äôapprendre √† partir de donn√©es plus complexes.


### Backpropagation et optimisation

Comme pour les autres types de r√©seaux de neurones, les CNN utilisent la r√©tropropagation pour la mise √† jour des poids. C‚Äôest un algorithme qui ajuste les poids du r√©seau en fonction de l‚Äôerreur obtenue √† la sortie. L‚Äôoptimisation, telle que la descente de gradient stochastique (SGD), est utilis√©e pour minimiser l‚Äôerreur en ajustant les poids du r√©seau.


## Exemple de code
Voici un exemple simple de CNN avec PyTorch et TensorFlow.


### PyTorch


In [9]:

import torch.nn as nn
import torch.nn.functional as F

class SimpleCNN(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.pool = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1, 16 * 5 * 5)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x


### Tensorflow


In [7]:
import tensorflow as tf
from tensorflow.keras import layers, models

class SimpleCNN(models.Model):
    def __init__(self):
        super().__init__()
        self.conv1 = layers.Conv2D(6, (5, 5), activation='relu', padding='same', input_shape=(32, 32, 3))
        self.pool = layers.MaxPooling2D((2, 2), strides=2)
        self.conv2 = layers.Conv2D(16, (5, 5), activation='relu', padding='same')
        self.flatten = layers.Flatten()
        self.fc1 = layers.Dense(120, activation='relu')
        self.fc2 = layers.Dense(84, activation='relu')
        self.fc3 = layers.Dense(10)

    def call(self, x):
        x = self.pool(self.conv1(x))
        x = self.pool(self.conv2(x))
        x = self.flatten(x)
        x = self.fc1(x)
        x = self.fc2(x)
        x = self.fc3(x)
        return x




Notez que dans TensorFlow, nous utilisons la fonction d‚Äôactivation ReLU directement dans la couche de convolution, contrairement √† PyTorch o√π nous l‚Äôappliquons dans la fonction forward. 

## Quand utiliser des CNN ? 

Les CNN sont principalement utilis√©s dans le domaine de la vision par ordinateur. Voici quelques exemples d‚Äôapplications :

*Reconnaissance d‚Äôimages* : Les CNN sont souvent utilis√©s pour classer les images dans diff√©rentes cat√©gories.
D√©tection d‚Äôobjets : Les CNN peuvent √™tre utilis√©s pour identifier les objets dans une image et localiser o√π ils se trouvent.

*Segmentation s√©mantique* : Les CNN peuvent √™tre utilis√©s pour classer chaque pixel d‚Äôune image, ce qui est utile pour comprendre exactement o√π se trouvent les objets.

*Reconnaissance faciale* : Les CNN sont couramment utilis√©s pour identifier les visages dans les images.
J‚Äôesp√®re que cela vous aide √† comprendre les r√©seaux de neurones convolutifs. Si vous avez d‚Äôautres questions, n‚Äôh√©sitez pas √† demander !