# 📘 Exercice N°3 : Réseaux de Neurones Convolutionnels

Les réseaux de neurones convolutionnels (CNN) classiques sont généralement composés :
- de couches de **convolution** (souvent suivies de ReLU),
- de **max pooling** pour réduire les dimensions spatiales,
- d’une **agrégation finale** spatiale (souvent vers 1×1×C),
- suivies de **couches fully-connected** (linéaires).

---

## ✅ 1. Taille de sortie d’une couche de convolution

**Données :**
- Entrée de taille `(x × y × z)`
- Filtre de taille `k × k`
- Padding `p`
- Stride `s`

**Formule pour la sortie spatiale** :

- Hauteur_sortie = ⎣ (x + 2p − k) / s ⎦ + 1
- Largeur_sortie = ⎣ (y + 2p − k) / s ⎦ + 1


**Profondeur de sortie** = nombre de **filtres** appliqués (ici : 1 filtre → sortie `H × W × 1`)

**Exemple :**
- Entrée : `28 × 28 × 3`
- Filtre : `k=3`, `p=1`, `s=1`

Résultat :
Hauteur_sortie = (28 + 2×1 − 3)/1 + 1 = 28
Largeur_sortie = 28
→ Sortie : 28 × 28 × 1


---

## ✅ 2. Nombre de paramètres à apprendre

**Un filtre apprend** :
- `k × k × z` poids
- + `1` biais

**Formule** :
Paramètres = k × k × z + 1


---

## ✅ 3. Comparaison avec une couche fully-connected

Si on voulait produire la **même sortie** avec une **couche dense (fully-connected)** :

- Taille de l’entrée : `x × y × z`
- Taille de la sortie : `H × W × 1`

**Formule** :
Paramètres = (x × y × z) × (H × W) + biais


**Exemple :**
- Entrée : `28 × 28 × 3 = 2352`
- Sortie : `28 × 28 × 1 = 784`
2352 × 784 = 1 842 048 paramètres (+784 biais)



🔍 **Comparaison :**
- Convolution : **28** paramètres
- Fully-connected : **~1.8M** paramètres

---

## ✅ 4. Intérêt du Max Pooling

Le **Max Pooling** (souvent `2×2`, `stride 2`) permet :

- 🔻 Réduction de la **taille spatiale** → moins de calculs, moins de mémoire
- 💪 Robustesse aux **petites translations**
- ✂️ Réduction du **surapprentissage** (moins de paramètres)
- 🔍 Extraction des **caractéristiques dominantes**


---

## ✅ 5. Implémentation d’un réseau convolutif simple (PyTorch)

In [4]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense

# Initialisation du modèle
model = Sequential()

# Première couche convolutive : 16 filtres, kernel 3x3, activation ReLU
model.add(Conv2D(16, kernel_size=(3, 3), activation='relu', input_shape=(28, 28, 1)))

# Première couche de max pooling : réduit la taille à 14x14
model.add(MaxPooling2D(pool_size=(2, 2)))

# Deuxième couche convolutive : 32 filtres, kernel 3x3, activation ReLU
model.add(Conv2D(32, kernel_size=(3, 3), activation='relu'))

# Deuxième couche de max pooling : réduit la taille à 6x6
model.add(MaxPooling2D(pool_size=(2, 2)))

# Aplatissement des tenseurs 3D en vecteur 1D pour les couches denses
model.add(Flatten())

# Couche dense intermédiaire : 64 neurones
model.add(Dense(64, activation='relu'))

# Deuxième couche dense : 32 neurones
model.add(Dense(32, activation='relu'))

# Couche de sortie : 10 classes, softmax pour classification
model.add(Dense(10, activation='softmax'))

# Affichage du résumé du modèle
model.summary()


## 🧠 Résumé des avantages des convolutions vs fully-connected :

| Caractéristique      | Convolutionnelle | Fully-connected |
| -------------------- | ---------------- | --------------- |
| Nombre de paramètres | Faible           | Très élevé      |
| Invariance spatiale  | Oui (locale)     | Non             |
| Préserve spatialité  | Oui              | Non (vecteur)   |
| Partage des poids    | Oui              | Non             |
