# Module Deep Learning - Formation Complète

## Plateforme IA-Solution RDC

---

### 🎯 Objectifs du module

À la fin de ce module, vous serez capable de :
- Comprendre ce qu'est le Deep Learning et ses différences avec le ML classique
- Maîtriser les réseaux de neurones artificiels (architecture, fonctionnement)
- Implémenter des réseaux avec TensorFlow et PyTorch
- Résoudre des problèmes de classification et régression
- Appliquer le Deep Learning à des cas concrets en RDC

**Niveau :** Intermédiaire  
**Prérequis :** Python, bases de Machine Learning  
**Durée :** 10 semaines

---

## 📚 Table des matières

1. [Introduction au Deep Learning](#chapitre-1)
2. [Réseaux de neurones artificiels](#chapitre-2)
3. [Entraînement d'un réseau](#chapitre-3)
4. [TensorFlow et PyTorch](#chapitre-4)
5. [Problèmes et solutions](#chapitre-5)
6. [Projet final : Classification de fruits](#chapitre-6)

---

# Chapitre 1 : Introduction au Deep Learning <a id="chapitre-1"></a>

## 1.1 Qu'est-ce que le Deep Learning ?

Le **Deep Learning** (apprentissage profond) est une branche du Machine Learning qui utilise des **réseaux de neurones artificiels** avec plusieurs couches pour apprendre des représentations complexes des données.

### Analogie simple

Imaginez que vous apprenez à un enfant à reconnaître des fruits :
- **Machine Learning classique** : Vous lui donnez des règles précises ("si c'est jaune et allongé, c'est une banane")
- **Deep Learning** : Vous lui montrez des milliers d'images de fruits, et il apprend lui-même les caractéristiques importantes

### Différences avec le ML classique

| Aspect | ML Classique | Deep Learning |
|--------|--------------|---------------|
| **Extraction de features** | Manuelle | Automatique |
| **Quantité de données** | Petite à moyenne | Grande |
| **Puissance de calcul** | Modérée | Élevée (GPU) |
| **Interprétabilité** | Élevée | Faible (boîte noire) |
| **Performance** | Bonne | Excellente (données suffisantes) |

### Applications en RDC

#### 🏥 **Santé**
- Diagnostic médical par imagerie (rayons X, échographies)
- Détection précoce du paludisme sur images microscopiques
- Prédiction d'épidémies (Ebola, COVID-19)

#### 🌾 **Agriculture**
- Détection de maladies des plantes (manioc, maïs)
- Estimation des rendements par images satellites
- Classification des sols

#### 💰 **Commerce**
- Reconnaissance de produits pour e-commerce
- Détection de fraudes bancaires
- Recommandation de produits

#### 📚 **Éducation**
- Correction automatique de copies
- Chatbots éducatifs en français/lingala
- Analyse de performances des étudiants

In [None]:
# Installation des bibliothèques nécessaires
# Exécuter cette cellule une seule fois

!pip install tensorflow numpy matplotlib scikit-learn -q

print("✅ Bibliothèques installées avec succès !")

In [None]:
# Imports nécessaires
import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf
from tensorflow import keras
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# Configuration
np.random.seed(42)
tf.random.set_seed(42)

print(f"TensorFlow version: {tf.__version__}")
print(f"NumPy version: {np.__version__}")

---

# Chapitre 2 : Réseaux de neurones artificiels <a id="chapitre-2"></a>

## 2.1 Le neurone artificiel

Un **neurone artificiel** est l'unité de base d'un réseau de neurones. Il s'inspire du neurone biologique.

### Composants d'un neurone

1. **Entrées (x₁, x₂, ..., xₙ)** : Les données d'entrée
2. **Poids (w₁, w₂, ..., wₙ)** : Importance de chaque entrée
3. **Biais (b)** : Valeur ajoutée pour ajuster la sortie
4. **Fonction d'activation (f)** : Transforme la somme pondérée

### Formule mathématique

```
z = (x₁ × w₁) + (x₂ × w₂) + ... + (xₙ × wₙ) + b
y = f(z)
```

Où :
- **z** = somme pondérée
- **y** = sortie du neurone
- **f** = fonction d'activation

### Fonctions d'activation courantes

| Fonction | Formule | Usage |
|----------|---------|-------|
| **Sigmoid** | σ(z) = 1 / (1 + e⁻ᶻ) | Classification binaire |
| **ReLU** | f(z) = max(0, z) | Couches cachées (le plus courant) |
| **Tanh** | tanh(z) = (eᶻ - e⁻ᶻ) / (eᶻ + e⁻ᶻ) | Couches cachées |
| **Softmax** | σ(z)ᵢ = eᶻⁱ / Σeᶻʲ | Classification multi-classes |

In [None]:
# Visualisation des fonctions d'activation

def sigmoid(z):
    return 1 / (1 + np.exp(-z))

def relu(z):
    return np.maximum(0, z)

def tanh(z):
    return np.tanh(z)

# Créer les données
z = np.linspace(-5, 5, 100)

# Créer les graphiques
fig, axes = plt.subplots(1, 3, figsize=(15, 4))

# Sigmoid
axes[0].plot(z, sigmoid(z), 'b-', linewidth=2)
axes[0].set_title('Sigmoid', fontsize=14, fontweight='bold')
axes[0].grid(True, alpha=0.3)
axes[0].axhline(y=0, color='k', linewidth=0.5)
axes[0].axvline(x=0, color='k', linewidth=0.5)

# ReLU
axes[1].plot(z, relu(z), 'r-', linewidth=2)
axes[1].set_title('ReLU', fontsize=14, fontweight='bold')
axes[1].grid(True, alpha=0.3)
axes[1].axhline(y=0, color='k', linewidth=0.5)
axes[1].axvline(x=0, color='k', linewidth=0.5)

# Tanh
axes[2].plot(z, tanh(z), 'g-', linewidth=2)
axes[2].set_title('Tanh', fontsize=14, fontweight='bold')
axes[2].grid(True, alpha=0.3)
axes[2].axhline(y=0, color='k', linewidth=0.5)
axes[2].axvline(x=0, color='k', linewidth=0.5)

plt.tight_layout()
plt.show()

## 2.2 Architecture d'un réseau de neurones

Un réseau de neurones est composé de plusieurs **couches** :

1. **Couche d'entrée** : Reçoit les données
2. **Couches cachées** : Effectuent les calculs (peuvent être multiples)
3. **Couche de sortie** : Produit la prédiction

### Exemple : Classification de fruits

```
Entrée (4 features)     Couche cachée (8 neurones)     Sortie (3 classes)
    [Couleur]  ────────────────────────────────────────  [Banane]
    [Forme]    ────────────────────────────────────────  [Mangue]
    [Taille]   ────────────────────────────────────────  [Ananas]
    [Texture]  ────────────────────────────────────────
```

In [None]:
# Exemple simple : Perceptron pour classification binaire
# Problème : Prédire si un patient a le paludisme (0 = Non, 1 = Oui)

# Données synthétiques : [Température, Fatigue, Maux de tête]
X = np.array([
    [37.0, 2, 1],  # Pas de paludisme
    [39.5, 8, 9],  # Paludisme
    [38.2, 5, 4],  # Pas de paludisme
    [40.1, 9, 10], # Paludisme
    [37.5, 3, 2],  # Pas de paludisme
    [39.8, 9, 8],  # Paludisme
    [36.8, 1, 1],  # Pas de paludisme
    [40.5, 10, 9], # Paludisme
])

y = np.array([0, 1, 0, 1, 0, 1, 0, 1])  # Labels

print("Données d'entraînement:")
print("Features (Température, Fatigue, Maux de tête):")
print(X)
print("\nLabels (0=Sain, 1=Paludisme):")
print(y)

In [None]:
# Créer un perceptron simple avec TensorFlow

# Normaliser les données
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Créer le modèle
model = keras.Sequential([
    keras.layers.Dense(1, activation='sigmoid', input_shape=(3,))
])

# Compiler le modèle
model.compile(
    optimizer='adam',
    loss='binary_crossentropy',
    metrics=['accuracy']
)

# Afficher l'architecture
model.summary()

In [None]:
# Entraîner le modèle
history = model.fit(
    X_scaled, y,
    epochs=100,
    verbose=0
)

# Évaluer
loss, accuracy = model.evaluate(X_scaled, y, verbose=0)
print(f"\n✅ Précision du modèle: {accuracy * 100:.2f}%")

# Faire des prédictions
predictions = model.predict(X_scaled, verbose=0)
print("\nPrédictions:")
for i, pred in enumerate(predictions):
    print(f"Patient {i+1}: {pred[0]:.4f} → {'Paludisme' if pred[0] > 0.5 else 'Sain'}")

### 🎯 Exercice 1 : Créer votre premier neurone

Créez un perceptron pour prédire si un étudiant va réussir son examen.

**Données :**
- Entrées : [Heures d'étude, Présence en classe (%), Note précédente]
- Sortie : 0 = Échec, 1 = Réussite

In [None]:
# Exercice 1 : À vous de jouer !

# Données
X_etudiants = np.array([
    [2, 60, 8],   # Échec
    [8, 95, 15],  # Réussite
    [5, 75, 12],  # Réussite
    [1, 50, 6],   # Échec
    [7, 90, 14],  # Réussite
    [3, 65, 9],   # Échec
])

y_etudiants = np.array([0, 1, 1, 0, 1, 0])

# TODO: Créez et entraînez votre modèle ici



---

# Chapitre 3 : Entraînement d'un réseau <a id="chapitre-3"></a>

## 3.1 Propagation avant (Forward Propagation)

C'est le processus où les données traversent le réseau de l'entrée vers la sortie.

**Étapes :**
1. Les données entrent dans la couche d'entrée
2. Chaque neurone calcule sa sortie
3. Les sorties deviennent les entrées de la couche suivante
4. On obtient la prédiction finale

## 3.2 Fonction de perte (Loss Function)

La fonction de perte mesure l'**erreur** entre la prédiction et la vraie valeur.

### Fonctions de perte courantes

| Fonction | Usage | Formule |
|----------|-------|----------|
| **Binary Crossentropy** | Classification binaire | -[y log(ŷ) + (1-y) log(1-ŷ)] |
| **Categorical Crossentropy** | Classification multi-classes | -Σ yᵢ log(ŷᵢ) |
| **MSE** | Régression | (y - ŷ)² |

## 3.3 Backpropagation

C'est l'algorithme qui permet d'**ajuster les poids** pour réduire l'erreur.

**Analogie simple :**
Imaginez que vous apprenez à lancer une balle dans un panier :
1. Vous lancez (propagation avant)
2. Vous ratez (fonction de perte)
3. Vous ajustez votre geste (backpropagation)
4. Vous relancez (nouvelle itération)

**Processus :**
1. Calculer l'erreur de sortie
2. Propager l'erreur vers l'arrière
3. Calculer les gradients (dérivées)
4. Mettre à jour les poids : `w_nouveau = w_ancien - α × gradient`

Où **α** (alpha) est le **taux d'apprentissage** (learning rate).

In [None]:
# Exemple : Visualiser l'entraînement

# Créer des données synthétiques (classification binaire)
np.random.seed(42)
n_samples = 200

# Classe 0 : Produits locaux bon marché
X_classe0 = np.random.randn(n_samples // 2, 2) + np.array([2, 2])
# Classe 1 : Produits importés chers
X_classe1 = np.random.randn(n_samples // 2, 2) + np.array([5, 5])

X_train = np.vstack([X_classe0, X_classe1])
y_train = np.hstack([np.zeros(n_samples // 2), np.ones(n_samples // 2)])

# Mélanger les données
indices = np.random.permutation(n_samples)
X_train = X_train[indices]
y_train = y_train[indices]

# Visualiser les données
plt.figure(figsize=(8, 6))
plt.scatter(X_train[y_train == 0][:, 0], X_train[y_train == 0][:, 1], 
            c='blue', label='Produits locaux', alpha=0.6, s=50)
plt.scatter(X_train[y_train == 1][:, 0], X_train[y_train == 1][:, 1], 
            c='red', label='Produits importés', alpha=0.6, s=50)
plt.xlabel('Prix (milliers FC)', fontsize=12)
plt.ylabel('Qualité (score)', fontsize=12)
plt.title('Classification de produits au marché de Kinshasa', fontsize=14, fontweight='bold')
plt.legend()
plt.grid(True, alpha=0.3)
plt.show()

In [None]:
# Créer un réseau avec une couche cachée
model_classification = keras.Sequential([
    keras.layers.Dense(8, activation='relu', input_shape=(2,)),
    keras.layers.Dense(4, activation='relu'),
    keras.layers.Dense(1, activation='sigmoid')
])

model_classification.compile(
    optimizer=keras.optimizers.Adam(learning_rate=0.01),
    loss='binary_crossentropy',
    metrics=['accuracy']
)

print("Architecture du réseau:")
model_classification.summary()

In [None]:
# Entraîner le modèle et visualiser la progression
history = model_classification.fit(
    X_train, y_train,
    epochs=50,
    validation_split=0.2,
    verbose=0
)

# Visualiser l'évolution de la perte et de la précision
fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# Perte
axes[0].plot(history.history['loss'], label='Entraînement', linewidth=2)
axes[0].plot(history.history['val_loss'], label='Validation', linewidth=2)
axes[0].set_xlabel('Époque', fontsize=12)
axes[0].set_ylabel('Perte', fontsize=12)
axes[0].set_title('Évolution de la perte', fontsize=14, fontweight='bold')
axes[0].legend()
axes[0].grid(True, alpha=0.3)

# Précision
axes[1].plot(history.history['accuracy'], label='Entraînement', linewidth=2)
axes[1].plot(history.history['val_accuracy'], label='Validation', linewidth=2)
axes[1].set_xlabel('Époque', fontsize=12)
axes[1].set_ylabel('Précision', fontsize=12)
axes[1].set_title('Évolution de la précision', fontsize=14, fontweight='bold')
axes[1].legend()
axes[1].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# Résultats finaux
final_loss = history.history['val_loss'][-1]
final_acc = history.history['val_accuracy'][-1]
print(f"\n✅ Résultats finaux:")
print(f"   Perte de validation: {final_loss:.4f}")
print(f"   Précision de validation: {final_acc * 100:.2f}%")

### 🎯 Exercice 2 : Comprendre l'impact du learning rate

Testez différents taux d'apprentissage et observez l'impact sur l'entraînement.

In [None]:
# Exercice 2 : Tester différents learning rates

learning_rates = [0.001, 0.01, 0.1, 1.0]

# TODO: Entraînez 4 modèles avec ces différents learning rates
# TODO: Comparez les résultats



---

# Chapitre 4 : TensorFlow et PyTorch <a id="chapitre-4"></a>

## 4.1 Introduction à TensorFlow

**TensorFlow** est une bibliothèque open-source développée par Google pour le Deep Learning.

### Avantages
- ✅ Très populaire et bien documenté
- ✅ API Keras intégrée (simple à utiliser)
- ✅ Déploiement facile en production
- ✅ Support mobile (TensorFlow Lite)

### Installation
```bash
pip install tensorflow
```

In [None]:
# Exemple complet avec TensorFlow : Prédire le prix du manioc

# Données synthétiques : [Saison (0-3), Pluie (mm), Température (°C)]
X_manioc = np.array([
    [0, 50, 25],   # Saison sèche, peu de pluie
    [1, 150, 28],  # Saison des pluies
    [2, 200, 26],  # Pic des pluies
    [3, 80, 27],   # Fin des pluies
    [0, 45, 26],
    [1, 160, 29],
    [2, 190, 25],
    [3, 75, 28],
    [0, 55, 24],
    [1, 145, 27],
])

# Prix du manioc (en milliers de FC par sac)
y_prix = np.array([45, 35, 30, 38, 46, 34, 31, 39, 44, 36])

# Normaliser
scaler_X = StandardScaler()
scaler_y = StandardScaler()
X_manioc_scaled = scaler_X.fit_transform(X_manioc)
y_prix_scaled = scaler_y.fit_transform(y_prix.reshape(-1, 1)).flatten()

# Créer le modèle
model_manioc = keras.Sequential([
    keras.layers.Dense(16, activation='relu', input_shape=(3,)),
    keras.layers.Dense(8, activation='relu'),
    keras.layers.Dense(1)  # Pas d'activation pour la régression
])

model_manioc.compile(
    optimizer='adam',
    loss='mse',
    metrics=['mae']
)

# Entraîner
history_manioc = model_manioc.fit(
    X_manioc_scaled, y_prix_scaled,
    epochs=200,
    verbose=0
)

# Prédire
predictions_scaled = model_manioc.predict(X_manioc_scaled, verbose=0)
predictions = scaler_y.inverse_transform(predictions_scaled)

# Afficher les résultats
print("Prédictions de prix du manioc:")
print("-" * 50)
for i in range(len(y_prix)):
    print(f"Réel: {y_prix[i]:.0f} FC | Prédit: {predictions[i][0]:.0f} FC | Erreur: {abs(y_prix[i] - predictions[i][0]):.0f} FC")

## 4.2 Introduction à PyTorch

**PyTorch** est une bibliothèque développée par Facebook (Meta) pour le Deep Learning.

### Avantages
- ✅ Plus pythonique et intuitif
- ✅ Excellent pour la recherche
- ✅ Débogage plus facile
- ✅ Graphes dynamiques

### Installation
```bash
pip install torch torchvision
```

In [None]:
# Installation de PyTorch
!pip install torch torchvision -q

import torch
import torch.nn as nn
import torch.optim as optim

print(f"PyTorch version: {torch.__version__}")

In [None]:
# Même exemple avec PyTorch

# Définir le modèle
class ManiocPriceModel(nn.Module):
    def __init__(self):
        super(ManiocPriceModel, self).__init__()
        self.fc1 = nn.Linear(3, 16)
        self.fc2 = nn.Linear(16, 8)
        self.fc3 = nn.Linear(8, 1)
        self.relu = nn.ReLU()
    
    def forward(self, x):
        x = self.relu(self.fc1(x))
        x = self.relu(self.fc2(x))
        x = self.fc3(x)
        return x

# Créer le modèle
model_pytorch = ManiocPriceModel()

# Définir la fonction de perte et l'optimiseur
criterion = nn.MSELoss()
optimizer = optim.Adam(model_pytorch.parameters(), lr=0.01)

# Convertir les données en tenseurs PyTorch
X_tensor = torch.FloatTensor(X_manioc_scaled)
y_tensor = torch.FloatTensor(y_prix_scaled).reshape(-1, 1)

# Entraîner
losses = []
for epoch in range(200):
    # Forward pass
    predictions = model_pytorch(X_tensor)
    loss = criterion(predictions, y_tensor)
    
    # Backward pass
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    
    losses.append(loss.item())

# Visualiser l'entraînement
plt.figure(figsize=(10, 5))
plt.plot(losses, linewidth=2)
plt.xlabel('Époque', fontsize=12)
plt.ylabel('Perte (MSE)', fontsize=12)
plt.title('Entraînement avec PyTorch', fontsize=14, fontweight='bold')
plt.grid(True, alpha=0.3)
plt.show()

print(f"✅ Perte finale: {losses[-1]:.4f}")

### Comparaison TensorFlow vs PyTorch

| Aspect | TensorFlow | PyTorch |
|--------|------------|----------|
| **Facilité d'apprentissage** | ⭐⭐⭐⭐ (avec Keras) | ⭐⭐⭐⭐⭐ |
| **Production** | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
| **Recherche** | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| **Débogage** | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| **Communauté** | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |

**Recommandation pour débutants :** TensorFlow avec Keras

### 🎯 Exercice 3 : Créer votre premier réseau

Créez un réseau de neurones pour prédire le rendement agricole.

**Données :**
- Entrées : [Pluie (mm), Engrais (kg), Température (°C)]
- Sortie : Rendement (tonnes/hectare)

In [None]:
# Exercice 3 : Prédiction de rendement agricole

X_agriculture = np.array([
    [800, 50, 25],
    [1200, 80, 27],
    [600, 30, 24],
    [1000, 60, 26],
    [1400, 90, 28],
    [700, 40, 25],
])

y_rendement = np.array([3.5, 5.2, 2.8, 4.1, 5.8, 3.2])

# TODO: Créez et entraînez votre modèle



---

# Chapitre 5 : Problèmes et solutions <a id="chapitre-5"></a>

## 5.1 Surapprentissage (Overfitting)

Le **surapprentissage** se produit quand le modèle apprend "par cœur" les données d'entraînement mais ne généralise pas bien.

### Signes de surapprentissage
- ✅ Excellente performance sur les données d'entraînement
- ❌ Mauvaise performance sur les données de test
- 📈 Écart croissant entre perte d'entraînement et de validation

### Causes
1. Modèle trop complexe (trop de paramètres)
2. Pas assez de données d'entraînement
3. Entraînement trop long

## 5.2 Sous-apprentissage (Underfitting)

Le **sous-apprentissage** se produit quand le modèle est trop simple et ne capture pas les patterns.

### Signes de sous-apprentissage
- ❌ Mauvaise performance sur l'entraînement
- ❌ Mauvaise performance sur le test
- 📉 Perte élevée qui ne diminue pas

## 5.3 Solutions

### 1. Validation croisée (Cross-validation)

Diviser les données en 3 ensembles :
- **Entraînement (70%)** : Pour apprendre
- **Validation (15%)** : Pour ajuster les hyperparamètres
- **Test (15%)** : Pour évaluer la performance finale

In [None]:
# Exemple : Split des données

from sklearn.model_selection import train_test_split

# Créer des données synthétiques
X_data = np.random.randn(1000, 5)
y_data = np.random.randint(0, 2, 1000)

# Split 1 : Séparer test (15%)
X_temp, X_test, y_temp, y_test = train_test_split(
    X_data, y_data, test_size=0.15, random_state=42
)

# Split 2 : Séparer validation (15% du reste)
X_train, X_val, y_train, y_val = train_test_split(
    X_temp, y_temp, test_size=0.176, random_state=42  # 0.176 * 0.85 ≈ 0.15
)

print(f"Taille de l'ensemble d'entraînement: {len(X_train)} ({len(X_train)/len(X_data)*100:.1f}%)")
print(f"Taille de l'ensemble de validation: {len(X_val)} ({len(X_val)/len(X_data)*100:.1f}%)")
print(f"Taille de l'ensemble de test: {len(X_test)} ({len(X_test)/len(X_data)*100:.1f}%)")

### 2. Dropout

Le **dropout** désactive aléatoirement des neurones pendant l'entraînement pour éviter le surapprentissage.

**Analogie :** C'est comme étudier avec différents groupes d'amis. Vous ne dépendez pas toujours des mêmes personnes.

In [None]:
# Modèle avec Dropout

model_dropout = keras.Sequential([
    keras.layers.Dense(64, activation='relu', input_shape=(5,)),
    keras.layers.Dropout(0.3),  # Désactive 30% des neurones
    keras.layers.Dense(32, activation='relu'),
    keras.layers.Dropout(0.3),
    keras.layers.Dense(1, activation='sigmoid')
])

model_dropout.compile(
    optimizer='adam',
    loss='binary_crossentropy',
    metrics=['accuracy']
)

model_dropout.summary()

### 3. Régularisation L1/L2

La **régularisation** pénalise les poids trop grands pour simplifier le modèle.

- **L1** : Pousse certains poids vers 0 (sélection de features)
- **L2** : Réduit tous les poids (plus courant)

In [None]:
# Modèle avec régularisation L2

from tensorflow.keras import regularizers

model_regularized = keras.Sequential([
    keras.layers.Dense(64, activation='relu', 
                      kernel_regularizer=regularizers.l2(0.01),
                      input_shape=(5,)),
    keras.layers.Dense(32, activation='relu',
                      kernel_regularizer=regularizers.l2(0.01)),
    keras.layers.Dense(1, activation='sigmoid')
])

model_regularized.compile(
    optimizer='adam',
    loss='binary_crossentropy',
    metrics=['accuracy']
)

print("Modèle avec régularisation L2:")
model_regularized.summary()

### 4. Early Stopping

Arrêter l'entraînement quand la performance sur la validation ne s'améliore plus.

In [None]:
# Early Stopping

from tensorflow.keras.callbacks import EarlyStopping

early_stop = EarlyStopping(
    monitor='val_loss',
    patience=10,  # Attendre 10 époques sans amélioration
    restore_best_weights=True
)

# Entraîner avec early stopping
history_early = model_dropout.fit(
    X_train, y_train,
    validation_data=(X_val, y_val),
    epochs=100,
    callbacks=[early_stop],
    verbose=0
)

print(f"✅ Entraînement arrêté à l'époque {len(history_early.history['loss'])}")

### 🎯 Exercice 4 : Combattre le surapprentissage

Créez deux modèles et comparez-les :
1. Un modèle simple sans régularisation
2. Un modèle avec Dropout et Early Stopping

In [None]:
# Exercice 4 : Comparer les modèles

# TODO: Créez deux modèles et comparez leurs performances



---

# Chapitre 6 : Projet final - Classification de fruits <a id="chapitre-6"></a>

## 🎯 Objectif du projet

Créer un réseau de neurones pour classifier des fruits locaux congolais :
- 🍌 **Banane**
- 🥭 **Mangue**
- 🍍 **Ananas**

## Étapes du projet

1. Créer un dataset synthétique de features
2. Construire un réseau de neurones
3. Entraîner le modèle
4. Évaluer les performances
5. Faire des prédictions

In [None]:
# Étape 1 : Créer le dataset

# Features : [Longueur (cm), Largeur (cm), Poids (g), Couleur (0-1), Texture (0-1)]

np.random.seed(42)

# Bananes : allongées, jaunes
bananes = np.random.randn(100, 5) * np.array([2, 1, 20, 0.1, 0.1]) + np.array([18, 4, 120, 0.8, 0.3])

# Mangues : ovales, orange-rouge
mangues = np.random.randn(100, 5) * np.array([2, 2, 30, 0.1, 0.1]) + np.array([12, 8, 250, 0.6, 0.5])

# Ananas : gros, rugueux
ananas = np.random.randn(100, 5) * np.array([3, 3, 50, 0.1, 0.1]) + np.array([25, 12, 1000, 0.4, 0.8])

# Combiner les données
X_fruits = np.vstack([bananes, mangues, ananas])
y_fruits = np.hstack([
    np.zeros(100),  # Bananes = 0
    np.ones(100),   # Mangues = 1
    np.full(100, 2) # Ananas = 2
])

# Mélanger
indices = np.random.permutation(300)
X_fruits = X_fruits[indices]
y_fruits = y_fruits[indices]

print("Dataset créé:")
print(f"- Nombre d'exemples: {len(X_fruits)}")
print(f"- Features par exemple: {X_fruits.shape[1]}")
print(f"- Classes: 3 (Banane, Mangue, Ananas)")

In [None]:
# Visualiser les données

fig = plt.figure(figsize=(12, 5))

# Graphique 1 : Longueur vs Largeur
ax1 = fig.add_subplot(121)
colors = ['yellow', 'orange', 'green']
labels = ['Banane', 'Mangue', 'Ananas']

for i in range(3):
    mask = y_fruits == i
    ax1.scatter(X_fruits[mask, 0], X_fruits[mask, 1], 
               c=colors[i], label=labels[i], alpha=0.6, s=50)

ax1.set_xlabel('Longueur (cm)', fontsize=12)
ax1.set_ylabel('Largeur (cm)', fontsize=12)
ax1.set_title('Dimensions des fruits', fontsize=14, fontweight='bold')
ax1.legend()
ax1.grid(True, alpha=0.3)

# Graphique 2 : Poids vs Texture
ax2 = fig.add_subplot(122)

for i in range(3):
    mask = y_fruits == i
    ax2.scatter(X_fruits[mask, 2], X_fruits[mask, 4], 
               c=colors[i], label=labels[i], alpha=0.6, s=50)

ax2.set_xlabel('Poids (g)', fontsize=12)
ax2.set_ylabel('Texture', fontsize=12)
ax2.set_title('Poids et texture des fruits', fontsize=14, fontweight='bold')
ax2.legend()
ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

In [None]:
# Étape 2 : Préparer les données

# Split train/test
X_train_fruits, X_test_fruits, y_train_fruits, y_test_fruits = train_test_split(
    X_fruits, y_fruits, test_size=0.2, random_state=42
)

# Normaliser
scaler_fruits = StandardScaler()
X_train_fruits_scaled = scaler_fruits.fit_transform(X_train_fruits)
X_test_fruits_scaled = scaler_fruits.transform(X_test_fruits)

# Convertir les labels en one-hot encoding
y_train_fruits_cat = keras.utils.to_categorical(y_train_fruits, 3)
y_test_fruits_cat = keras.utils.to_categorical(y_test_fruits, 3)

print("Données préparées:")
print(f"- Entraînement: {len(X_train_fruits)} exemples")
print(f"- Test: {len(X_test_fruits)} exemples")
print(f"- Shape des labels: {y_train_fruits_cat.shape}")

In [None]:
# Étape 3 : Construire le modèle

model_fruits = keras.Sequential([
    keras.layers.Dense(32, activation='relu', input_shape=(5,)),
    keras.layers.Dropout(0.3),
    keras.layers.Dense(16, activation='relu'),
    keras.layers.Dropout(0.2),
    keras.layers.Dense(8, activation='relu'),
    keras.layers.Dense(3, activation='softmax')  # 3 classes
])

model_fruits.compile(
    optimizer='adam',
    loss='categorical_crossentropy',
    metrics=['accuracy']
)

print("Architecture du modèle:")
model_fruits.summary()

In [None]:
# Étape 4 : Entraîner le modèle

early_stop_fruits = EarlyStopping(
    monitor='val_loss',
    patience=20,
    restore_best_weights=True
)

history_fruits = model_fruits.fit(
    X_train_fruits_scaled, y_train_fruits_cat,
    validation_split=0.2,
    epochs=100,
    batch_size=16,
    callbacks=[early_stop_fruits],
    verbose=0
)

# Visualiser l'entraînement
fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# Perte
axes[0].plot(history_fruits.history['loss'], label='Entraînement', linewidth=2)
axes[0].plot(history_fruits.history['val_loss'], label='Validation', linewidth=2)
axes[0].set_xlabel('Époque', fontsize=12)
axes[0].set_ylabel('Perte', fontsize=12)
axes[0].set_title('Évolution de la perte', fontsize=14, fontweight='bold')
axes[0].legend()
axes[0].grid(True, alpha=0.3)

# Précision
axes[1].plot(history_fruits.history['accuracy'], label='Entraînement', linewidth=2)
axes[1].plot(history_fruits.history['val_accuracy'], label='Validation', linewidth=2)
axes[1].set_xlabel('Époque', fontsize=12)
axes[1].set_ylabel('Précision', fontsize=12)
axes[1].set_title('Évolution de la précision', fontsize=14, fontweight='bold')
axes[1].legend()
axes[1].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print(f"\n✅ Entraînement terminé en {len(history_fruits.history['loss'])} époques")

In [None]:
# Étape 5 : Évaluer le modèle

test_loss, test_accuracy = model_fruits.evaluate(
    X_test_fruits_scaled, y_test_fruits_cat, verbose=0
)

print("\n" + "="*50)
print("📊 RÉSULTATS FINAUX")
print("="*50)
print(f"Perte sur le test: {test_loss:.4f}")
print(f"Précision sur le test: {test_accuracy * 100:.2f}%")
print("="*50)

In [None]:
# Matrice de confusion

from sklearn.metrics import confusion_matrix, classification_report
import seaborn as sns

# Prédictions
y_pred_proba = model_fruits.predict(X_test_fruits_scaled, verbose=0)
y_pred = np.argmax(y_pred_proba, axis=1)

# Matrice de confusion
cm = confusion_matrix(y_test_fruits, y_pred)

# Visualiser
plt.figure(figsize=(8, 6))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', 
            xticklabels=['Banane', 'Mangue', 'Ananas'],
            yticklabels=['Banane', 'Mangue', 'Ananas'])
plt.xlabel('Prédiction', fontsize=12)
plt.ylabel('Vérité', fontsize=12)
plt.title('Matrice de confusion - Classification de fruits', fontsize=14, fontweight='bold')
plt.show()

# Rapport de classification
print("\nRapport de classification:")
print(classification_report(y_test_fruits, y_pred, 
                          target_names=['Banane', 'Mangue', 'Ananas']))

In [None]:
# Étape 6 : Faire des prédictions sur de nouveaux fruits

# Nouveaux fruits à classifier
nouveaux_fruits = np.array([
    [20, 4, 130, 0.85, 0.25],  # Devrait être une banane
    [11, 7, 240, 0.55, 0.48],  # Devrait être une mangue
    [26, 13, 1050, 0.38, 0.82], # Devrait être un ananas
])

# Normaliser
nouveaux_fruits_scaled = scaler_fruits.transform(nouveaux_fruits)

# Prédire
predictions = model_fruits.predict(nouveaux_fruits_scaled, verbose=0)

# Afficher les résultats
fruit_names = ['Banane', 'Mangue', 'Ananas']

print("\n🍎 PRÉDICTIONS SUR DE NOUVEAUX FRUITS")
print("="*60)

for i, pred in enumerate(predictions):
    predicted_class = np.argmax(pred)
    confidence = pred[predicted_class] * 100
    
    print(f"\nFruit {i+1}:")
    print(f"  Caractéristiques: {nouveaux_fruits[i]}")
    print(f"  Prédiction: {fruit_names[predicted_class]}")
    print(f"  Confiance: {confidence:.2f}%")
    print(f"  Probabilités:")
    for j, prob in enumerate(pred):
        print(f"    - {fruit_names[j]}: {prob*100:.2f}%")

print("\n" + "="*60)

### 🎯 Exercice 5 : Améliorer le modèle

Essayez d'améliorer la performance du modèle en :
1. Ajoutant plus de couches
2. Modifiant le nombre de neurones
3. Testant différentes fonctions d'activation
4. Ajustant le dropout

In [None]:
# Exercice 5 : Améliorez le modèle

# TODO: Créez une version améliorée du modèle



---

## 🎓 Résumé du module

### Ce que vous avez appris

1. **Deep Learning vs ML classique**
   - Extraction automatique de features
   - Besoin de grandes quantités de données
   - Applications en RDC

2. **Réseaux de neurones**
   - Architecture (couches, neurones)
   - Fonctions d'activation (ReLU, Sigmoid, Softmax)
   - Propagation avant et arrière

3. **Entraînement**
   - Fonctions de perte
   - Backpropagation
   - Optimiseurs (Adam, SGD)

4. **Frameworks**
   - TensorFlow/Keras
   - PyTorch
   - Comparaison et choix

5. **Problèmes courants**
   - Surapprentissage et solutions
   - Dropout, régularisation
   - Early stopping

6. **Projet pratique**
   - Classification multi-classes
   - Évaluation de performance
   - Matrice de confusion

### Prochaines étapes

1. **Réseaux convolutifs (CNN)**
   - Traitement d'images
   - Détection d'objets

2. **Réseaux récurrents (RNN/LSTM)**
   - Séries temporelles
   - Traitement du langage

3. **Transfer Learning**
   - Utiliser des modèles pré-entraînés
   - Fine-tuning

4. **Déploiement**
   - API REST
   - Applications mobiles

---

## 📚 Ressources supplémentaires

### Cours en ligne
- [Deep Learning Specialization - Coursera](https://www.coursera.org/specializations/deep-learning)
- [Fast.ai - Practical Deep Learning](https://www.fast.ai/)
- [TensorFlow Tutorials](https://www.tensorflow.org/tutorials)

### Livres
- "Deep Learning" - Ian Goodfellow
- "Hands-On Machine Learning" - Aurélien Géron
- "Neural Networks and Deep Learning" - Michael Nielsen (gratuit)

### Communautés
- [Kaggle](https://www.kaggle.com/) - Compétitions et datasets
- [Papers With Code](https://paperswithcode.com/) - Dernières recherches
- [Reddit r/MachineLearning](https://www.reddit.com/r/MachineLearning/)

---

**Félicitations ! Vous avez terminé le module Deep Learning ! 🎉**

*Continuez à pratiquer et à explorer. Le Deep Learning est un domaine en constante évolution !*