# Module Deep Learning - Formation Compl√®te

## Plateforme IA-Solution RDC

---

### üéØ Objectifs du module

√Ä la fin de ce module, vous serez capable de :
- Comprendre ce qu'est le Deep Learning et ses diff√©rences avec le ML classique
- Ma√Ætriser les r√©seaux de neurones artificiels (architecture, fonctionnement)
- Impl√©menter des r√©seaux avec TensorFlow et PyTorch
- R√©soudre des probl√®mes de classification et r√©gression
- Appliquer le Deep Learning √† des cas concrets en RDC

**Niveau :** Interm√©diaire  
**Pr√©requis :** Python, bases de Machine Learning  
**Dur√©e :** 10 semaines

---

## üìö Table des mati√®res

1. [Introduction au Deep Learning](#chapitre-1)
2. [R√©seaux de neurones artificiels](#chapitre-2)
3. [Entra√Ænement d'un r√©seau](#chapitre-3)
4. [TensorFlow et PyTorch](#chapitre-4)
5. [Probl√®mes et solutions](#chapitre-5)
6. [Projet final : Classification de fruits](#chapitre-6)

---

# Chapitre 1 : Introduction au Deep Learning <a id="chapitre-1"></a>

## 1.1 Qu'est-ce que le Deep Learning ?

Le **Deep Learning** (apprentissage profond) est une branche du Machine Learning qui utilise des **r√©seaux de neurones artificiels** avec plusieurs couches pour apprendre des repr√©sentations complexes des donn√©es.

### Analogie simple

Imaginez que vous apprenez √† un enfant √† reconna√Ætre des fruits :
- **Machine Learning classique** : Vous lui donnez des r√®gles pr√©cises ("si c'est jaune et allong√©, c'est une banane")
- **Deep Learning** : Vous lui montrez des milliers d'images de fruits, et il apprend lui-m√™me les caract√©ristiques importantes

### Diff√©rences avec le ML classique

| Aspect | ML Classique | Deep Learning |
|--------|--------------|---------------|
| **Extraction de features** | Manuelle | Automatique |
| **Quantit√© de donn√©es** | Petite √† moyenne | Grande |
| **Puissance de calcul** | Mod√©r√©e | √âlev√©e (GPU) |
| **Interpr√©tabilit√©** | √âlev√©e | Faible (bo√Æte noire) |
| **Performance** | Bonne | Excellente (donn√©es suffisantes) |

### Applications en RDC

#### üè• **Sant√©**
- Diagnostic m√©dical par imagerie (rayons X, √©chographies)
- D√©tection pr√©coce du paludisme sur images microscopiques
- Pr√©diction d'√©pid√©mies (Ebola, COVID-19)

#### üåæ **Agriculture**
- D√©tection de maladies des plantes (manioc, ma√Øs)
- Estimation des rendements par images satellites
- Classification des sols

#### üí∞ **Commerce**
- Reconnaissance de produits pour e-commerce
- D√©tection de fraudes bancaires
- Recommandation de produits

#### üìö **√âducation**
- Correction automatique de copies
- Chatbots √©ducatifs en fran√ßais/lingala
- Analyse de performances des √©tudiants

In [None]:
# Installation des biblioth√®ques n√©cessaires
# Ex√©cuter cette cellule une seule fois

!pip install tensorflow numpy matplotlib scikit-learn -q

print("‚úÖ Biblioth√®ques install√©es avec succ√®s !")

In [None]:
# Imports n√©cessaires
import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf
from tensorflow import keras
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# Configuration
np.random.seed(42)
tf.random.set_seed(42)

print(f"TensorFlow version: {tf.__version__}")
print(f"NumPy version: {np.__version__}")

---

# Chapitre 2 : R√©seaux de neurones artificiels <a id="chapitre-2"></a>

## 2.1 Le neurone artificiel

Un **neurone artificiel** est l'unit√© de base d'un r√©seau de neurones. Il s'inspire du neurone biologique.

### Composants d'un neurone

1. **Entr√©es (x‚ÇÅ, x‚ÇÇ, ..., x‚Çô)** : Les donn√©es d'entr√©e
2. **Poids (w‚ÇÅ, w‚ÇÇ, ..., w‚Çô)** : Importance de chaque entr√©e
3. **Biais (b)** : Valeur ajout√©e pour ajuster la sortie
4. **Fonction d'activation (f)** : Transforme la somme pond√©r√©e

### Formule math√©matique

```
z = (x‚ÇÅ √ó w‚ÇÅ) + (x‚ÇÇ √ó w‚ÇÇ) + ... + (x‚Çô √ó w‚Çô) + b
y = f(z)
```

O√π :
- **z** = somme pond√©r√©e
- **y** = sortie du neurone
- **f** = fonction d'activation

### Fonctions d'activation courantes

| Fonction | Formule | Usage |
|----------|---------|-------|
| **Sigmoid** | œÉ(z) = 1 / (1 + e‚Åª·∂ª) | Classification binaire |
| **ReLU** | f(z) = max(0, z) | Couches cach√©es (le plus courant) |
| **Tanh** | tanh(z) = (e·∂ª - e‚Åª·∂ª) / (e·∂ª + e‚Åª·∂ª) | Couches cach√©es |
| **Softmax** | œÉ(z)·µ¢ = e·∂ª‚Å± / Œ£e·∂ª ≤ | Classification multi-classes |

In [None]:
# Visualisation des fonctions d'activation

def sigmoid(z):
    return 1 / (1 + np.exp(-z))

def relu(z):
    return np.maximum(0, z)

def tanh(z):
    return np.tanh(z)

# Cr√©er les donn√©es
z = np.linspace(-5, 5, 100)

# Cr√©er les graphiques
fig, axes = plt.subplots(1, 3, figsize=(15, 4))

# Sigmoid
axes[0].plot(z, sigmoid(z), 'b-', linewidth=2)
axes[0].set_title('Sigmoid', fontsize=14, fontweight='bold')
axes[0].grid(True, alpha=0.3)
axes[0].axhline(y=0, color='k', linewidth=0.5)
axes[0].axvline(x=0, color='k', linewidth=0.5)

# ReLU
axes[1].plot(z, relu(z), 'r-', linewidth=2)
axes[1].set_title('ReLU', fontsize=14, fontweight='bold')
axes[1].grid(True, alpha=0.3)
axes[1].axhline(y=0, color='k', linewidth=0.5)
axes[1].axvline(x=0, color='k', linewidth=0.5)

# Tanh
axes[2].plot(z, tanh(z), 'g-', linewidth=2)
axes[2].set_title('Tanh', fontsize=14, fontweight='bold')
axes[2].grid(True, alpha=0.3)
axes[2].axhline(y=0, color='k', linewidth=0.5)
axes[2].axvline(x=0, color='k', linewidth=0.5)

plt.tight_layout()
plt.show()

## 2.2 Architecture d'un r√©seau de neurones

Un r√©seau de neurones est compos√© de plusieurs **couches** :

1. **Couche d'entr√©e** : Re√ßoit les donn√©es
2. **Couches cach√©es** : Effectuent les calculs (peuvent √™tre multiples)
3. **Couche de sortie** : Produit la pr√©diction

### Exemple : Classification de fruits

```
Entr√©e (4 features)     Couche cach√©e (8 neurones)     Sortie (3 classes)
    [Couleur]  ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ  [Banane]
    [Forme]    ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ  [Mangue]
    [Taille]   ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ  [Ananas]
    [Texture]  ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ
```

In [None]:
# Exemple simple : Perceptron pour classification binaire
# Probl√®me : Pr√©dire si un patient a le paludisme (0 = Non, 1 = Oui)

# Donn√©es synth√©tiques : [Temp√©rature, Fatigue, Maux de t√™te]
X = np.array([
    [37.0, 2, 1],  # Pas de paludisme
    [39.5, 8, 9],  # Paludisme
    [38.2, 5, 4],  # Pas de paludisme
    [40.1, 9, 10], # Paludisme
    [37.5, 3, 2],  # Pas de paludisme
    [39.8, 9, 8],  # Paludisme
    [36.8, 1, 1],  # Pas de paludisme
    [40.5, 10, 9], # Paludisme
])

y = np.array([0, 1, 0, 1, 0, 1, 0, 1])  # Labels

print("Donn√©es d'entra√Ænement:")
print("Features (Temp√©rature, Fatigue, Maux de t√™te):")
print(X)
print("\nLabels (0=Sain, 1=Paludisme):")
print(y)

In [None]:
# Cr√©er un perceptron simple avec TensorFlow

# Normaliser les donn√©es
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Cr√©er le mod√®le
model = keras.Sequential([
    keras.layers.Dense(1, activation='sigmoid', input_shape=(3,))
])

# Compiler le mod√®le
model.compile(
    optimizer='adam',
    loss='binary_crossentropy',
    metrics=['accuracy']
)

# Afficher l'architecture
model.summary()

In [None]:
# Entra√Æner le mod√®le
history = model.fit(
    X_scaled, y,
    epochs=100,
    verbose=0
)

# √âvaluer
loss, accuracy = model.evaluate(X_scaled, y, verbose=0)
print(f"\n‚úÖ Pr√©cision du mod√®le: {accuracy * 100:.2f}%")

# Faire des pr√©dictions
predictions = model.predict(X_scaled, verbose=0)
print("\nPr√©dictions:")
for i, pred in enumerate(predictions):
    print(f"Patient {i+1}: {pred[0]:.4f} ‚Üí {'Paludisme' if pred[0] > 0.5 else 'Sain'}")

### üéØ Exercice 1 : Cr√©er votre premier neurone

Cr√©ez un perceptron pour pr√©dire si un √©tudiant va r√©ussir son examen.

**Donn√©es :**
- Entr√©es : [Heures d'√©tude, Pr√©sence en classe (%), Note pr√©c√©dente]
- Sortie : 0 = √âchec, 1 = R√©ussite

In [None]:
# Exercice 1 : √Ä vous de jouer !

# Donn√©es
X_etudiants = np.array([
    [2, 60, 8],   # √âchec
    [8, 95, 15],  # R√©ussite
    [5, 75, 12],  # R√©ussite
    [1, 50, 6],   # √âchec
    [7, 90, 14],  # R√©ussite
    [3, 65, 9],   # √âchec
])

y_etudiants = np.array([0, 1, 1, 0, 1, 0])

# TODO: Cr√©ez et entra√Ænez votre mod√®le ici



---

# Chapitre 3 : Entra√Ænement d'un r√©seau <a id="chapitre-3"></a>

## 3.1 Propagation avant (Forward Propagation)

C'est le processus o√π les donn√©es traversent le r√©seau de l'entr√©e vers la sortie.

**√âtapes :**
1. Les donn√©es entrent dans la couche d'entr√©e
2. Chaque neurone calcule sa sortie
3. Les sorties deviennent les entr√©es de la couche suivante
4. On obtient la pr√©diction finale

## 3.2 Fonction de perte (Loss Function)

La fonction de perte mesure l'**erreur** entre la pr√©diction et la vraie valeur.

### Fonctions de perte courantes

| Fonction | Usage | Formule |
|----------|-------|----------|
| **Binary Crossentropy** | Classification binaire | -[y log(≈∑) + (1-y) log(1-≈∑)] |
| **Categorical Crossentropy** | Classification multi-classes | -Œ£ y·µ¢ log(≈∑·µ¢) |
| **MSE** | R√©gression | (y - ≈∑)¬≤ |

## 3.3 Backpropagation

C'est l'algorithme qui permet d'**ajuster les poids** pour r√©duire l'erreur.

**Analogie simple :**
Imaginez que vous apprenez √† lancer une balle dans un panier :
1. Vous lancez (propagation avant)
2. Vous ratez (fonction de perte)
3. Vous ajustez votre geste (backpropagation)
4. Vous relancez (nouvelle it√©ration)

**Processus :**
1. Calculer l'erreur de sortie
2. Propager l'erreur vers l'arri√®re
3. Calculer les gradients (d√©riv√©es)
4. Mettre √† jour les poids : `w_nouveau = w_ancien - Œ± √ó gradient`

O√π **Œ±** (alpha) est le **taux d'apprentissage** (learning rate).

In [None]:
# Exemple : Visualiser l'entra√Ænement

# Cr√©er des donn√©es synth√©tiques (classification binaire)
np.random.seed(42)
n_samples = 200

# Classe 0 : Produits locaux bon march√©
X_classe0 = np.random.randn(n_samples // 2, 2) + np.array([2, 2])
# Classe 1 : Produits import√©s chers
X_classe1 = np.random.randn(n_samples // 2, 2) + np.array([5, 5])

X_train = np.vstack([X_classe0, X_classe1])
y_train = np.hstack([np.zeros(n_samples // 2), np.ones(n_samples // 2)])

# M√©langer les donn√©es
indices = np.random.permutation(n_samples)
X_train = X_train[indices]
y_train = y_train[indices]

# Visualiser les donn√©es
plt.figure(figsize=(8, 6))
plt.scatter(X_train[y_train == 0][:, 0], X_train[y_train == 0][:, 1], 
            c='blue', label='Produits locaux', alpha=0.6, s=50)
plt.scatter(X_train[y_train == 1][:, 0], X_train[y_train == 1][:, 1], 
            c='red', label='Produits import√©s', alpha=0.6, s=50)
plt.xlabel('Prix (milliers FC)', fontsize=12)
plt.ylabel('Qualit√© (score)', fontsize=12)
plt.title('Classification de produits au march√© de Kinshasa', fontsize=14, fontweight='bold')
plt.legend()
plt.grid(True, alpha=0.3)
plt.show()

In [None]:
# Cr√©er un r√©seau avec une couche cach√©e
model_classification = keras.Sequential([
    keras.layers.Dense(8, activation='relu', input_shape=(2,)),
    keras.layers.Dense(4, activation='relu'),
    keras.layers.Dense(1, activation='sigmoid')
])

model_classification.compile(
    optimizer=keras.optimizers.Adam(learning_rate=0.01),
    loss='binary_crossentropy',
    metrics=['accuracy']
)

print("Architecture du r√©seau:")
model_classification.summary()

In [None]:
# Entra√Æner le mod√®le et visualiser la progression
history = model_classification.fit(
    X_train, y_train,
    epochs=50,
    validation_split=0.2,
    verbose=0
)

# Visualiser l'√©volution de la perte et de la pr√©cision
fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# Perte
axes[0].plot(history.history['loss'], label='Entra√Ænement', linewidth=2)
axes[0].plot(history.history['val_loss'], label='Validation', linewidth=2)
axes[0].set_xlabel('√âpoque', fontsize=12)
axes[0].set_ylabel('Perte', fontsize=12)
axes[0].set_title('√âvolution de la perte', fontsize=14, fontweight='bold')
axes[0].legend()
axes[0].grid(True, alpha=0.3)

# Pr√©cision
axes[1].plot(history.history['accuracy'], label='Entra√Ænement', linewidth=2)
axes[1].plot(history.history['val_accuracy'], label='Validation', linewidth=2)
axes[1].set_xlabel('√âpoque', fontsize=12)
axes[1].set_ylabel('Pr√©cision', fontsize=12)
axes[1].set_title('√âvolution de la pr√©cision', fontsize=14, fontweight='bold')
axes[1].legend()
axes[1].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# R√©sultats finaux
final_loss = history.history['val_loss'][-1]
final_acc = history.history['val_accuracy'][-1]
print(f"\n‚úÖ R√©sultats finaux:")
print(f"   Perte de validation: {final_loss:.4f}")
print(f"   Pr√©cision de validation: {final_acc * 100:.2f}%")

### üéØ Exercice 2 : Comprendre l'impact du learning rate

Testez diff√©rents taux d'apprentissage et observez l'impact sur l'entra√Ænement.

In [None]:
# Exercice 2 : Tester diff√©rents learning rates

learning_rates = [0.001, 0.01, 0.1, 1.0]

# TODO: Entra√Ænez 4 mod√®les avec ces diff√©rents learning rates
# TODO: Comparez les r√©sultats



---

# Chapitre 4 : TensorFlow et PyTorch <a id="chapitre-4"></a>

## 4.1 Introduction √† TensorFlow

**TensorFlow** est une biblioth√®que open-source d√©velopp√©e par Google pour le Deep Learning.

### Avantages
- ‚úÖ Tr√®s populaire et bien document√©
- ‚úÖ API Keras int√©gr√©e (simple √† utiliser)
- ‚úÖ D√©ploiement facile en production
- ‚úÖ Support mobile (TensorFlow Lite)

### Installation
```bash
pip install tensorflow
```

In [None]:
# Exemple complet avec TensorFlow : Pr√©dire le prix du manioc

# Donn√©es synth√©tiques : [Saison (0-3), Pluie (mm), Temp√©rature (¬∞C)]
X_manioc = np.array([
    [0, 50, 25],   # Saison s√®che, peu de pluie
    [1, 150, 28],  # Saison des pluies
    [2, 200, 26],  # Pic des pluies
    [3, 80, 27],   # Fin des pluies
    [0, 45, 26],
    [1, 160, 29],
    [2, 190, 25],
    [3, 75, 28],
    [0, 55, 24],
    [1, 145, 27],
])

# Prix du manioc (en milliers de FC par sac)
y_prix = np.array([45, 35, 30, 38, 46, 34, 31, 39, 44, 36])

# Normaliser
scaler_X = StandardScaler()
scaler_y = StandardScaler()
X_manioc_scaled = scaler_X.fit_transform(X_manioc)
y_prix_scaled = scaler_y.fit_transform(y_prix.reshape(-1, 1)).flatten()

# Cr√©er le mod√®le
model_manioc = keras.Sequential([
    keras.layers.Dense(16, activation='relu', input_shape=(3,)),
    keras.layers.Dense(8, activation='relu'),
    keras.layers.Dense(1)  # Pas d'activation pour la r√©gression
])

model_manioc.compile(
    optimizer='adam',
    loss='mse',
    metrics=['mae']
)

# Entra√Æner
history_manioc = model_manioc.fit(
    X_manioc_scaled, y_prix_scaled,
    epochs=200,
    verbose=0
)

# Pr√©dire
predictions_scaled = model_manioc.predict(X_manioc_scaled, verbose=0)
predictions = scaler_y.inverse_transform(predictions_scaled)

# Afficher les r√©sultats
print("Pr√©dictions de prix du manioc:")
print("-" * 50)
for i in range(len(y_prix)):
    print(f"R√©el: {y_prix[i]:.0f} FC | Pr√©dit: {predictions[i][0]:.0f} FC | Erreur: {abs(y_prix[i] - predictions[i][0]):.0f} FC")

## 4.2 Introduction √† PyTorch

**PyTorch** est une biblioth√®que d√©velopp√©e par Facebook (Meta) pour le Deep Learning.

### Avantages
- ‚úÖ Plus pythonique et intuitif
- ‚úÖ Excellent pour la recherche
- ‚úÖ D√©bogage plus facile
- ‚úÖ Graphes dynamiques

### Installation
```bash
pip install torch torchvision
```

In [None]:
# Installation de PyTorch
!pip install torch torchvision -q

import torch
import torch.nn as nn
import torch.optim as optim

print(f"PyTorch version: {torch.__version__}")

In [None]:
# M√™me exemple avec PyTorch

# D√©finir le mod√®le
class ManiocPriceModel(nn.Module):
    def __init__(self):
        super(ManiocPriceModel, self).__init__()
        self.fc1 = nn.Linear(3, 16)
        self.fc2 = nn.Linear(16, 8)
        self.fc3 = nn.Linear(8, 1)
        self.relu = nn.ReLU()
    
    def forward(self, x):
        x = self.relu(self.fc1(x))
        x = self.relu(self.fc2(x))
        x = self.fc3(x)
        return x

# Cr√©er le mod√®le
model_pytorch = ManiocPriceModel()

# D√©finir la fonction de perte et l'optimiseur
criterion = nn.MSELoss()
optimizer = optim.Adam(model_pytorch.parameters(), lr=0.01)

# Convertir les donn√©es en tenseurs PyTorch
X_tensor = torch.FloatTensor(X_manioc_scaled)
y_tensor = torch.FloatTensor(y_prix_scaled).reshape(-1, 1)

# Entra√Æner
losses = []
for epoch in range(200):
    # Forward pass
    predictions = model_pytorch(X_tensor)
    loss = criterion(predictions, y_tensor)
    
    # Backward pass
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    
    losses.append(loss.item())

# Visualiser l'entra√Ænement
plt.figure(figsize=(10, 5))
plt.plot(losses, linewidth=2)
plt.xlabel('√âpoque', fontsize=12)
plt.ylabel('Perte (MSE)', fontsize=12)
plt.title('Entra√Ænement avec PyTorch', fontsize=14, fontweight='bold')
plt.grid(True, alpha=0.3)
plt.show()

print(f"‚úÖ Perte finale: {losses[-1]:.4f}")

### Comparaison TensorFlow vs PyTorch

| Aspect | TensorFlow | PyTorch |
|--------|------------|----------|
| **Facilit√© d'apprentissage** | ‚≠ê‚≠ê‚≠ê‚≠ê (avec Keras) | ‚≠ê‚≠ê‚≠ê‚≠ê‚≠ê |
| **Production** | ‚≠ê‚≠ê‚≠ê‚≠ê‚≠ê | ‚≠ê‚≠ê‚≠ê‚≠ê |
| **Recherche** | ‚≠ê‚≠ê‚≠ê‚≠ê | ‚≠ê‚≠ê‚≠ê‚≠ê‚≠ê |
| **D√©bogage** | ‚≠ê‚≠ê‚≠ê | ‚≠ê‚≠ê‚≠ê‚≠ê‚≠ê |
| **Communaut√©** | ‚≠ê‚≠ê‚≠ê‚≠ê‚≠ê | ‚≠ê‚≠ê‚≠ê‚≠ê‚≠ê |

**Recommandation pour d√©butants :** TensorFlow avec Keras

### üéØ Exercice 3 : Cr√©er votre premier r√©seau

Cr√©ez un r√©seau de neurones pour pr√©dire le rendement agricole.

**Donn√©es :**
- Entr√©es : [Pluie (mm), Engrais (kg), Temp√©rature (¬∞C)]
- Sortie : Rendement (tonnes/hectare)

In [None]:
# Exercice 3 : Pr√©diction de rendement agricole

X_agriculture = np.array([
    [800, 50, 25],
    [1200, 80, 27],
    [600, 30, 24],
    [1000, 60, 26],
    [1400, 90, 28],
    [700, 40, 25],
])

y_rendement = np.array([3.5, 5.2, 2.8, 4.1, 5.8, 3.2])

# TODO: Cr√©ez et entra√Ænez votre mod√®le



---

# Chapitre 5 : Probl√®mes et solutions <a id="chapitre-5"></a>

## 5.1 Surapprentissage (Overfitting)

Le **surapprentissage** se produit quand le mod√®le apprend "par c≈ìur" les donn√©es d'entra√Ænement mais ne g√©n√©ralise pas bien.

### Signes de surapprentissage
- ‚úÖ Excellente performance sur les donn√©es d'entra√Ænement
- ‚ùå Mauvaise performance sur les donn√©es de test
- üìà √âcart croissant entre perte d'entra√Ænement et de validation

### Causes
1. Mod√®le trop complexe (trop de param√®tres)
2. Pas assez de donn√©es d'entra√Ænement
3. Entra√Ænement trop long

## 5.2 Sous-apprentissage (Underfitting)

Le **sous-apprentissage** se produit quand le mod√®le est trop simple et ne capture pas les patterns.

### Signes de sous-apprentissage
- ‚ùå Mauvaise performance sur l'entra√Ænement
- ‚ùå Mauvaise performance sur le test
- üìâ Perte √©lev√©e qui ne diminue pas

## 5.3 Solutions

### 1. Validation crois√©e (Cross-validation)

Diviser les donn√©es en 3 ensembles :
- **Entra√Ænement (70%)** : Pour apprendre
- **Validation (15%)** : Pour ajuster les hyperparam√®tres
- **Test (15%)** : Pour √©valuer la performance finale

In [None]:
# Exemple : Split des donn√©es

from sklearn.model_selection import train_test_split

# Cr√©er des donn√©es synth√©tiques
X_data = np.random.randn(1000, 5)
y_data = np.random.randint(0, 2, 1000)

# Split 1 : S√©parer test (15%)
X_temp, X_test, y_temp, y_test = train_test_split(
    X_data, y_data, test_size=0.15, random_state=42
)

# Split 2 : S√©parer validation (15% du reste)
X_train, X_val, y_train, y_val = train_test_split(
    X_temp, y_temp, test_size=0.176, random_state=42  # 0.176 * 0.85 ‚âà 0.15
)

print(f"Taille de l'ensemble d'entra√Ænement: {len(X_train)} ({len(X_train)/len(X_data)*100:.1f}%)")
print(f"Taille de l'ensemble de validation: {len(X_val)} ({len(X_val)/len(X_data)*100:.1f}%)")
print(f"Taille de l'ensemble de test: {len(X_test)} ({len(X_test)/len(X_data)*100:.1f}%)")

### 2. Dropout

Le **dropout** d√©sactive al√©atoirement des neurones pendant l'entra√Ænement pour √©viter le surapprentissage.

**Analogie :** C'est comme √©tudier avec diff√©rents groupes d'amis. Vous ne d√©pendez pas toujours des m√™mes personnes.

In [None]:
# Mod√®le avec Dropout

model_dropout = keras.Sequential([
    keras.layers.Dense(64, activation='relu', input_shape=(5,)),
    keras.layers.Dropout(0.3),  # D√©sactive 30% des neurones
    keras.layers.Dense(32, activation='relu'),
    keras.layers.Dropout(0.3),
    keras.layers.Dense(1, activation='sigmoid')
])

model_dropout.compile(
    optimizer='adam',
    loss='binary_crossentropy',
    metrics=['accuracy']
)

model_dropout.summary()

### 3. R√©gularisation L1/L2

La **r√©gularisation** p√©nalise les poids trop grands pour simplifier le mod√®le.

- **L1** : Pousse certains poids vers 0 (s√©lection de features)
- **L2** : R√©duit tous les poids (plus courant)

In [None]:
# Mod√®le avec r√©gularisation L2

from tensorflow.keras import regularizers

model_regularized = keras.Sequential([
    keras.layers.Dense(64, activation='relu', 
                      kernel_regularizer=regularizers.l2(0.01),
                      input_shape=(5,)),
    keras.layers.Dense(32, activation='relu',
                      kernel_regularizer=regularizers.l2(0.01)),
    keras.layers.Dense(1, activation='sigmoid')
])

model_regularized.compile(
    optimizer='adam',
    loss='binary_crossentropy',
    metrics=['accuracy']
)

print("Mod√®le avec r√©gularisation L2:")
model_regularized.summary()

### 4. Early Stopping

Arr√™ter l'entra√Ænement quand la performance sur la validation ne s'am√©liore plus.

In [None]:
# Early Stopping

from tensorflow.keras.callbacks import EarlyStopping

early_stop = EarlyStopping(
    monitor='val_loss',
    patience=10,  # Attendre 10 √©poques sans am√©lioration
    restore_best_weights=True
)

# Entra√Æner avec early stopping
history_early = model_dropout.fit(
    X_train, y_train,
    validation_data=(X_val, y_val),
    epochs=100,
    callbacks=[early_stop],
    verbose=0
)

print(f"‚úÖ Entra√Ænement arr√™t√© √† l'√©poque {len(history_early.history['loss'])}")

### üéØ Exercice 4 : Combattre le surapprentissage

Cr√©ez deux mod√®les et comparez-les :
1. Un mod√®le simple sans r√©gularisation
2. Un mod√®le avec Dropout et Early Stopping

In [None]:
# Exercice 4 : Comparer les mod√®les

# TODO: Cr√©ez deux mod√®les et comparez leurs performances



---

# Chapitre 6 : Projet final - Classification de fruits <a id="chapitre-6"></a>

## üéØ Objectif du projet

Cr√©er un r√©seau de neurones pour classifier des fruits locaux congolais :
- üçå **Banane**
- ü•≠ **Mangue**
- üçç **Ananas**

## √âtapes du projet

1. Cr√©er un dataset synth√©tique de features
2. Construire un r√©seau de neurones
3. Entra√Æner le mod√®le
4. √âvaluer les performances
5. Faire des pr√©dictions

In [None]:
# √âtape 1 : Cr√©er le dataset

# Features : [Longueur (cm), Largeur (cm), Poids (g), Couleur (0-1), Texture (0-1)]

np.random.seed(42)

# Bananes : allong√©es, jaunes
bananes = np.random.randn(100, 5) * np.array([2, 1, 20, 0.1, 0.1]) + np.array([18, 4, 120, 0.8, 0.3])

# Mangues : ovales, orange-rouge
mangues = np.random.randn(100, 5) * np.array([2, 2, 30, 0.1, 0.1]) + np.array([12, 8, 250, 0.6, 0.5])

# Ananas : gros, rugueux
ananas = np.random.randn(100, 5) * np.array([3, 3, 50, 0.1, 0.1]) + np.array([25, 12, 1000, 0.4, 0.8])

# Combiner les donn√©es
X_fruits = np.vstack([bananes, mangues, ananas])
y_fruits = np.hstack([
    np.zeros(100),  # Bananes = 0
    np.ones(100),   # Mangues = 1
    np.full(100, 2) # Ananas = 2
])

# M√©langer
indices = np.random.permutation(300)
X_fruits = X_fruits[indices]
y_fruits = y_fruits[indices]

print("Dataset cr√©√©:")
print(f"- Nombre d'exemples: {len(X_fruits)}")
print(f"- Features par exemple: {X_fruits.shape[1]}")
print(f"- Classes: 3 (Banane, Mangue, Ananas)")

In [None]:
# Visualiser les donn√©es

fig = plt.figure(figsize=(12, 5))

# Graphique 1 : Longueur vs Largeur
ax1 = fig.add_subplot(121)
colors = ['yellow', 'orange', 'green']
labels = ['Banane', 'Mangue', 'Ananas']

for i in range(3):
    mask = y_fruits == i
    ax1.scatter(X_fruits[mask, 0], X_fruits[mask, 1], 
               c=colors[i], label=labels[i], alpha=0.6, s=50)

ax1.set_xlabel('Longueur (cm)', fontsize=12)
ax1.set_ylabel('Largeur (cm)', fontsize=12)
ax1.set_title('Dimensions des fruits', fontsize=14, fontweight='bold')
ax1.legend()
ax1.grid(True, alpha=0.3)

# Graphique 2 : Poids vs Texture
ax2 = fig.add_subplot(122)

for i in range(3):
    mask = y_fruits == i
    ax2.scatter(X_fruits[mask, 2], X_fruits[mask, 4], 
               c=colors[i], label=labels[i], alpha=0.6, s=50)

ax2.set_xlabel('Poids (g)', fontsize=12)
ax2.set_ylabel('Texture', fontsize=12)
ax2.set_title('Poids et texture des fruits', fontsize=14, fontweight='bold')
ax2.legend()
ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

In [None]:
# √âtape 2 : Pr√©parer les donn√©es

# Split train/test
X_train_fruits, X_test_fruits, y_train_fruits, y_test_fruits = train_test_split(
    X_fruits, y_fruits, test_size=0.2, random_state=42
)

# Normaliser
scaler_fruits = StandardScaler()
X_train_fruits_scaled = scaler_fruits.fit_transform(X_train_fruits)
X_test_fruits_scaled = scaler_fruits.transform(X_test_fruits)

# Convertir les labels en one-hot encoding
y_train_fruits_cat = keras.utils.to_categorical(y_train_fruits, 3)
y_test_fruits_cat = keras.utils.to_categorical(y_test_fruits, 3)

print("Donn√©es pr√©par√©es:")
print(f"- Entra√Ænement: {len(X_train_fruits)} exemples")
print(f"- Test: {len(X_test_fruits)} exemples")
print(f"- Shape des labels: {y_train_fruits_cat.shape}")

In [None]:
# √âtape 3 : Construire le mod√®le

model_fruits = keras.Sequential([
    keras.layers.Dense(32, activation='relu', input_shape=(5,)),
    keras.layers.Dropout(0.3),
    keras.layers.Dense(16, activation='relu'),
    keras.layers.Dropout(0.2),
    keras.layers.Dense(8, activation='relu'),
    keras.layers.Dense(3, activation='softmax')  # 3 classes
])

model_fruits.compile(
    optimizer='adam',
    loss='categorical_crossentropy',
    metrics=['accuracy']
)

print("Architecture du mod√®le:")
model_fruits.summary()

In [None]:
# √âtape 4 : Entra√Æner le mod√®le

early_stop_fruits = EarlyStopping(
    monitor='val_loss',
    patience=20,
    restore_best_weights=True
)

history_fruits = model_fruits.fit(
    X_train_fruits_scaled, y_train_fruits_cat,
    validation_split=0.2,
    epochs=100,
    batch_size=16,
    callbacks=[early_stop_fruits],
    verbose=0
)

# Visualiser l'entra√Ænement
fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# Perte
axes[0].plot(history_fruits.history['loss'], label='Entra√Ænement', linewidth=2)
axes[0].plot(history_fruits.history['val_loss'], label='Validation', linewidth=2)
axes[0].set_xlabel('√âpoque', fontsize=12)
axes[0].set_ylabel('Perte', fontsize=12)
axes[0].set_title('√âvolution de la perte', fontsize=14, fontweight='bold')
axes[0].legend()
axes[0].grid(True, alpha=0.3)

# Pr√©cision
axes[1].plot(history_fruits.history['accuracy'], label='Entra√Ænement', linewidth=2)
axes[1].plot(history_fruits.history['val_accuracy'], label='Validation', linewidth=2)
axes[1].set_xlabel('√âpoque', fontsize=12)
axes[1].set_ylabel('Pr√©cision', fontsize=12)
axes[1].set_title('√âvolution de la pr√©cision', fontsize=14, fontweight='bold')
axes[1].legend()
axes[1].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print(f"\n‚úÖ Entra√Ænement termin√© en {len(history_fruits.history['loss'])} √©poques")

In [None]:
# √âtape 5 : √âvaluer le mod√®le

test_loss, test_accuracy = model_fruits.evaluate(
    X_test_fruits_scaled, y_test_fruits_cat, verbose=0
)

print("\n" + "="*50)
print("üìä R√âSULTATS FINAUX")
print("="*50)
print(f"Perte sur le test: {test_loss:.4f}")
print(f"Pr√©cision sur le test: {test_accuracy * 100:.2f}%")
print("="*50)

In [None]:
# Matrice de confusion

from sklearn.metrics import confusion_matrix, classification_report
import seaborn as sns

# Pr√©dictions
y_pred_proba = model_fruits.predict(X_test_fruits_scaled, verbose=0)
y_pred = np.argmax(y_pred_proba, axis=1)

# Matrice de confusion
cm = confusion_matrix(y_test_fruits, y_pred)

# Visualiser
plt.figure(figsize=(8, 6))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', 
            xticklabels=['Banane', 'Mangue', 'Ananas'],
            yticklabels=['Banane', 'Mangue', 'Ananas'])
plt.xlabel('Pr√©diction', fontsize=12)
plt.ylabel('V√©rit√©', fontsize=12)
plt.title('Matrice de confusion - Classification de fruits', fontsize=14, fontweight='bold')
plt.show()

# Rapport de classification
print("\nRapport de classification:")
print(classification_report(y_test_fruits, y_pred, 
                          target_names=['Banane', 'Mangue', 'Ananas']))

In [None]:
# √âtape 6 : Faire des pr√©dictions sur de nouveaux fruits

# Nouveaux fruits √† classifier
nouveaux_fruits = np.array([
    [20, 4, 130, 0.85, 0.25],  # Devrait √™tre une banane
    [11, 7, 240, 0.55, 0.48],  # Devrait √™tre une mangue
    [26, 13, 1050, 0.38, 0.82], # Devrait √™tre un ananas
])

# Normaliser
nouveaux_fruits_scaled = scaler_fruits.transform(nouveaux_fruits)

# Pr√©dire
predictions = model_fruits.predict(nouveaux_fruits_scaled, verbose=0)

# Afficher les r√©sultats
fruit_names = ['Banane', 'Mangue', 'Ananas']

print("\nüçé PR√âDICTIONS SUR DE NOUVEAUX FRUITS")
print("="*60)

for i, pred in enumerate(predictions):
    predicted_class = np.argmax(pred)
    confidence = pred[predicted_class] * 100
    
    print(f"\nFruit {i+1}:")
    print(f"  Caract√©ristiques: {nouveaux_fruits[i]}")
    print(f"  Pr√©diction: {fruit_names[predicted_class]}")
    print(f"  Confiance: {confidence:.2f}%")
    print(f"  Probabilit√©s:")
    for j, prob in enumerate(pred):
        print(f"    - {fruit_names[j]}: {prob*100:.2f}%")

print("\n" + "="*60)

### üéØ Exercice 5 : Am√©liorer le mod√®le

Essayez d'am√©liorer la performance du mod√®le en :
1. Ajoutant plus de couches
2. Modifiant le nombre de neurones
3. Testant diff√©rentes fonctions d'activation
4. Ajustant le dropout

In [None]:
# Exercice 5 : Am√©liorez le mod√®le

# TODO: Cr√©ez une version am√©lior√©e du mod√®le



---

## üéì R√©sum√© du module

### Ce que vous avez appris

1. **Deep Learning vs ML classique**
   - Extraction automatique de features
   - Besoin de grandes quantit√©s de donn√©es
   - Applications en RDC

2. **R√©seaux de neurones**
   - Architecture (couches, neurones)
   - Fonctions d'activation (ReLU, Sigmoid, Softmax)
   - Propagation avant et arri√®re

3. **Entra√Ænement**
   - Fonctions de perte
   - Backpropagation
   - Optimiseurs (Adam, SGD)

4. **Frameworks**
   - TensorFlow/Keras
   - PyTorch
   - Comparaison et choix

5. **Probl√®mes courants**
   - Surapprentissage et solutions
   - Dropout, r√©gularisation
   - Early stopping

6. **Projet pratique**
   - Classification multi-classes
   - √âvaluation de performance
   - Matrice de confusion

### Prochaines √©tapes

1. **R√©seaux convolutifs (CNN)**
   - Traitement d'images
   - D√©tection d'objets

2. **R√©seaux r√©currents (RNN/LSTM)**
   - S√©ries temporelles
   - Traitement du langage

3. **Transfer Learning**
   - Utiliser des mod√®les pr√©-entra√Æn√©s
   - Fine-tuning

4. **D√©ploiement**
   - API REST
   - Applications mobiles

---

## üìö Ressources suppl√©mentaires

### Cours en ligne
- [Deep Learning Specialization - Coursera](https://www.coursera.org/specializations/deep-learning)
- [Fast.ai - Practical Deep Learning](https://www.fast.ai/)
- [TensorFlow Tutorials](https://www.tensorflow.org/tutorials)

### Livres
- "Deep Learning" - Ian Goodfellow
- "Hands-On Machine Learning" - Aur√©lien G√©ron
- "Neural Networks and Deep Learning" - Michael Nielsen (gratuit)

### Communaut√©s
- [Kaggle](https://www.kaggle.com/) - Comp√©titions et datasets
- [Papers With Code](https://paperswithcode.com/) - Derni√®res recherches
- [Reddit r/MachineLearning](https://www.reddit.com/r/MachineLearning/)

---

**F√©licitations ! Vous avez termin√© le module Deep Learning ! üéâ**

*Continuez √† pratiquer et √† explorer. Le Deep Learning est un domaine en constante √©volution !*