# Introduction aux Auto-encodeurs avec TensorFlow/Keras

## Objectifs de ce notebook

Dans ce notebook, nous allons explorer les auto-encodeurs, une architecture fondamentale du deep learning pour l'apprentissage non supervis√© :

1. **Auto-encodeur Dense (Vanilla)** - L'architecture de base
2. **Auto-encodeur Convolutif** - Optimis√© pour les images
3. **Denoising Auto-encodeur** - Robuste au bruit
4. **Visualisation de l'espace latent** - Comprendre les repr√©sentations apprises

Nous utiliserons le dataset **Fashion MNIST** pour maintenir la coh√©rence avec les autres notebooks.

## Qu'est-ce qu'un Auto-encodeur ?

Un auto-encodeur est un r√©seau de neurones qui apprend √† **compresser** puis **reconstruire** ses propres entr√©es :

```
Input (784) ‚Üí Encoder ‚Üí Latent Space (32) ‚Üí Decoder ‚Üí Output (784)
```

### Applications pratiques :
- üé® **Compression d'images**
- üîç **D√©tection d'anomalies**
- üßπ **D√©bruitage d'images**
- üé≠ **G√©n√©ration de nouvelles donn√©es**
- üìä **R√©duction de dimensionnalit√©**
- üîê **Extraction de features pour d'autres t√¢ches**

## 1. Imports et configuration

In [None]:
# Biblioth√®ques principales
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from IPython.display import clear_output
import warnings
warnings.filterwarnings('ignore')

# TensorFlow et Keras
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers, models, Model
from tensorflow.keras.datasets import fashion_mnist
from tensorflow.keras.callbacks import Callback

# Utilitaires
from sklearn.manifold import TSNE
from sklearn.decomposition import PCA

# Configuration GPU
try:
    gpus = tf.config.list_physical_devices('GPU')
    if gpus:
        for gpu in gpus:
            tf.config.experimental.set_memory_growth(gpu, True)
        print(f"‚úÖ GPU(s) d√©tect√©(s): {len(gpus)} - Croissance m√©moire activ√©e")
    else:
        print("‚ÑπÔ∏è  Aucun GPU d√©tect√© - Utilisation du CPU")
except Exception as e:
    print(f"‚ö†Ô∏è  Configuration GPU: {e}")
    print("Utilisation du CPU par d√©faut")

# Configuration graphiques
plt.style.use('seaborn-v0_8-darkgrid')
sns.set_palette("husl")

# Reproductibilit√©
np.random.seed(42)
tf.random.set_seed(42)

print(f"\nüì¶ TensorFlow version: {tf.__version__}")
print(f"üì¶ Keras version: {keras.__version__}")

## 2. Chargement et pr√©paration des donn√©es

### 2.1 Chargement du dataset

In [None]:
# Chargement
(X_train, y_train), (X_test, y_test) = fashion_mnist.load_data()

# Noms des classes
class_names = ['T-shirt/top', 'Pantalon', 'Pull', 'Robe', 'Manteau',
               'Sandale', 'Chemise', 'Basket', 'Sac', 'Bottine']

print(f"üìä Forme des donn√©es d'entra√Ænement: {X_train.shape}")
print(f"üìä Forme des donn√©es de test: {X_test.shape}")
print(f"üìä Plage des valeurs: [{X_train.min()}, {X_train.max()}]")
print(f"\nüí° Pour les auto-encodeurs, nous n'utiliserons PAS les labels (apprentissage non supervis√©)")

### 2.2 Visualisation du dataset

In [None]:
# Visualisation
fig, axes = plt.subplots(3, 6, figsize=(18, 9))
fig.suptitle('√âchantillon du dataset Fashion MNIST', fontsize=16, fontweight='bold')

for i, ax in enumerate(axes.flat):
    ax.imshow(X_train[i], cmap='gray')
    ax.set_title(f'{class_names[y_train[i]]}', fontsize=11)
    ax.axis('off')

plt.tight_layout()
plt.show()

### 2.3 Normalisation des donn√©es

**Important** : La normalisation est cruciale pour les auto-encodeurs :
- Valeurs entre 0 et 1
- Facilite la convergence
- Permet d'utiliser une fonction d'activation sigmoid en sortie

In [None]:
# Normalisation
X_train_normalized = X_train.astype('float32') / 255.0
X_test_normalized = X_test.astype('float32') / 255.0

print(f"‚úÖ Normalisation effectu√©e")
print(f"Nouvelles valeurs - Min: {X_train_normalized.min():.2f}, Max: {X_train_normalized.max():.2f}")
print(f"Moyenne: {X_train_normalized.mean():.4f}, √âcart-type: {X_train_normalized.std():.4f}")

### 2.4 Cr√©ation d'un set de validation

In [None]:
# Split train/validation
X_val = X_train_normalized[50000:]
X_train_final = X_train_normalized[:50000]

# Labels pour l'analyse (pas pour l'entra√Ænement)
y_val = y_train[50000:]
y_train_final = y_train[:50000]

print(f"üì¶ Donn√©es d'entra√Ænement: {X_train_final.shape[0]:,} exemples")
print(f"üì¶ Donn√©es de validation: {X_val.shape[0]:,} exemples")
print(f"üì¶ Donn√©es de test: {X_test_normalized.shape[0]:,} exemples")

## 3. Callback personnalis√© pour visualisation

Ce callback affiche les reconstructions en temps r√©el pendant l'entra√Ænement.

In [None]:
class AutoencoderVisualizationCallback(Callback):
    """
    Callback pour visualiser les reconstructions et les m√©triques en temps r√©el.
    """
    def __init__(self, validation_data, n_images=8):
        super().__init__()
        self.validation_data = validation_data
        self.n_images = n_images
        # S√©lection d'images pour visualisation
        self.test_images = validation_data[:n_images]
        
    def on_train_begin(self, logs=None):
        self.epochs = []
        self.loss = []
        self.val_loss = []
        
    def on_epoch_end(self, epoch, logs=None):
        # Enregistrement des m√©triques
        self.epochs.append(epoch + 1)
        self.loss.append(logs.get('loss'))
        self.val_loss.append(logs.get('val_loss'))
        
        # Effacement et redessin
        clear_output(wait=True)
        
        # Cr√©ation de la figure
        fig = plt.figure(figsize=(20, 8))
        gs = fig.add_gridspec(3, self.n_images + 1, hspace=0.3, wspace=0.3)
        
        # Graphique de la loss (prend 2 colonnes)
        ax_loss = fig.add_subplot(gs[:, 0])
        ax_loss.plot(self.epochs, self.loss, 'o-', label='Loss Train', 
                    linewidth=2.5, markersize=8, color='#2E86AB')
        ax_loss.plot(self.epochs, self.val_loss, 's-', label='Loss Validation', 
                    linewidth=2.5, markersize=8, color='#A23B72')
        ax_loss.set_xlabel('Epoch', fontsize=12, fontweight='bold')
        ax_loss.set_ylabel('Loss (MSE)', fontsize=12, fontweight='bold')
        ax_loss.set_title('√âvolution de la Loss', fontsize=14, fontweight='bold')
        ax_loss.legend(fontsize=10)
        ax_loss.grid(alpha=0.3)
        
        # Pr√©dictions
        reconstructed = self.model.predict(self.test_images, verbose=0)
        
        # Images originales
        for i in range(self.n_images):
            ax = fig.add_subplot(gs[0, i + 1])
            img = self.test_images[i].reshape(28, 28)
            ax.imshow(img, cmap='gray')
            if i == 0:
                ax.set_ylabel('Original', fontsize=11, fontweight='bold')
            ax.set_xticks([])
            ax.set_yticks([])
        
        # Images reconstruites
        for i in range(self.n_images):
            ax = fig.add_subplot(gs[1, i + 1])
            img = reconstructed[i].reshape(28, 28)
            ax.imshow(img, cmap='gray')
            if i == 0:
                ax.set_ylabel('Reconstruit', fontsize=11, fontweight='bold')
            ax.set_xticks([])
            ax.set_yticks([])
        
        # Diff√©rence (erreur)
        for i in range(self.n_images):
            ax = fig.add_subplot(gs[2, i + 1])
            original = self.test_images[i].reshape(28, 28)
            reconstructed_img = reconstructed[i].reshape(28, 28)
            diff = np.abs(original - reconstructed_img)
            im = ax.imshow(diff, cmap='hot', vmin=0, vmax=1)
            if i == 0:
                ax.set_ylabel('Erreur', fontsize=11, fontweight='bold')
            ax.set_xticks([])
            ax.set_yticks([])
        
        plt.suptitle(f'Auto-encodeur - Epoch {epoch + 1}/{self.params["epochs"]}', 
                    fontsize=16, fontweight='bold', y=0.98)
        plt.show()
        
        # Affichage textuel
        print(f"\nEpoch {epoch + 1}/{self.params['epochs']}")
        print(f"Loss: {logs.get('loss'):.6f} - Val Loss: {logs.get('val_loss'):.6f}")
        
        # Calcul de l'erreur moyenne de reconstruction
        mse = np.mean((self.test_images - reconstructed) ** 2)
        print(f"MSE moyenne sur √©chantillon: {mse:.6f}")

---

# PARTIE 1 : AUTO-ENCODEUR DENSE (VANILLA)

## 4. Architecture de l'auto-encodeur dense

### Principe de fonctionnement

Un auto-encodeur dense se compose de deux parties :

1. **Encoder** : Compresse l'entr√©e vers une repr√©sentation latente
   ```
   Input (784) ‚Üí Dense(256) ‚Üí Dense(128) ‚Üí Latent (32)
   ```

2. **Decoder** : Reconstruit l'image √† partir de la repr√©sentation latente
   ```
   Latent (32) ‚Üí Dense(128) ‚Üí Dense(256) ‚Üí Output (784)
   ```

### Fonction de perte

Pour les auto-encodeurs, on utilise typiquement :
- **MSE (Mean Squared Error)** : Mesure la diff√©rence pixel par pixel
- **Binary Crossentropy** : Alternative pour images normalis√©es [0,1]

### 4.1 Pr√©paration des donn√©es pour l'auto-encodeur dense

In [None]:
# Aplatissement des images
X_train_flat = X_train_final.reshape(-1, 28 * 28)
X_val_flat = X_val.reshape(-1, 28 * 28)
X_test_flat = X_test_normalized.reshape(-1, 28 * 28)

print(f"‚úÖ Forme apr√®s aplatissement: {X_train_flat.shape}")
print(f"   Chaque image est un vecteur de {28*28} valeurs")

### 4.2 Construction de l'auto-encodeur dense

In [None]:
def create_dense_autoencoder(latent_dim=32):
    """
    Cr√©e un auto-encodeur dense avec une dimension latente configurable.
    
    Args:
        latent_dim: Dimension de l'espace latent (bottleneck)
    
    Returns:
        autoencoder: Mod√®le complet
        encoder: Partie encoder seule
        decoder: Partie decoder seule
    """
    # === ENCODER ===
    encoder_input = layers.Input(shape=(784,), name='encoder_input')
    x = layers.Dense(256, activation='relu', name='encoder_dense_1')(encoder_input)
    x = layers.Dense(128, activation='relu', name='encoder_dense_2')(x)
    latent = layers.Dense(latent_dim, activation='relu', name='latent_space')(x)
    
    encoder = Model(encoder_input, latent, name='encoder')
    
    # === DECODER ===
    decoder_input = layers.Input(shape=(latent_dim,), name='decoder_input')
    x = layers.Dense(128, activation='relu', name='decoder_dense_1')(decoder_input)
    x = layers.Dense(256, activation='relu', name='decoder_dense_2')(x)
    decoder_output = layers.Dense(784, activation='sigmoid', name='decoder_output')(x)
    
    decoder = Model(decoder_input, decoder_output, name='decoder')
    
    # === AUTOENCODER COMPLET ===
    autoencoder_input = layers.Input(shape=(784,), name='autoencoder_input')
    encoded = encoder(autoencoder_input)
    decoded = decoder(encoded)
    autoencoder = Model(autoencoder_input, decoded, name='autoencoder')
    
    return autoencoder, encoder, decoder

# Cr√©ation du mod√®le
latent_dim = 32
dense_autoencoder, dense_encoder, dense_decoder = create_dense_autoencoder(latent_dim)

print("="*70)
print("üìä ARCHITECTURE DE L'AUTO-ENCODEUR DENSE")
print("="*70)
print("\nüîπ ENCODER:")
dense_encoder.summary()
print("\nüîπ DECODER:")
dense_decoder.summary()
print("\nüîπ AUTOENCODER COMPLET:")
dense_autoencoder.summary()

### 4.3 Visualisation de l'architecture

In [None]:
# Analyse des param√®tres
encoder_params = dense_encoder.count_params()
decoder_params = dense_decoder.count_params()
total_params = dense_autoencoder.count_params()

fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 6))

# R√©partition des param√®tres
components = ['Encoder', 'Decoder']
params = [encoder_params, decoder_params]
colors = ['#3498db', '#e74c3c']

bars = ax1.bar(components, params, color=colors, edgecolor='black', linewidth=2, width=0.6)
ax1.set_ylabel('Nombre de param√®tres', fontsize=12, fontweight='bold')
ax1.set_title('R√©partition des param√®tres', fontsize=14, fontweight='bold')
ax1.grid(axis='y', alpha=0.3)

for bar, param in zip(bars, params):
    height = bar.get_height()
    ax1.text(bar.get_x() + bar.get_width()/2., height,
            f'{param:,}',
            ha='center', va='bottom', fontsize=12, fontweight='bold')

# Diagramme du flux de donn√©es
ax2.axis('off')
ax2.text(0.5, 0.9, 'FLUX DE DONN√âES', ha='center', fontsize=16, fontweight='bold')
ax2.text(0.5, 0.75, 'Input (784 dims)', ha='center', fontsize=12, 
        bbox=dict(boxstyle='round', facecolor='lightblue', edgecolor='black', linewidth=2))
ax2.arrow(0.5, 0.70, 0, -0.08, head_width=0.05, head_length=0.02, fc='black', ec='black')
ax2.text(0.5, 0.55, 'Dense(256) + ReLU', ha='center', fontsize=11, 
        bbox=dict(boxstyle='round', facecolor='lightgreen', edgecolor='black', linewidth=1.5))
ax2.arrow(0.5, 0.50, 0, -0.08, head_width=0.05, head_length=0.02, fc='black', ec='black')
ax2.text(0.5, 0.35, 'Dense(128) + ReLU', ha='center', fontsize=11, 
        bbox=dict(boxstyle='round', facecolor='lightgreen', edgecolor='black', linewidth=1.5))
ax2.arrow(0.5, 0.30, 0, -0.08, head_width=0.05, head_length=0.02, fc='black', ec='black')
ax2.text(0.5, 0.15, f'LATENT ({latent_dim} dims)', ha='center', fontsize=12, fontweight='bold',
        bbox=dict(boxstyle='round', facecolor='yellow', edgecolor='red', linewidth=2))
ax2.text(0.1, 0.15, '‚Üê ENCODER', ha='center', fontsize=10, color='blue', fontweight='bold')
ax2.text(0.9, 0.15, 'DECODER ‚Üí', ha='center', fontsize=10, color='red', fontweight='bold')
ax2.set_xlim(0, 1)
ax2.set_ylim(0, 1)

plt.tight_layout()
plt.show()

print(f"\n{'='*70}")
print(f"üìä TOTAL PARAM√àTRES : {total_params:,}")
print(f"   Taux de compression : 784 ‚Üí {latent_dim} (√ó {784/latent_dim:.1f})")
print(f"{'='*70}")

### 4.4 Compilation du mod√®le

In [None]:
# Compilation
dense_autoencoder.compile(
    optimizer=keras.optimizers.Adam(learning_rate=0.001),
    loss='binary_crossentropy',  # Ou 'mse' pour Mean Squared Error
    metrics=['mse']  # On suit aussi la MSE
)

print("‚úÖ Auto-encodeur compil√©")
print(f"   Optimiseur: Adam (lr=0.001)")
print(f"   Loss: Binary Crossentropy")
print(f"   M√©trique: MSE")

### 4.5 Entra√Ænement de l'auto-encodeur dense

In [None]:
# Cr√©ation du callback de visualisation
viz_callback = AutoencoderVisualizationCallback(X_val_flat, n_images=8)

print("üöÄ D√©but de l'entra√Ænement de l'auto-encodeur DENSE...\n")

# Entra√Ænement
# Note: Pour l'auto-encodeur, X = Y (on reconstruit l'entr√©e)
history_dense = dense_autoencoder.fit(
    X_train_flat, X_train_flat,  # Input = Output
    validation_data=(X_val_flat, X_val_flat),
    epochs=20,
    batch_size=256,
    callbacks=[viz_callback],
    verbose=0
)

print("\n‚úÖ Entra√Ænement termin√© !")

### 4.6 √âvaluation de l'auto-encodeur dense

In [None]:
# √âvaluation sur le set de test
test_loss, test_mse = dense_autoencoder.evaluate(X_test_flat, X_test_flat, verbose=0)

# Reconstruction d'exemples
n_examples = 10
test_sample = X_test_flat[:n_examples]
reconstructed = dense_autoencoder.predict(test_sample, verbose=0)

print("="*70)
print("üìä R√âSULTATS - AUTO-ENCODEUR DENSE")
print("="*70)
print(f"Loss sur le test (Binary Crossentropy): {test_loss:.6f}")
print(f"MSE sur le test: {test_mse:.6f}")
print(f"RMSE sur le test: {np.sqrt(test_mse):.6f}")
print("="*70)

# Visualisation d√©taill√©e
fig, axes = plt.subplots(3, n_examples, figsize=(20, 6))
fig.suptitle('Reconstruction - Auto-encodeur Dense', fontsize=16, fontweight='bold')

for i in range(n_examples):
    # Original
    axes[0, i].imshow(test_sample[i].reshape(28, 28), cmap='gray')
    axes[0, i].axis('off')
    if i == 0:
        axes[0, i].set_ylabel('Original', fontsize=12, fontweight='bold')
    
    # Reconstruit
    axes[1, i].imshow(reconstructed[i].reshape(28, 28), cmap='gray')
    axes[1, i].axis('off')
    if i == 0:
        axes[1, i].set_ylabel('Reconstruit', fontsize=12, fontweight='bold')
    
    # Diff√©rence
    diff = np.abs(test_sample[i].reshape(28, 28) - reconstructed[i].reshape(28, 28))
    im = axes[2, i].imshow(diff, cmap='hot', vmin=0, vmax=1)
    axes[2, i].axis('off')
    if i == 0:
        axes[2, i].set_ylabel('Erreur', fontsize=12, fontweight='bold')
    
    # MSE pour cette image
    mse_img = np.mean((test_sample[i] - reconstructed[i]) ** 2)
    axes[2, i].set_title(f'MSE: {mse_img:.4f}', fontsize=9)

# Colorbar
fig.colorbar(im, ax=axes[2, :], orientation='horizontal', pad=0.05, fraction=0.05)

plt.tight_layout()
plt.show()

### 4.7 Visualisation de l'espace latent

L'espace latent est la repr√©sentation compress√©e apprise par l'encoder. Visualisons-le avec t-SNE.

In [None]:
# Encodage du set de test
print("‚è≥ Encodage des donn√©es de test...")
latent_representations = dense_encoder.predict(X_test_flat, verbose=0)
print(f"‚úÖ Forme de l'espace latent: {latent_representations.shape}")

# R√©duction avec t-SNE pour visualisation 2D
print("‚è≥ R√©duction de dimension avec t-SNE (cela peut prendre 1-2 minutes)...")
tsne = TSNE(n_components=2, random_state=42, perplexity=30)
latent_2d = tsne.fit_transform(latent_representations[:5000])  # Sur 5000 exemples
print("‚úÖ t-SNE termin√©")

# Visualisation
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(18, 7))

# Visualisation color√©e par classe
scatter = ax1.scatter(latent_2d[:, 0], latent_2d[:, 1], 
                     c=y_test[:5000], cmap='tab10', 
                     alpha=0.6, s=10, edgecolors='none')
ax1.set_title('Espace latent (color√© par classe)\nAuto-encodeur Dense', 
             fontsize=14, fontweight='bold')
ax1.set_xlabel('Dimension 1', fontsize=12)
ax1.set_ylabel('Dimension 2', fontsize=12)
cbar = plt.colorbar(scatter, ax=ax1, ticks=range(10))
cbar.set_label('Classe', fontsize=11)
cbar.ax.set_yticklabels(class_names, fontsize=8)
ax1.grid(alpha=0.3)

# Distribution par classe
for i in range(10):
    mask = y_test[:5000] == i
    ax2.scatter(latent_2d[mask, 0], latent_2d[mask, 1], 
               label=class_names[i], alpha=0.6, s=15)
ax2.set_title('Espace latent (s√©paration par classe)', fontsize=14, fontweight='bold')
ax2.set_xlabel('Dimension 1', fontsize=12)
ax2.set_ylabel('Dimension 2', fontsize=12)
ax2.legend(loc='best', fontsize=9, ncol=2)
ax2.grid(alpha=0.3)

plt.tight_layout()
plt.show()

print("\nüí° INTERPR√âTATION:")
print("   - Les points proches dans l'espace latent repr√©sentent des images similaires")
print("   - Un bon auto-encodeur groupe naturellement les classes similaires")
print("   - On peut voir des clusters m√™me sans supervision !")

---

# PARTIE 2 : AUTO-ENCODEUR CONVOLUTIF

## 5. Architecture de l'auto-encodeur convolutif

### Pourquoi utiliser des convolutions ?

Les auto-encodeurs convolutifs sont plus adapt√©s aux images car ils :
- ‚úÖ **Pr√©servent la structure spatiale**
- ‚úÖ **Utilisent moins de param√®tres**
- ‚úÖ **Capturent mieux les features locales**
- ‚úÖ **Produisent des reconstructions plus nettes**

### Architecture

```
Encoder:
Input (28√ó28√ó1) ‚Üí Conv2D(32) + MaxPool ‚Üí Conv2D(64) + MaxPool ‚Üí Flatten ‚Üí Dense(latent_dim)

Decoder:
Dense ‚Üí Reshape ‚Üí Conv2DTranspose(64) ‚Üí Conv2DTranspose(32) ‚Üí Conv2D(1)
```

### 5.1 Pr√©paration des donn√©es pour CNN

In [None]:
# Ajout de la dimension des canaux
X_train_cnn = X_train_final.reshape(-1, 28, 28, 1)
X_val_cnn = X_val.reshape(-1, 28, 28, 1)
X_test_cnn = X_test_normalized.reshape(-1, 28, 28, 1)

print(f"‚úÖ Forme pour CNN: {X_train_cnn.shape}")
print(f"   Format: (nombre_images, hauteur, largeur, canaux)")

### 5.2 Construction de l'auto-encodeur convolutif

In [None]:
def create_convolutional_autoencoder(latent_dim=64):
    """
    Cr√©e un auto-encodeur convolutif.
    
    Args:
        latent_dim: Dimension de l'espace latent
    
    Returns:
        autoencoder, encoder, decoder
    """
    # === ENCODER ===
    encoder_input = layers.Input(shape=(28, 28, 1), name='encoder_input')
    
    # Bloc convolutif 1
    x = layers.Conv2D(32, (3, 3), activation='relu', padding='same', name='conv1')(encoder_input)
    x = layers.MaxPooling2D((2, 2), padding='same', name='pool1')(x)  # 14x14
    
    # Bloc convolutif 2
    x = layers.Conv2D(64, (3, 3), activation='relu', padding='same', name='conv2')(x)
    x = layers.MaxPooling2D((2, 2), padding='same', name='pool2')(x)  # 7x7
    
    # Aplatissement et compression vers l'espace latent
    x = layers.Flatten(name='flatten')(x)
    latent = layers.Dense(latent_dim, activation='relu', name='latent_space')(x)
    
    encoder = Model(encoder_input, latent, name='conv_encoder')
    
    # === DECODER ===
    decoder_input = layers.Input(shape=(latent_dim,), name='decoder_input')
    
    # Expansion et reshape
    x = layers.Dense(7 * 7 * 64, activation='relu', name='dense_decoder')(decoder_input)
    x = layers.Reshape((7, 7, 64), name='reshape')(x)
    
    # D√©convolution 1 (upsampling)
    x = layers.Conv2DTranspose(64, (3, 3), activation='relu', strides=2, 
                               padding='same', name='deconv1')(x)  # 14x14
    
    # D√©convolution 2 (upsampling)
    x = layers.Conv2DTranspose(32, (3, 3), activation='relu', strides=2, 
                               padding='same', name='deconv2')(x)  # 28x28
    
    # Couche de sortie
    decoder_output = layers.Conv2D(1, (3, 3), activation='sigmoid', 
                                   padding='same', name='output')(x)
    
    decoder = Model(decoder_input, decoder_output, name='conv_decoder')
    
    # === AUTOENCODER COMPLET ===
    autoencoder_input = layers.Input(shape=(28, 28, 1), name='autoencoder_input')
    encoded = encoder(autoencoder_input)
    decoded = decoder(encoded)
    autoencoder = Model(autoencoder_input, decoded, name='conv_autoencoder')
    
    return autoencoder, encoder, decoder

# Cr√©ation du mod√®le
conv_latent_dim = 64
conv_autoencoder, conv_encoder, conv_decoder = create_convolutional_autoencoder(conv_latent_dim)

print("="*70)
print("üìä ARCHITECTURE DE L'AUTO-ENCODEUR CONVOLUTIF")
print("="*70)
print("\nüîπ ENCODER:")
conv_encoder.summary()
print("\nüîπ DECODER:")
conv_decoder.summary()

### 5.3 Comparaison Dense vs Convolutif

In [None]:
# Comptage des param√®tres
dense_total = dense_autoencoder.count_params()
conv_total = conv_autoencoder.count_params()

fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 6))

# Comparaison du nombre de param√®tres
models = ['Auto-encodeur\nDense', 'Auto-encodeur\nConvolutif']
params = [dense_total, conv_total]
colors = ['#3498db', '#2ecc71']

bars = ax1.bar(models, params, color=colors, edgecolor='black', linewidth=2, width=0.6)
ax1.set_ylabel('Nombre de param√®tres', fontsize=12, fontweight='bold')
ax1.set_title('Comparaison du nombre de param√®tres', fontsize=14, fontweight='bold')
ax1.grid(axis='y', alpha=0.3)

for bar, param in zip(bars, params):
    height = bar.get_height()
    ax1.text(bar.get_x() + bar.get_width()/2., height,
            f'{param:,}\nparam√®tres',
            ha='center', va='bottom', fontsize=11, fontweight='bold')

# Comparaison des dimensions latentes
latent_dims = ['Dense\n(latent=32)', 'Convolutif\n(latent=64)']
compression_ratios = [784/32, 784/64]
bars2 = ax2.bar(latent_dims, compression_ratios, color=colors, 
               edgecolor='black', linewidth=2, width=0.6)
ax2.set_ylabel('Taux de compression (√ó)', fontsize=12, fontweight='bold')
ax2.set_title('Taux de compression', fontsize=14, fontweight='bold')
ax2.grid(axis='y', alpha=0.3)

for bar, ratio in zip(bars2, compression_ratios):
    height = bar.get_height()
    ax2.text(bar.get_x() + bar.get_width()/2., height,
            f'√ó{ratio:.1f}',
            ha='center', va='bottom', fontsize=12, fontweight='bold')

plt.tight_layout()
plt.show()

print(f"\n{'='*70}")
print(f"üìä Dense      : {dense_total:,} param√®tres | Latent: 32 dims")
print(f"üìä Convolutif : {conv_total:,} param√®tres | Latent: 64 dims")
if conv_total < dense_total:
    print(f"\n‚úÖ Le CNN a {dense_total - conv_total:,} param√®tres de moins !")
else:
    print(f"\n‚ö†Ô∏è  Le CNN a {conv_total - dense_total:,} param√®tres de plus")
print(f"{'='*70}")

### 5.4 Compilation et entra√Ænement

In [None]:
# Compilation
conv_autoencoder.compile(
    optimizer=keras.optimizers.Adam(learning_rate=0.001),
    loss='binary_crossentropy',
    metrics=['mse']
)

print("‚úÖ Auto-encodeur convolutif compil√©")

# Callback de visualisation
viz_callback_conv = AutoencoderVisualizationCallback(X_val_cnn, n_images=8)

print("\nüöÄ D√©but de l'entra√Ænement de l'auto-encodeur CONVOLUTIF...\n")

# Entra√Ænement
history_conv = conv_autoencoder.fit(
    X_train_cnn, X_train_cnn,
    validation_data=(X_val_cnn, X_val_cnn),
    epochs=20,
    batch_size=256,
    callbacks=[viz_callback_conv],
    verbose=0
)

print("\n‚úÖ Entra√Ænement termin√© !")

### 5.5 √âvaluation et comparaison

In [None]:
# √âvaluation
conv_test_loss, conv_test_mse = conv_autoencoder.evaluate(X_test_cnn, X_test_cnn, verbose=0)

# Reconstruction d'exemples
n_examples = 10
test_sample_cnn = X_test_cnn[:n_examples]
reconstructed_conv = conv_autoencoder.predict(test_sample_cnn, verbose=0)

print("="*70)
print("üìä COMPARAISON FINALE")
print("="*70)
print(f"Dense      - Loss: {test_loss:.6f} | MSE: {test_mse:.6f} | RMSE: {np.sqrt(test_mse):.6f}")
print(f"Convolutif - Loss: {conv_test_loss:.6f} | MSE: {conv_test_mse:.6f} | RMSE: {np.sqrt(conv_test_mse):.6f}")
print("="*70)

if conv_test_mse < test_mse:
    improvement = ((test_mse - conv_test_mse) / test_mse) * 100
    print(f"\nüèÜ Le CNN est meilleur de {improvement:.2f}% !")
else:
    print(f"\nüèÜ Le Dense est meilleur !")

# Visualisation comparative
fig, axes = plt.subplots(4, n_examples, figsize=(20, 8))
fig.suptitle('Comparaison Dense vs Convolutif', fontsize=16, fontweight='bold')

# Pr√©dictions Dense
reconstructed_dense = dense_autoencoder.predict(X_test_flat[:n_examples], verbose=0)

for i in range(n_examples):
    # Original
    axes[0, i].imshow(X_test[i], cmap='gray')
    axes[0, i].axis('off')
    if i == 0:
        axes[0, i].set_ylabel('Original', fontsize=12, fontweight='bold')
    axes[0, i].set_title(class_names[y_test[i]], fontsize=9)
    
    # Dense
    axes[1, i].imshow(reconstructed_dense[i].reshape(28, 28), cmap='gray')
    axes[1, i].axis('off')
    if i == 0:
        axes[1, i].set_ylabel('Dense', fontsize=12, fontweight='bold')
    mse_dense = np.mean((X_test_flat[i] - reconstructed_dense[i]) ** 2)
    axes[1, i].set_xlabel(f'MSE: {mse_dense:.4f}', fontsize=8)
    
    # Convolutif
    axes[2, i].imshow(reconstructed_conv[i].reshape(28, 28), cmap='gray')
    axes[2, i].axis('off')
    if i == 0:
        axes[2, i].set_ylabel('Convolutif', fontsize=12, fontweight='bold')
    mse_conv = np.mean((X_test_cnn[i] - reconstructed_conv[i]) ** 2)
    axes[2, i].set_xlabel(f'MSE: {mse_conv:.4f}', fontsize=8)
    
    # Diff√©rence
    diff = np.abs(reconstructed_conv[i].reshape(28, 28) - reconstructed_dense[i].reshape(28, 28))
    axes[3, i].imshow(diff, cmap='RdYlGn_r', vmin=0, vmax=0.5)
    axes[3, i].axis('off')
    if i == 0:
        axes[3, i].set_ylabel('Diff Conv-Dense', fontsize=12, fontweight='bold')

plt.tight_layout()
plt.show()

---

# PARTIE 3 : DENOISING AUTO-ENCODEUR

## 6. D√©bruitage d'images

### Principe

Un **denoising autoencoder** apprend √† reconstruire des images propres √† partir d'images bruit√©es :

```
Image propre ‚Üí Ajout de bruit ‚Üí Image bruit√©e ‚Üí Encoder ‚Üí Decoder ‚Üí Image reconstruite (propre)
```

### Applications
- üì∑ Restauration de vieilles photos
- üé• Am√©lioration de vid√©os basse qualit√©
- üî¨ D√©bruitage d'images m√©dicales
- üõ∞Ô∏è Am√©lioration d'images satellites

### 6.1 Cr√©ation de donn√©es bruit√©es

In [None]:
def add_noise(images, noise_factor=0.3):
    """
    Ajoute du bruit gaussien aux images.
    
    Args:
        images: Images normalis√©es [0, 1]
        noise_factor: Intensit√© du bruit
    
    Returns:
        Images bruit√©es, clipp√©es entre [0, 1]
    """
    noisy_images = images + noise_factor * np.random.normal(
        loc=0.0, scale=1.0, size=images.shape
    )
    noisy_images = np.clip(noisy_images, 0.0, 1.0)
    return noisy_images

# Cr√©ation des donn√©es bruit√©es
noise_factor = 0.4

X_train_noisy = add_noise(X_train_cnn, noise_factor)
X_val_noisy = add_noise(X_val_cnn, noise_factor)
X_test_noisy = add_noise(X_test_cnn, noise_factor)

print(f"‚úÖ Bruit ajout√© avec facteur = {noise_factor}")
print(f"   Forme des donn√©es bruit√©es: {X_train_noisy.shape}")

### 6.2 Visualisation du bruit

In [None]:
# Visualisation de l'effet du bruit
n_samples = 10

fig, axes = plt.subplots(2, n_samples, figsize=(20, 5))
fig.suptitle(f'Effet du bruit (facteur = {noise_factor})', fontsize=16, fontweight='bold')

for i in range(n_samples):
    # Image originale
    axes[0, i].imshow(X_test_cnn[i].reshape(28, 28), cmap='gray')
    axes[0, i].axis('off')
    if i == 0:
        axes[0, i].set_ylabel('Originale', fontsize=12, fontweight='bold')
    
    # Image bruit√©e
    axes[1, i].imshow(X_test_noisy[i].reshape(28, 28), cmap='gray')
    axes[1, i].axis('off')
    if i == 0:
        axes[1, i].set_ylabel('Bruit√©e', fontsize=12, fontweight='bold')

plt.tight_layout()
plt.show()

### 6.3 Entra√Ænement du denoising autoencoder

**Note importante** : Nous utilisons la m√™me architecture que l'auto-encodeur convolutif, mais avec un entra√Ænement diff√©rent :
- **Input** : Images bruit√©es
- **Output cible** : Images propres

In [None]:
# Cr√©ation d'un nouveau mod√®le (m√™me architecture)
denoising_autoencoder, denoising_encoder, denoising_decoder = create_convolutional_autoencoder(conv_latent_dim)

# Compilation
denoising_autoencoder.compile(
    optimizer=keras.optimizers.Adam(learning_rate=0.001),
    loss='binary_crossentropy',
    metrics=['mse']
)

print("‚úÖ Denoising auto-encodeur cr√©√© et compil√©")

# Callback personnalis√© pour denoising
class DenoisingVisualizationCallback(Callback):
    def __init__(self, noisy_data, clean_data, n_images=8):
        super().__init__()
        self.noisy_data = noisy_data[:n_images]
        self.clean_data = clean_data[:n_images]
        self.n_images = n_images
        
    def on_train_begin(self, logs=None):
        self.epochs = []
        self.loss = []
        self.val_loss = []
        
    def on_epoch_end(self, epoch, logs=None):
        self.epochs.append(epoch + 1)
        self.loss.append(logs.get('loss'))
        self.val_loss.append(logs.get('val_loss'))
        
        clear_output(wait=True)
        
        fig = plt.figure(figsize=(20, 10))
        gs = fig.add_gridspec(4, self.n_images + 1, hspace=0.3, wspace=0.3)
        
        # Graphique de la loss
        ax_loss = fig.add_subplot(gs[:, 0])
        ax_loss.plot(self.epochs, self.loss, 'o-', label='Loss Train', 
                    linewidth=2.5, markersize=8, color='#2E86AB')
        ax_loss.plot(self.epochs, self.val_loss, 's-', label='Loss Validation', 
                    linewidth=2.5, markersize=8, color='#A23B72')
        ax_loss.set_xlabel('Epoch', fontsize=12, fontweight='bold')
        ax_loss.set_ylabel('Loss', fontsize=12, fontweight='bold')
        ax_loss.set_title('√âvolution de la Loss', fontsize=14, fontweight='bold')
        ax_loss.legend(fontsize=10)
        ax_loss.grid(alpha=0.3)
        
        # Pr√©dictions
        denoised = self.model.predict(self.noisy_data, verbose=0)
        
        # Affichage
        for i in range(self.n_images):
            # Original propre
            ax = fig.add_subplot(gs[0, i + 1])
            ax.imshow(self.clean_data[i].reshape(28, 28), cmap='gray')
            if i == 0:
                ax.set_ylabel('Original\n(propre)', fontsize=11, fontweight='bold')
            ax.set_xticks([])
            ax.set_yticks([])
            
            # Bruit√©e (input)
            ax = fig.add_subplot(gs[1, i + 1])
            ax.imshow(self.noisy_data[i].reshape(28, 28), cmap='gray')
            if i == 0:
                ax.set_ylabel('Bruit√©e\n(input)', fontsize=11, fontweight='bold')
            ax.set_xticks([])
            ax.set_yticks([])
            
            # D√©bruit√©e (output)
            ax = fig.add_subplot(gs[2, i + 1])
            ax.imshow(denoised[i].reshape(28, 28), cmap='gray')
            if i == 0:
                ax.set_ylabel('D√©bruit√©e\n(output)', fontsize=11, fontweight='bold')
            ax.set_xticks([])
            ax.set_yticks([])
            
            # Erreur vs original
            ax = fig.add_subplot(gs[3, i + 1])
            diff = np.abs(self.clean_data[i].reshape(28, 28) - denoised[i].reshape(28, 28))
            ax.imshow(diff, cmap='hot', vmin=0, vmax=1)
            if i == 0:
                ax.set_ylabel('Erreur', fontsize=11, fontweight='bold')
            ax.set_xticks([])
            ax.set_yticks([])
        
        plt.suptitle(f'Denoising Auto-encodeur - Epoch {epoch + 1}/{self.params["epochs"]}', 
                    fontsize=16, fontweight='bold', y=0.98)
        plt.show()
        
        print(f"\nEpoch {epoch + 1}/{self.params['epochs']}")
        print(f"Loss: {logs.get('loss'):.6f} - Val Loss: {logs.get('val_loss'):.6f}")

# Callback
denoising_viz_callback = DenoisingVisualizationCallback(X_val_noisy, X_val_cnn, n_images=8)

print("\nüöÄ D√©but de l'entra√Ænement du DENOISING auto-encodeur...\n")

# Entra√Ænement: INPUT = bruit√©e, OUTPUT = propre
history_denoising = denoising_autoencoder.fit(
    X_train_noisy, X_train_cnn,  # Input bruit√©e, output propre
    validation_data=(X_val_noisy, X_val_cnn),
    epochs=25,
    batch_size=256,
    callbacks=[denoising_viz_callback],
    verbose=0
)

print("\n‚úÖ Entra√Ænement termin√© !")

### 6.4 √âvaluation du denoising autoencoder

In [None]:
# √âvaluation
denoising_test_loss, denoising_test_mse = denoising_autoencoder.evaluate(
    X_test_noisy, X_test_cnn, verbose=0
)

# D√©bruitage d'exemples
n_examples = 15
test_noisy_sample = X_test_noisy[:n_examples]
test_clean_sample = X_test_cnn[:n_examples]
denoised_images = denoising_autoencoder.predict(test_noisy_sample, verbose=0)

print("="*70)
print("üìä R√âSULTATS - DENOISING AUTO-ENCODEUR")
print("="*70)
print(f"Loss sur le test: {denoising_test_loss:.6f}")
print(f"MSE sur le test: {denoising_test_mse:.6f}")
print("="*70)

# Calcul des m√©triques de qualit√©
# PSNR (Peak Signal-to-Noise Ratio) - Plus c'est √©lev√©, mieux c'est
def calculate_psnr(original, reconstructed):
    mse = np.mean((original - reconstructed) ** 2)
    if mse == 0:
        return float('inf')
    max_pixel = 1.0
    psnr = 20 * np.log10(max_pixel / np.sqrt(mse))
    return psnr

psnr_noisy = calculate_psnr(test_clean_sample, test_noisy_sample)
psnr_denoised = calculate_psnr(test_clean_sample, denoised_images)

print(f"\nüìä PSNR (Peak Signal-to-Noise Ratio):")
print(f"   Images bruit√©es:  {psnr_noisy:.2f} dB")
print(f"   Images d√©bruit√©es: {psnr_denoised:.2f} dB")
print(f"   Am√©lioration: {psnr_denoised - psnr_noisy:.2f} dB")

# Visualisation d√©taill√©e
fig, axes = plt.subplots(4, n_examples, figsize=(22, 8))
fig.suptitle('Performance du Denoising Auto-encodeur', fontsize=16, fontweight='bold')

for i in range(n_examples):
    # Original propre
    axes[0, i].imshow(test_clean_sample[i].reshape(28, 28), cmap='gray')
    axes[0, i].axis('off')
    if i == 0:
        axes[0, i].set_ylabel('Original\n(propre)', fontsize=11, fontweight='bold')
    
    # Bruit√©e
    axes[1, i].imshow(test_noisy_sample[i].reshape(28, 28), cmap='gray')
    axes[1, i].axis('off')
    if i == 0:
        axes[1, i].set_ylabel('Bruit√©e', fontsize=11, fontweight='bold')
    # MSE avec original
    mse_noisy = np.mean((test_clean_sample[i] - test_noisy_sample[i]) ** 2)
    axes[1, i].set_xlabel(f'MSE: {mse_noisy:.4f}', fontsize=8, color='red')
    
    # D√©bruit√©e
    axes[2, i].imshow(denoised_images[i].reshape(28, 28), cmap='gray')
    axes[2, i].axis('off')
    if i == 0:
        axes[2, i].set_ylabel('D√©bruit√©e', fontsize=11, fontweight='bold')
    # MSE avec original
    mse_denoised = np.mean((test_clean_sample[i] - denoised_images[i]) ** 2)
    axes[2, i].set_xlabel(f'MSE: {mse_denoised:.4f}', fontsize=8, color='green')
    
    # Erreur r√©siduelle
    diff = np.abs(test_clean_sample[i].reshape(28, 28) - denoised_images[i].reshape(28, 28))
    axes[3, i].imshow(diff, cmap='hot', vmin=0, vmax=0.5)
    axes[3, i].axis('off')
    if i == 0:
        axes[3, i].set_ylabel('Erreur\nr√©siduelle', fontsize=11, fontweight='bold')

plt.tight_layout()
plt.show()

print(f"\n‚úÖ Le denoising auto-encodeur r√©duit significativement le bruit !")

---

## 7. Applications pratiques des auto-encodeurs

### 7.1 D√©tection d'anomalies

Les auto-encodeurs sont excellents pour d√©tecter des anomalies :
- Entra√Æner sur des donn√©es "normales"
- Les anomalies produisent une erreur de reconstruction √©lev√©e

In [None]:
# Simulation de d√©tection d'anomalies
# Entra√Ænons un auto-encodeur uniquement sur les T-shirts (classe 0)

print("üîç Simulation de d√©tection d'anomalies...")
print("   Concept: Entra√Æner uniquement sur une classe, d√©tecter les autres\n")

# Filtrage: uniquement les T-shirts pour l'entra√Ænement
tshirt_mask = y_train_final == 0
X_train_tshirts = X_train_cnn[tshirt_mask][:5000]  # 5000 T-shirts

print(f"üì¶ Entra√Ænement sur {len(X_train_tshirts)} T-shirts uniquement")

# Cr√©ation et entra√Ænement rapide
anomaly_ae, _, _ = create_convolutional_autoencoder(latent_dim=32)
anomaly_ae.compile(optimizer='adam', loss='mse', metrics=['mse'])

print("‚è≥ Entra√Ænement rapide (10 epochs)...")
anomaly_ae.fit(
    X_train_tshirts, X_train_tshirts,
    epochs=10,
    batch_size=128,
    verbose=0
)
print("‚úÖ Entra√Ænement termin√©\n")

# Test sur diff√©rentes classes
classes_to_test = [0, 1, 2, 5, 9]  # T-shirt, Pantalon, Pull, Sandale, Bottine
reconstruction_errors = {}

for class_idx in classes_to_test:
    # S√©lection de 100 exemples de cette classe
    mask = y_test == class_idx
    X_class = X_test_cnn[mask][:100]
    
    # Reconstruction
    reconstructed = anomaly_ae.predict(X_class, verbose=0)
    
    # Calcul de l'erreur de reconstruction
    mse_per_image = np.mean((X_class - reconstructed) ** 2, axis=(1, 2, 3))
    reconstruction_errors[class_names[class_idx]] = mse_per_image

# Visualisation des erreurs de reconstruction
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(18, 6))

# Boxplot
ax1.boxplot(
    [reconstruction_errors[class_names[i]] for i in classes_to_test],
    labels=[class_names[i] for i in classes_to_test],
    patch_artist=True,
    boxprops=dict(facecolor='lightblue', edgecolor='black', linewidth=1.5),
    medianprops=dict(color='red', linewidth=2)
)
ax1.set_ylabel('Erreur de reconstruction (MSE)', fontsize=12, fontweight='bold')
ax1.set_title('Distribution des erreurs par classe\n(Entra√Æn√© uniquement sur T-shirts)', 
             fontsize=14, fontweight='bold')
ax1.grid(axis='y', alpha=0.3)
ax1.tick_params(axis='x', rotation=45)

# Moyennes
means = [np.mean(reconstruction_errors[class_names[i]]) for i in classes_to_test]
colors_bar = ['green' if i == 0 else 'red' for i in classes_to_test]
bars = ax2.bar([class_names[i] for i in classes_to_test], means, 
               color=colors_bar, edgecolor='black', linewidth=2, alpha=0.7)
ax2.set_ylabel('Erreur moyenne de reconstruction', fontsize=12, fontweight='bold')
ax2.set_title('Erreur moyenne par classe\n(Vert = classe normale, Rouge = anomalies)', 
             fontsize=14, fontweight='bold')
ax2.grid(axis='y', alpha=0.3)
ax2.tick_params(axis='x', rotation=45)

for bar, mean in zip(bars, means):
    height = bar.get_height()
    ax2.text(bar.get_x() + bar.get_width()/2., height,
            f'{mean:.5f}',
            ha='center', va='bottom', fontsize=10, fontweight='bold')

plt.tight_layout()
plt.show()

print("\nüìä ANALYSE:")
print(f"   Erreur moyenne sur T-shirts (normal): {means[0]:.5f}")
print(f"   Erreur moyenne sur autres classes: {np.mean(means[1:]):.5f}")
print(f"   Ratio d'augmentation: √ó{np.mean(means[1:]) / means[0]:.2f}")
print("\nüí° Les anomalies (classes non vues) ont une erreur beaucoup plus √©lev√©e !")

### 7.2 Exploration de l'espace latent - G√©n√©ration d'images

Nous pouvons explorer l'espace latent pour g√©n√©rer de nouvelles images.

In [None]:
# Encodage de quelques images de r√©f√©rence
print("üé® Exploration de l'espace latent...\n")

# S√©lection de 2 images diff√©rentes
idx1, idx2 = 42, 100
img1 = X_test_cnn[idx1:idx1+1]
img2 = X_test_cnn[idx2:idx2+1]

# Encodage
z1 = conv_encoder.predict(img1, verbose=0)
z2 = conv_encoder.predict(img2, verbose=0)

# Interpolation lin√©aire dans l'espace latent
n_steps = 10
alphas = np.linspace(0, 1, n_steps)
interpolated_images = []

for alpha in alphas:
    # Interpolation: z = (1-Œ±)*z1 + Œ±*z2
    z_interpolated = (1 - alpha) * z1 + alpha * z2
    # D√©codage
    img_interpolated = conv_decoder.predict(z_interpolated, verbose=0)
    interpolated_images.append(img_interpolated[0])

# Visualisation
fig, axes = plt.subplots(2, n_steps, figsize=(20, 5))
fig.suptitle('Interpolation dans l\'espace latent', fontsize=16, fontweight='bold')

# Images originales et interpol√©es
for i, alpha in enumerate(alphas):
    axes[0, i].imshow(interpolated_images[i].reshape(28, 28), cmap='gray')
    axes[0, i].axis('off')
    axes[0, i].set_title(f'Œ± = {alpha:.1f}', fontsize=10)
    
    # Marquer les images de d√©part et d'arriv√©e
    if i == 0:
        axes[0, i].set_xlabel('Image 1\n(d√©part)', fontsize=9, color='blue', fontweight='bold')
    elif i == n_steps - 1:
        axes[0, i].set_xlabel('Image 2\n(arriv√©e)', fontsize=9, color='red', fontweight='bold')

# Deuxi√®me ligne: zoom sur le milieu de l'interpolation
middle_indices = [2, 3, 4, 5, 6, 7]
for i, idx in enumerate(middle_indices):
    axes[1, i+2].imshow(interpolated_images[idx].reshape(28, 28), cmap='gray')
    axes[1, i+2].axis('off')
    axes[1, i+2].set_title(f'Œ± = {alphas[idx]:.2f}', fontsize=9)

# Masquer les axes inutilis√©s
for i in [0, 1, 8, 9]:
    axes[1, i].axis('off')

axes[1, 0].text(0.5, 0.5, 'Zoom sur\nla transition', 
               ha='center', va='center', fontsize=12, fontweight='bold')

plt.tight_layout()
plt.show()

print("\nüí° OBSERVATION:")
print("   L'interpolation dans l'espace latent produit des transitions douces")
print("   entre les deux images, montrant que l'espace est bien structur√© !")
print(f"\n   Image 1: {class_names[y_test[idx1]]}")
print(f"   Image 2: {class_names[y_test[idx2]]}")

### 7.3 G√©n√©ration al√©atoire depuis l'espace latent

In [None]:
# G√©n√©ration d'images al√©atoires
print("üé≤ G√©n√©ration d'images al√©atoires depuis l'espace latent...\n")

# Analyse de la distribution de l'espace latent
all_latent = conv_encoder.predict(X_test_cnn[:1000], verbose=0)
latent_mean = np.mean(all_latent, axis=0)
latent_std = np.std(all_latent, axis=0)

print(f"üìä Statistiques de l'espace latent (sur 1000 exemples):")
print(f"   Moyenne: {latent_mean.mean():.4f} ¬± {latent_mean.std():.4f}")
print(f"   √âcart-type: {latent_std.mean():.4f} ¬± {latent_std.std():.4f}\n")

# G√©n√©ration de codes latents al√©atoires
n_random = 20
random_latents = np.random.normal(latent_mean, latent_std, size=(n_random, conv_latent_dim))

# D√©codage
random_images = conv_decoder.predict(random_latents, verbose=0)

# Visualisation
fig, axes = plt.subplots(2, 10, figsize=(20, 5))
fig.suptitle('Images g√©n√©r√©es al√©atoirement depuis l\'espace latent', 
            fontsize=16, fontweight='bold')

for i in range(n_random):
    row = i // 10
    col = i % 10
    axes[row, col].imshow(random_images[i].reshape(28, 28), cmap='gray')
    axes[row, col].axis('off')

plt.tight_layout()
plt.show()

print("\nüí° OBSERVATION:")
print("   Certaines images ressemblent √† des v√™tements r√©alistes,")
print("   d'autres sont plus floues ou abstraites.")
print("   ‚ö†Ô∏è  Pour une meilleure g√©n√©ration, utilisez des VAE (Variational Autoencoders) !")

---

## 8. Conclusion et Comparaison Finale

### 8.1 Tableau r√©capitulatif

In [None]:
import pandas as pd

# Cr√©ation du tableau comparatif
comparison_data = {
    'Mod√®le': ['Dense AE', 'Conv AE', 'Denoising AE'],
    'Architecture': ['Dense', 'Convolutif', 'Convolutif'],
    'Param√®tres': [
        f"{dense_autoencoder.count_params():,}",
        f"{conv_autoencoder.count_params():,}",
        f"{denoising_autoencoder.count_params():,}"
    ],
    'Latent Dim': [32, 64, 64],
    'MSE Test': [
        f"{test_mse:.6f}",
        f"{conv_test_mse:.6f}",
        f"{denoising_test_mse:.6f}"
    ],
    'Cas d\'usage': [
        'G√©n√©ral, simple',
        'Images, meilleure qualit√©',
        'D√©bruitage, robustesse'
    ]
}

df = pd.DataFrame(comparison_data)

print("\n" + "="*90)
print("üìä COMPARAISON FINALE DES AUTO-ENCODEURS")
print("="*90)
print(df.to_string(index=False))
print("="*90)

# Visualisation finale
fig, axes = plt.subplots(2, 3, figsize=(18, 12))
fig.suptitle('R√©capitulatif des performances', fontsize=18, fontweight='bold')

# Graphique 1: Courbes de loss
ax = axes[0, 0]
epochs = range(1, 21)
ax.plot(epochs, history_dense.history['val_loss'], 'o-', label='Dense AE', linewidth=2)
ax.plot(epochs, history_conv.history['val_loss'], 's-', label='Conv AE', linewidth=2)
ax.plot(range(1, 26), history_denoising.history['val_loss'], '^-', label='Denoising AE', linewidth=2)
ax.set_xlabel('Epoch', fontsize=11, fontweight='bold')
ax.set_ylabel('Validation Loss', fontsize=11, fontweight='bold')
ax.set_title('√âvolution de la Loss', fontsize=13, fontweight='bold')
ax.legend(fontsize=10)
ax.grid(alpha=0.3)

# Graphique 2: Comparaison param√®tres
ax = axes[0, 1]
models = ['Dense AE', 'Conv AE', 'Denoising AE']
params_list = [
    dense_autoencoder.count_params(),
    conv_autoencoder.count_params(),
    denoising_autoencoder.count_params()
]
colors = ['#3498db', '#2ecc71', '#e74c3c']
bars = ax.bar(models, params_list, color=colors, edgecolor='black', linewidth=2)
ax.set_ylabel('Nombre de param√®tres', fontsize=11, fontweight='bold')
ax.set_title('Complexit√© des mod√®les', fontsize=13, fontweight='bold')
ax.tick_params(axis='x', rotation=15)
ax.grid(axis='y', alpha=0.3)
for bar, p in zip(bars, params_list):
    height = bar.get_height()
    ax.text(bar.get_x() + bar.get_width()/2., height,
           f'{p:,}', ha='center', va='bottom', fontsize=9, fontweight='bold')

# Graphique 3: MSE finale
ax = axes[0, 2]
mse_list = [test_mse, conv_test_mse, denoising_test_mse]
bars = ax.bar(models, mse_list, color=colors, edgecolor='black', linewidth=2)
ax.set_ylabel('MSE sur test', fontsize=11, fontweight='bold')
ax.set_title('Qualit√© de reconstruction', fontsize=13, fontweight='bold')
ax.tick_params(axis='x', rotation=15)
ax.grid(axis='y', alpha=0.3)
for bar, mse in zip(bars, mse_list):
    height = bar.get_height()
    ax.text(bar.get_x() + bar.get_width()/2., height,
           f'{mse:.5f}', ha='center', va='bottom', fontsize=9, fontweight='bold')

# Exemples de reconstruction - Dense
ax = axes[1, 0]
test_idx = 5
recon_dense = dense_autoencoder.predict(X_test_flat[test_idx:test_idx+1], verbose=0)
comparison = np.hstack([X_test[test_idx], recon_dense.reshape(28, 28)])
ax.imshow(comparison, cmap='gray')
ax.set_title('Dense AE\nOriginal | Reconstruit', fontsize=11, fontweight='bold')
ax.axis('off')

# Exemples de reconstruction - Conv
ax = axes[1, 1]
recon_conv = conv_autoencoder.predict(X_test_cnn[test_idx:test_idx+1], verbose=0)
comparison = np.hstack([X_test[test_idx], recon_conv.reshape(28, 28)])
ax.imshow(comparison, cmap='gray')
ax.set_title('Conv AE\nOriginal | Reconstruit', fontsize=11, fontweight='bold')
ax.axis('off')

# Exemples de d√©bruitage
ax = axes[1, 2]
denoised = denoising_autoencoder.predict(X_test_noisy[test_idx:test_idx+1], verbose=0)
comparison = np.hstack([X_test_noisy[test_idx].reshape(28, 28), denoised.reshape(28, 28)])
ax.imshow(comparison, cmap='gray')
ax.set_title('Denoising AE\nBruit√©e | D√©bruit√©e', fontsize=11, fontweight='bold')
ax.axis('off')

plt.tight_layout()
plt.show()

### 8.2 Points cl√©s √† retenir

#### üéØ Architecture
- **Dense AE** : Simple, bon point de d√©part
- **Conv AE** : Meilleur pour les images, moins de param√®tres
- **Denoising AE** : Robuste, apprend des repr√©sentations plus riches

#### üìä Performance
- Les CNN produisent des reconstructions plus nettes
- Le denoising am√©liore la qualit√© des features apprises
- L'espace latent capture les caract√©ristiques essentielles

#### üí° Applications
1. **Compression** : R√©duire la taille des donn√©es
2. **D√©bruitage** : Nettoyer des images bruit√©es
3. **D√©tection d'anomalies** : Identifier des donn√©es inhabituelles
4. **G√©n√©ration** : Cr√©er de nouvelles donn√©es (avec VAE)
5. **Pre-training** : Initialiser des r√©seaux pour d'autres t√¢ches
6. **Feature extraction** : Extraire des repr√©sentations utiles

#### ‚öôÔ∏è Hyperparam√®tres importants
- **Dimension latente** : Trade-off compression vs qualit√©
- **Architecture** : Plus profonde = meilleures features
- **Fonction de loss** : MSE pour pixel par pixel, BCE pour probabilit√©s
- **Dropout** : R√©gularisation, √©vite l'overfitting

### üöÄ Pour aller plus loin

1. **VAE (Variational Autoencoder)** : G√©n√©ration probabiliste
2. **Sparse Autoencoder** : R√©gularisation par sparsit√©
3. **Contractive Autoencoder** : Robustesse aux perturbations
4. **Adversarial Autoencoder** : Combinaison avec GAN
5. **U-Net** : Architecture encoder-decoder pour segmentation
6. **Transformer Autoencoder** : Avec m√©canisme d'attention

### üìö Ressources
- [Auto-Encoding Variational Bayes (Kingma & Welling, 2013)](https://arxiv.org/abs/1312.6114)
- [Denoising Autoencoders (Vincent et al., 2008)](https://www.cs.toronto.edu/~larocheh/publications/icml-2008-denoising-autoencoders.pdf)
- [Keras Autoencoders Tutorial](https://blog.keras.io/building-autoencoders-in-keras.html)

## 9. Exercices pratiques

Pour approfondir votre compr√©hension, voici quelques exercices :

### Exercice 1 : Modifier la dimension latente
- Testez diff√©rentes dimensions latentes (8, 16, 64, 128)
- Observez l'impact sur la qualit√© de reconstruction
- Visualisez le trade-off compression vs qualit√©

### Exercice 2 : Architecture plus profonde
- Ajoutez des couches convolutives suppl√©mentaires
- Utilisez Batch Normalization
- Comparez les performances

### Exercice 3 : Autres types de bruit
- Testez du bruit salt-and-pepper (pixels al√©atoires noirs ou blancs)
- Ajoutez du bruit par blocs (masquer des r√©gions)
- √âvaluez la robustesse du denoising AE

### Exercice 4 : Transfer learning
- Utilisez l'encoder pr√©-entra√Æn√© pour une t√¢che de classification
- Comparez avec un entra√Ænement from scratch
- Mesurez le gain de performance

### Exercice 5 : Autres datasets
- Appliquez les auto-encodeurs sur MNIST (chiffres)
- Testez sur CIFAR-10 (images couleur 32√ó32)
- Adaptez l'architecture si n√©cessaire

### Exercice 6 : VAE simple
- Impl√©mentez un Variational Autoencoder basique
- Ajoutez une loss KL-divergence
- G√©n√©rez de nouvelles images en √©chantillonnant

**Bon apprentissage ! üöÄ**