## 1. G√©n√©ration du Dataset - Probl√®me Laplacien Param√©trique 1D

Nous r√©solvons l'√©quation de Poisson 1D avec diff√©rentes conditions aux limites:
$$-\frac{d^2 u}{dx^2} = f(x,\mu) \text{ dans } \Omega = [0,1]$$
$$u(0) = g_1(\mu), \quad u(1) = g_2(\mu)$$

o√π $\mu$ est un param√®tre qui contr√¥le la source et les conditions aux limites.

In [None]:
# Imports
import jax
import jax.numpy as jnp
import jax.random as jr
import equinox as eqx
import optax
import numpy as np
import matplotlib.pyplot as plt
from scipy.sparse import diags
from scipy.sparse.linalg import spsolve
from sklearn.decomposition import PCA
import warnings
warnings.filterwarnings('ignore')

# Configuration JAX
jax.config.update("jax_enable_x64", False)
key = jr.PRNGKey(42)

print(f"JAX version: {jax.__version__}")
print(f"Equinox version: {eqx.__version__}")
print(f"Devices disponibles: {jax.devices()}")

In [1]:
def generate_laplacian_dataset_1d(n_samples=1000, grid_size=64):
    """
    G√©n√®re un dataset de solutions du probl√®me Laplacien param√©trique 1D
    """
    # Grille spatiale 1D
    h = 1.0 / (grid_size - 1)
    x = np.linspace(0, 1, grid_size)
    
    # Matrice Laplacienne 1D (diff√©rences finies)
    def build_laplacian_matrix_1d(n):
        h2 = h**2
        # Laplacien 1D: -d¬≤u/dx¬≤ ‚âà (u[i-1] - 2*u[i] + u[i+1])/h¬≤
        diag_main = -2 * np.ones(n) / h2
        diag_off = np.ones(n-1) / h2
        
        L = diags([diag_off, diag_main, diag_off], [-1, 0, 1], shape=(n, n), format='csc')
        return L
    
    L = build_laplacian_matrix_1d(grid_size)
    solutions = []
    parameters = []
    
    print(f"G√©n√©ration de {n_samples} solutions 1D...")
    
    for i in range(n_samples):
        # Param√®tres al√©atoires
        mu1 = np.random.uniform(2.0, 3.0)  # Amplitude source
        mu2 = np.random.uniform(2.0, 6.0)   # Fr√©quence source
        mu3 = np.random.uniform(0.0, 0.5)  # Condition limite gauche
        mu4 = np.random.uniform(0.0, 0.5)  # Condition limite droite
        
        # Source term f(x, Œº)
        f = 10* (mu1 * np.sin(mu2 * np.pi * x) + 0.4 * np.exp(-20*(x-0.5)**2))
        
        # Pr√©paration du terme source
        rhs = -f.copy()
        
        # Application des conditions aux limites u(0) = mu3, u(1) = mu4
        L_modified = L.copy()
        rhs[0] = mu3
        rhs[-1] = mu4
        
        # Modifier la matrice pour imposer les conditions aux limites
        L_modified[0, :] = 0
        L_modified[0, 0] = 1
        L_modified[-1, :] = 0
        L_modified[-1, -1] = 1
        
        # R√©solution du syst√®me lin√©aire
        try:
            u = spsolve(L_modified, rhs)
            solutions.append(u)
            parameters.append([mu1, mu2, mu3, mu4])
        except:
            print(f"Erreur r√©solution √©chantillon {i}")
            continue
            
        if (i+1) % 200 == 0:
            print(f"  {i+1}/{n_samples} solutions g√©n√©r√©es")
    
    return np.array(solutions), np.array(parameters), x

# G√©n√©ration du dataset
solutions, params, x_grid = generate_laplacian_dataset_1d(n_samples=800, grid_size=64)
print(f"Dataset g√©n√©r√©: {solutions.shape} solutions")
print(f"Param√®tres: {params.shape}")

NameError: name 'np' is not defined

In [None]:
# Visualisation de quelques exemples
fig, axes = plt.subplots(2, 3, figsize=(15, 8))
axes = axes.flatten()

for i in range(6):
    axes[i].plot(x_grid, solutions[i], 'b-', linewidth=2)
    axes[i].set_title(f'Solution {i+1}\nŒº=[{params[i,0]:.2f}, {params[i,1]:.2f}, {params[i,2]:.2f}, {params[i,3]:.2f}]')
    axes[i].set_xlabel('x')
    axes[i].set_ylabel('u(x)')
    axes[i].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# Pr√©paration des donn√©es
n_train = int(0.8 * len(solutions))
train_data = solutions[:n_train]
test_data = solutions[n_train:]

# Normalisation
mean_val = train_data.mean()
std_val = train_data.std()
train_data_norm = (train_data - mean_val) / std_val
test_data_norm = (test_data - mean_val) / std_val

print(f"Train: {train_data_norm.shape}, Test: {test_data_norm.shape}")
print(f"Normalisation: Œº={mean_val:.3f}, œÉ={std_val:.3f}")

## 2. Convolutional Autoencoder avec JAX/Equinox

Impl√©mentation d'un CAE 1D inspir√© de votre architecture PyTorch qui fonctionne bien (Conv1D + Dense).

## üìù EXERCICE 1: Impl√©mentation du Convolutional Autoencoder

**Objectif:** Impl√©menter la classe `ConvAutoencoder` avec JAX/Equinox pour la r√©duction d'ordre de mod√®les 1D.

### Architecture √† impl√©menter :

#### **Encodeur :**
1. **Partie convolutionnelle :**
   - `conv1`: Conv1d (1 ‚Üí 32 canaux, kernel=7, stride=2, padding=3)
   - `conv2`: Conv1d (32 ‚Üí 64 canaux, kernel=7, stride=2, padding=3) 
   - `conv3`: Conv1d (64 ‚Üí 128 canaux, kernel=7, stride=2, padding=3)
   - Activation ELU apr√®s chaque convolution

2. **Partie dense :**
   - Aplatissement (flatten) de la sortie convolutionnelle
   - S√©quence de couches lin√©aires : taille_conv ‚Üí 512 ‚Üí 256 ‚Üí 128 ‚Üí 64 ‚Üí `latent_dim`
   - Activation ELU entre chaque couche (sauf la derni√®re)

#### **D√©codeur :**
1. **Partie dense :**
   - S√©quence inverse : `latent_dim` ‚Üí 64 ‚Üí 128 ‚Üí 256 ‚Üí 512 ‚Üí taille_conv
   - Activation ELU entre chaque couche
   - Reshape vers la forme convolutionnelle

2. **Partie d√©convolutionnelle :**
   - `deconv1`: ConvTranspose1d (128 ‚Üí 64 canaux)
   - `deconv2`: ConvTranspose1d (64 ‚Üí 32 canaux)
   - `deconv3`: ConvTranspose1d (32 ‚Üí 1 canal)
   - Activation ELU pour les deux premi√®res, pas d'activation pour la derni√®re

### Contraintes techniques :
- **Input/Output:** La reconstruction doit avoir exactement la m√™me taille que l'entr√©e (64 points)
- **Batching:** Utiliser `jax.vmap` pour traiter les batches
- **Calculs automatiques:** Les tailles des couches interm√©diaires doivent √™tre calcul√©es automatiquement
- **Flexibilit√©:** L'architecture doit fonctionner avec diff√©rentes tailles de kernel (3, 5, 7, etc.)

### Conseils d'impl√©mentation :
1. **Calcul des tailles :** Impl√©mentez des m√©thodes helper pour calculer les dimensions apr√®s convolutions
2. **Output padding :** Calculez automatiquement les `output_padding` pour les d√©convolutions
3. **Gestion des dimensions :** Ajustez les dimensions finales si n√©cessaire (troncature/padding)
4. **Module Equinox :** H√©ritez de `eqx.Module` et utilisez les annotations de types


### Test de votre impl√©mentation :
Votre code doit pouvoir :
- Cr√©er un mod√®le : `model = ConvAutoencoder(input_dim=64, latent_dim=2, key=key)`
- Faire une passe avant : `reconstruction, latent = model(test_batch)`
- V√©rifier les dimensions : `assert reconstruction.shape == test_batch.shape`

In [None]:
# √Ä VOUS DE JOUER ! 
# Impl√©mentez la classe ConvAutoencoder ici

class ConvAutoencoder(eqx.Module):
    # D√©finissez vos attributs ici
    # conv1: eqx.nn.Conv1d
    # conv2: eqx.nn.Conv1d
    # etc.
    
    def __init__(self, input_dim, latent_dim, key):
        # Votre impl√©mentation ici
        pass
    
    def encode(self, x):
        # Votre impl√©mentation ici
        pass
    
    def decode(self, latent):
        # Votre impl√©mentation ici
        pass
    
    def __call__(self, x):
        # Votre impl√©mentation ici
        pass

# Fonctions d'entra√Ænement √† impl√©menter
@eqx.filter_jit
def compute_loss(model, x):
    reconstruction, _ = model(x)
    return jnp.mean((reconstruction - x)**2)

def train_step(model, opt_state, optimizer, x):
    loss, grads = eqx.filter_value_and_grad(compute_loss)(model, x)
    updates, opt_state = optimizer.update(grads, opt_state, model)
    model = eqx.apply_updates(model, updates)
    return model, opt_state, loss

@eqx.filter_jit
def eval_model(model, x):
    reconstruction, latent = model(x)
    loss = jnp.mean((reconstruction - x)**2)
    return loss, reconstruction, latent

In [None]:
def train_autoencoder(train_data, latent_dim, epochs=100, batch_size=128, learning_rate=2e-4):
    """
    Entra√Æne un autoencoder convolutionnel avec Equinox
    """
    input_dim = train_data.shape[1]  # 64 pour notre grille 1D
    
    # Initialisation du mod√®le
    key = jr.PRNGKey(42)
    model = ConvAutoencoder(input_dim, latent_dim, key)
    
    # Optimiseur
    optimizer = optax.adam(learning_rate)
    opt_state = optimizer.init(eqx.filter(model, eqx.is_array))
    
    # Pr√©paration des donn√©es
    n_batches = len(train_data) // batch_size
    train_losses = []
    
    print(f"Entra√Ænement CAE (latent_dim={latent_dim})...")
    
    for epoch in range(epochs):
        epoch_loss = 0.0
        
        # M√©langer les donn√©es
        perm = np.random.permutation(len(train_data))
        
        for i in range(n_batches):
            batch_idx = perm[i*batch_size:(i+1)*batch_size]
            batch = jnp.array(train_data[batch_idx])
            
            model, opt_state, loss = train_step(model, opt_state, optimizer, batch)
            epoch_loss += loss
        
        avg_loss = epoch_loss / n_batches
        train_losses.append(avg_loss)
        
        if (epoch + 1) % 5 == 0:
            print(f"  √âpoque {epoch+1:3d}: loss = {avg_loss:.6f}")
    
    return model, train_losses

# Entra√Ænement des deux mod√®les (d√©commentez apr√®s impl√©mentation)
# print("=" * 50)
# model_latent1, losses_latent1 = train_autoencoder(train_data_norm, latent_dim=2, epochs=100)
# print("=" * 50)
# model_latent2, losses_latent2 = train_autoencoder(train_data_norm, latent_dim=3, epochs=100)

In [None]:
# Visualisation des courbes de perte (d√©commentez apr√®s impl√©mentation)
# plt.figure(figsize=(10, 5))
# plt.plot(losses_latent1, label='CAE Latent Dim 2', linewidth=2)
# plt.plot(losses_latent2, label='CAE Latent Dim 3', linewidth=2)
# plt.xlabel('√âpoque')
# plt.ylabel('MSE Loss')
# plt.title('Courbes d\'apprentissage des Autoencodeurs Convolutionnels')
# plt.legend()
# plt.grid(True, alpha=0.3)
# plt.yscale('log')
# plt.show()

## 3. Proper Orthogonal Decomposition (POD)

Impl√©mentation de la POD classique via d√©composition en valeurs singuli√®res pour donn√©es 1D.

## üìù EXERCICE 2: Impl√©mentation de la POD (Proper Orthogonal Decomposition)

**Objectif:** Impl√©menter la classe `PODModel` pour la r√©duction d'ordre par d√©composition orthogonale.

### Principe de la POD :
La POD trouve les modes optimaux pour repr√©senter un dataset en minimisant l'erreur de reconstruction. Elle utilise la d√©composition en valeurs singuli√®res (SVD) sur les donn√©es centr√©es.

### Algorithme √† impl√©menter :

#### **M√©thode `fit(self, data)` :**
1. **Centrage :** Calculer et stocker la moyenne des donn√©es
   - `mean_field = np.mean(data, axis=0)`
   - `data_centered = data - mean_field`

2. **SVD :** Appliquer la d√©composition en valeurs singuli√®res
   - `U, s, Vt = np.linalg.svd(data_centered.T, full_matrices=False)`
   - Stocker les modes (`U`), valeurs singuli√®res (`s`)

3. **√ânergie :** Calculer l'√©nergie cumul√©e
   - `energy = s**2`
   - `cumulative_energy = np.cumsum(energy) / np.sum(energy)`

#### **M√©thode `reconstruct(self, data, n_modes_reconstruct)` :**
1. **Centrage :** Centrer les donn√©es avec la moyenne calcul√©e
2. **Projection :** Projeter sur les `n_modes_reconstruct` premiers modes
   - `coefficients = modes_truncated.T @ data_centered.T`
3. **Reconstruction :** Reconstruire et ajouter la moyenne
   - `reconstructed = (modes_truncated @ coefficients).T + mean_field`

### Attributs de la classe :
- `mean_field`: Champ moyen des donn√©es d'entra√Ænement
- `modes`: Modes POD (vecteurs propres, matrice U de la SVD)
- `singular_values`: Valeurs singuli√®res
- `n_modes`: Nombre total de modes disponibles

### Contraintes :
- Les donn√©es sont de forme `(n_samples, n_points)`
- La reconstruction doit pr√©server exactement la forme des donn√©es d'entr√©e
- G√©rer le cas o√π `n_modes_reconstruct > n_modes` disponibles

### Validation :
Votre impl√©mentation doit :
- Calculer l'√©nergie cumul√©e correctement
- Reconstruire parfaitement avec tous les modes
- Donner des erreurs d√©croissantes avec plus de modes

In [None]:
# √Ä VOUS DE JOUER !
# Impl√©mentez la classe PODModel ici

class PODModel:
    def __init__(self):
        # Initialisez vos attributs ici
        self.mean_field = None
        self.modes = None
        self.singular_values = None
        self.n_modes = None
    
    def fit(self, data):
        """
        Calcule les modes POD via SVD pour donn√©es 1D
        data: (n_samples, n_points)
        """
        # Votre impl√©mentation ici
        pass
    
    def reconstruct(self, data, n_modes_reconstruct):
        """
        Reconstruit avec un nombre donn√© de modes pour donn√©es 1D
        """
        # Votre impl√©mentation ici
        pass

# Calcul de la POD (d√©commentez apr√®s impl√©mentation)
# pod_model = PODModel()
# cumulative_energy = pod_model.fit(train_data_norm)

In [None]:
# Visualisation du spectre POD (d√©commentez apr√®s impl√©mentation)
# fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(14, 5))

# # Valeurs singuli√®res
# ax1.semilogy(pod_model.singular_values[:50], 'bo-', markersize=3)
# ax1.set_xlabel('Mode')
# ax1.set_ylabel('Valeur singuli√®re')
# ax1.set_title('Spectre POD')
# ax1.grid(True, alpha=0.3)

# # √ânergie cumul√©e
# ax2.plot(cumulative_energy[:50], 'ro-', markersize=3)
# ax2.axhline(y=0.99, color='k', linestyle='--', alpha=0.7, label='99% √©nergie')
# ax2.axhline(y=0.95, color='gray', linestyle='--', alpha=0.7, label='95% √©nergie')
# ax2.set_xlabel('Nombre de modes')
# ax2.set_ylabel('√ânergie cumul√©e')
# ax2.set_title('√ânergie cumul√©e POD')
# ax2.grid(True, alpha=0.3)
# ax2.legend()
# ax2.set_ylim([0.8, 1.02])

# plt.tight_layout()
# plt.show()

# # Affichage de quelques modes POD
# fig, axes = plt.subplots(2, 3, figsize=(15, 8))
# axes = axes.flatten()

# for i in range(6):
#     mode = pod_model.modes[:, i]
#     axes[i].plot(x_grid, mode, 'r-', linewidth=2)
#     axes[i].set_title(f'Mode POD {i+1}')
#     axes[i].set_xlabel('x')
#     axes[i].set_ylabel('Mode amplitude')
#     axes[i].grid(True, alpha=0.3)

# plt.tight_layout()
# plt.show()

## 4. Comparaison des Reconstructions

Comparons les performances de reconstruction entre AE et POD sur des exemples de test.

## üéØ Analyse et Comparaison

Une fois vos impl√©mentations termin√©es, d√©commentez les cellules suivantes pour :

1. **Entra√Æner les mod√®les** avec diff√©rentes dimensions latentes
2. **Comparer les reconstructions** sur les donn√©es de test
3. **Analyser les performances** via des m√©triques et visualisations
4. **√âtudier l'espace latent** des autoencodeurs

### Questions de r√©flexion :
- Quelle m√©thode donne les meilleures reconstructions ?
- Comment √©volue la qualit√© avec le nombre de modes/dimension latente ?
- Quels sont les avantages/inconv√©nients de chaque approche ?
- L'espace latent des CAE capture-t-il bien la variabilit√© des donn√©es ?

In [None]:
# S√©lection d'exemples de test (d√©commentez apr√®s impl√©mentation)
# test_indices = [0, 5, 10, 15, 20, 25]  # 6 exemples
# test_samples = test_data_norm[test_indices]

# # Reconstructions CAE avec Equinox
# print("Reconstruction avec les CAE...")
# _, recon_cae_latent1, latent1 = eval_model(model_latent1, jnp.array(test_samples))
# _, recon_cae_latent2, latent2 = eval_model(model_latent2, jnp.array(test_samples))

# recon_cae_latent1 = np.array(recon_cae_latent1)
# recon_cae_latent2 = np.array(recon_cae_latent2)
# latent1 = np.array(latent1)
# latent2 = np.array(latent2)

# # Reconstructions POD
# print("Reconstruction avec POD...")
# pod_modes = [2, 4, 6, 10]
# recon_pod = {}

# for n_modes in pod_modes:
#     recon_pod[n_modes] = pod_model.reconstruct(test_samples, n_modes)

# print("Reconstructions termin√©es!")

In [None]:
# Calcul des erreurs de reconstruction pour donn√©es 1D (d√©commentez apr√®s impl√©mentation)
# def compute_reconstruction_error(original, reconstructed):
#     return np.mean((original - reconstructed)**2, axis=1)

# # Erreurs pour tous les exemples de test
# errors_cae_latent1 = compute_reconstruction_error(test_samples, recon_cae_latent1)
# errors_cae_latent2 = compute_reconstruction_error(test_samples, recon_cae_latent2)

# errors_pod = {}
# for n_modes in pod_modes:
#     errors_pod[n_modes] = compute_reconstruction_error(test_samples, recon_pod[n_modes])

# # Statistiques des erreurs
# print("Erreurs moyennes de reconstruction (MSE):")
# print(f"CAE Latent 2D: {np.mean(errors_cae_latent1):.6f} ¬± {np.std(errors_cae_latent1):.6f}")
# print(f"CAE Latent 3D: {np.mean(errors_cae_latent2):.6f} ¬± {np.std(errors_cae_latent2):.6f}")
# for n_modes in pod_modes:
#     print(f"POD {n_modes:2d} modes: {np.mean(errors_pod[n_modes]):.6f} ¬± {np.std(errors_pod[n_modes]):.6f}")