[![Ouvrir sur Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/SkatAI/deeplearning/blob/master/notebooks/RNN_hands_on_claude_sunspots.ipynb)

# RNN et s√©ries temporelles ‚Äî Atelier pratique

**Deep Learning par la pratique ‚Äî Alexis Perrier**

---

## Objectifs de cet atelier

1. **Comprendre les RNN** : comment un r√©seau de neurones traite des donn√©es s√©quentielles
2. **Pr√©dire une s√©rie temporelle** : les taches solaires (sunspots)
3. **Comparer SimpleRNN, LSTM et GRU** : performance, vitesse, complexit√©
4. **Travailler avec l'IA** : utiliser Gemini pour g√©n√©rer, lire et comprendre du code

## Comment utiliser ce notebook

- Les cellules avec du code pr√©-√©crit : **lisez, ex√©cutez, observez**
- Les cellules marqu√©es ü§ñ **GEMINI** : demandez √† Gemini de g√©n√©rer le code, puis lisez-le et demandez-lui de vous l'expliquer
- Les cellules marqu√©es ‚ùì **QUESTION** : r√©pondez en observant les r√©sultats

**Utiliser l'IA pour coder n'est pas tricher ‚Äî c'est la m√©thode de travail.**
Votre valeur n'est pas de taper du code, c'est de savoir quoi demander, comprendre ce qu'on vous donne, et juger si le r√©sultat est bon.

---

## √âtape 0 ‚Äî Setup et exploration des donn√©es

On travaille avec le dataset **Sunspots** : le nombre mensuel de taches solaires observ√©es depuis 1749.
Notre objectif : construire un mod√®le RNN qui pr√©dit le nombre de taches solaires √† partir des observations pass√©es.

### 0.1 ‚Äî Imports

In [None]:
import numpy as np
import pandas as pd
import math
import matplotlib.pyplot as plt

import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import SimpleRNN, LSTM, GRU, Dense, Dropout

from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics import mean_squared_error

import datetime, os

print(f"TensorFlow version: {tf.__version__}")
print(f"GPU disponible: {tf.config.list_physical_devices('GPU')}")

### 0.2 ‚Äî Charger le dataset sunspots

Le dataset contient le nombre mensuel de taches solaires depuis 1749. C'est une s√©rie temporelle classique en science des donn√©es, avec une p√©riodicit√© d'environ 11 ans (le cycle solaire).

In [None]:
url = "https://raw.githubusercontent.com/SkatAI/deeplearning/master/data/sunspots.csv"

data = pd.read_csv(url)
data.columns = ['n', 'date', 'number']
data.index = data['date']

print(f"Nombre d'observations : {len(data)}")
print(f"P√©riode : {data['date'].iloc[0]} ‚Üí {data['date'].iloc[-1]}")
print()
data.head()

### 0.3 ‚Äî Visualiser la s√©rie temporelle

In [None]:
plt.figure(figsize=(14, 5))
plt.plot(data['number'], linewidth=0.8)
plt.title('Taches solaires ‚Äî s√©rie compl√®te')
plt.xlabel('Date')
plt.ylabel('Nombre de taches solaires')
plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()

### ü§ñ GEMINI ‚Äî Explorer les donn√©es

Demandez √† Gemini :

> *"G√©n√®re du code pour afficher un zoom sur 100 points cons√©cutifs de la s√©rie `data['number']` (par exemple les indices 200 √† 300) et calcule des statistiques de base : moyenne, √©cart-type, min, max. Utilise matplotlib. Qu'observes-tu sur la p√©riodicit√© ?"*

Puis demandez :

> *"Explique-moi ce que tu observes. Y a-t-il un cycle visible ?"*

In [None]:
# VOTRE CODE G√âN√âR√â PAR GEMINI ICI


### ‚ùì QUESTION

En observant la s√©rie temporelle :
- La s√©rie est-elle r√©guli√®re ? Y a-t-il une p√©riodicit√© visible ?
- Les pics ont-ils tous la m√™me amplitude ?
- Un humain pourrait-il pr√©dire la suite de cette s√©rie ? Pourquoi ?

*(vos observations ici)*

---

## √âtape 1 ‚Äî Pr√©parer les donn√©es pour un RNN

Un RNN ne prend pas un seul nombre en entr√©e : il prend une **s√©quence** de nombres. Pour pr√©dire le nombre de taches solaires au mois N, on lui donne les valeurs des mois N-50 √† N-1.

C'est le principe de la **fen√™tre glissante** (sliding window).

### 1.1 ‚Äî Split train/test (80/20)

In [None]:
# 80% pour l'entra√Ænement, 20% pour le test
training_data_len = math.ceil(len(data) * 0.8)

train_data = data[:training_data_len]['number']
test_data = data[training_data_len:]['number']

print(f"Train : {len(train_data)} observations")
print(f"Test  : {len(test_data)} observations")

### 1.2 ‚Äî Normalisation avec MinMaxScaler

Les RNN fonctionnent mieux avec des valeurs entre 0 et 1. On utilise `MinMaxScaler` pour normaliser les donn√©es.

In [None]:
# Reshape en 2D pour le scaler
dataset_train = train_data.values.reshape(-1, 1)
dataset_test = test_data.values.reshape(-1, 1)

# Normalisation
scaler = MinMaxScaler(feature_range=(0, 1))
scaled_train = scaler.fit_transform(dataset_train)

# IMPORTANT : on utilise le m√™me scaler pour le test
# (on ne fit pas un nouveau scaler sur le test !)
scaler_test = MinMaxScaler(feature_range=(0, 1))
scaled_test = scaler_test.fit_transform(dataset_test)

print(f"Train ‚Äî min: {scaled_train.min():.2f}, max: {scaled_train.max():.2f}")
print(f"Test  ‚Äî min: {scaled_test.min():.2f}, max: {scaled_test.max():.2f}")

### 1.3 ‚Äî Cr√©er les fen√™tres glissantes

On cr√©e des s√©quences de 50 pas de temps. Pour chaque fen√™tre de 50 valeurs, la cible est la valeur suivante (la 51√®me).

```
Fen√™tre 1 : [v0, v1, ..., v49]  ‚Üí  cible : v50
Fen√™tre 2 : [v1, v2, ..., v50]  ‚Üí  cible : v51
Fen√™tre 3 : [v2, v3, ..., v51]  ‚Üí  cible : v52
...
```

In [None]:
WINDOW_SIZE = 50

def create_sequences(data, window_size):
    """Cr√©e les fen√™tres glissantes X et les cibles y."""
    X, y = [], []
    for i in range(window_size, len(data)):
        X.append(data[i - window_size:i, 0])
        y.append(data[i, 0])
    return np.array(X), np.array(y)

X_train, y_train = create_sequences(scaled_train, WINDOW_SIZE)
X_test, y_test = create_sequences(scaled_test, WINDOW_SIZE)

print(f"X_train : {X_train.shape}, y_train : {y_train.shape}")
print(f"X_test  : {X_test.shape}, y_test  : {y_test.shape}")

### 1.4 ‚Äî Reshape en tenseur 3D

Un RNN attend des donn√©es au format **(n_samples, timesteps, features)** :
- `n_samples` : nombre de fen√™tres
- `timesteps` : taille de la fen√™tre (50)
- `features` : nombre de variables par pas de temps (1, car s√©rie univari√©e)

In [None]:
# Reshape pour le RNN : (samples, timesteps, features)
X_train = X_train.reshape(X_train.shape[0], X_train.shape[1], 1)
y_train = y_train.reshape(y_train.shape[0], 1)

X_test = X_test.reshape(X_test.shape[0], X_test.shape[1], 1)
y_test = y_test.reshape(y_test.shape[0], 1)

print(f"X_train : {X_train.shape}  ‚Üí  (samples, timesteps, features)")
print(f"y_train : {y_train.shape}")
print(f"X_test  : {X_test.shape}")
print(f"y_test  : {y_test.shape}")

### ü§ñ GEMINI ‚Äî Comprendre le format des donn√©es

Demandez √† Gemini :

> *"Explique-moi pourquoi un RNN a besoin de donn√©es au format (n_samples, timesteps, features). Que repr√©sente chaque dimension ? Pourquoi utilise-t-on une fen√™tre glissante pour transformer une s√©rie temporelle en donn√©es d'entra√Ænement ?"*

### ‚ùì QUESTION

- Combien d'√©chantillons d'entra√Ænement avons-nous ? Combien de test ?
- Que se passerait-il si on augmentait la taille de la fen√™tre √† 100 ? Et si on la diminuait √† 10 ?
- Pourquoi perd-on les 50 premi√®res observations ?

*(vos r√©ponses ici)*

---

## Fonctions utilitaires

On d√©finit deux fonctions qu'on r√©utilisera pour chaque mod√®le.

In [None]:
def plot_training(history, title):
    """Courbes de loss train/validation."""
    plt.figure(figsize=(10, 4))
    plt.plot(history.history['loss'], label='Train', linewidth=2)
    plt.plot(history.history['val_loss'], label='Validation', linewidth=2)
    plt.title(f'{title} ‚Äî Loss (MSE)')
    plt.xlabel('√âpoque')
    plt.ylabel('Loss')
    plt.legend()
    plt.grid(True, alpha=0.3)
    plt.tight_layout()
    plt.show()


def plot_predictions(y_true, y_pred, title):
    """Plot pr√©dictions vs r√©alit√© sur le test set."""
    plt.figure(figsize=(14, 5))
    plt.plot(y_true, label='R√©alit√©', linewidth=1.5)
    plt.plot(y_pred, label='Pr√©dictions', linewidth=1.5, alpha=0.8)
    plt.title(f'{title} ‚Äî Pr√©dictions vs R√©alit√©')
    plt.xlabel('Observations (test set)')
    plt.ylabel('Nombre de taches solaires (normalis√©)')
    plt.legend()
    plt.grid(True, alpha=0.3)
    plt.tight_layout()
    plt.show()

print("Fonctions plot_training() et plot_predictions() d√©finies.")

---

## √âtape 2 ‚Äî Baseline : SimpleRNN

On commence par le mod√®le le plus simple : un **SimpleRNN**. C'est un RNN classique o√π chaque neurone re√ßoit l'entr√©e courante et l'√©tat cach√© pr√©c√©dent.

### 2.1 ‚Äî Construire le mod√®le SimpleRNN

In [None]:
import time

simple_rnn_model = Sequential([
    SimpleRNN(50, activation='relu', input_shape=(WINDOW_SIZE, 1)),
    Dense(1)
])

simple_rnn_model.compile(optimizer='adam', loss='mse')

simple_rnn_model.summary()

### ü§ñ GEMINI ‚Äî Comprendre l'architecture

Demandez √† Gemini :

> *"Explique-moi le model.summary() du SimpleRNN ci-dessus. Combien de param√®tres a-t-il ? Comment un SimpleRNN traite-t-il une s√©quence pas √† pas ? Que signifie le chiffre 50 dans SimpleRNN(50) ?"*

### 2.2 ‚Äî Entra√Æner le SimpleRNN

In [None]:
print("Entra√Ænement du SimpleRNN...")

start_time = time.time()

history_simple = simple_rnn_model.fit(
    X_train, y_train,
    epochs=20,
    batch_size=32,
    validation_data=(X_test, y_test),
    verbose=1
)

time_simple = time.time() - start_time
print(f"\nTemps d'entra√Ænement : {time_simple:.1f} secondes")

### 2.3 ‚Äî Visualiser les r√©sultats

In [None]:
# Courbes de loss
plot_training(history_simple, "SimpleRNN")

# Pr√©dictions sur le test set
y_pred_simple = simple_rnn_model.predict(X_test)

plot_predictions(y_test, y_pred_simple, "SimpleRNN")

# RMSE
rmse_simple = np.sqrt(mean_squared_error(y_test.flatten(), y_pred_simple.flatten()))
print(f"RMSE SimpleRNN : {rmse_simple:.4f}")

### ‚ùì QUESTION

Observez les courbes et les pr√©dictions :
- Le mod√®le capture-t-il la tendance g√©n√©rale de la s√©rie ?
- Les pics (maxima) sont-ils bien pr√©dits ?
- Y a-t-il de l'overfitting ? (la loss de validation remonte-t-elle ?)
- Quelle est la RMSE ?

*(vos observations ici)*

---

## √âtape 3 ‚Äî LSTM

### 3.1 ‚Äî Pourquoi LSTM ?

Le **SimpleRNN** souffre du probl√®me du **vanishing gradient** : quand les s√©quences sont longues, le gradient devient tr√®s petit lors de la r√©tropropagation, et le mod√®le "oublie" les informations anciennes.

Le **LSTM** (Long Short-Term Memory) r√©sout ce probl√®me gr√¢ce √† des **portes** (gates) qui contr√¥lent le flux d'information :
- **Porte d'oubli** (forget gate) : quelles informations effacer de la m√©moire
- **Porte d'entr√©e** (input gate) : quelles nouvelles informations stocker
- **Porte de sortie** (output gate) : quelles informations transmettre

R√©sultat : le LSTM peut m√©moriser des d√©pendances sur de longues s√©quences.

### ü§ñ GEMINI ‚Äî Construire le mod√®le LSTM

Demandez √† Gemini :

> *"R√©√©cris le mod√®le SimpleRNN de l'√©tape 2 en rempla√ßant SimpleRNN par LSTM. Garde la m√™me structure : 1 couche LSTM(50), Dense(1), compile avec Adam et MSE. Entra√Æne pendant 20 epochs avec batch_size=32 et validation_data=(X_test, y_test). Mesure le temps d'entra√Ænement avec time.time(). Stocke le mod√®le dans `lstm_model`, l'historique dans `history_lstm` et le temps dans `time_lstm`."*

Puis demandez :

> *"Combien de param√®tres a le LSTM par rapport au SimpleRNN ? Pourquoi cette diff√©rence ?"*

In [None]:
# VOTRE CODE G√âN√âR√â PAR GEMINI ICI


### 3.2 ‚Äî Visualiser les r√©sultats du LSTM

In [None]:
# Courbes de loss
plot_training(history_lstm, "LSTM")

# Pr√©dictions sur le test set
y_pred_lstm = lstm_model.predict(X_test)

plot_predictions(y_test, y_pred_lstm, "LSTM")

# RMSE
rmse_lstm = np.sqrt(mean_squared_error(y_test.flatten(), y_pred_lstm.flatten()))
print(f"RMSE LSTM : {rmse_lstm:.4f}")

### ‚ùì QUESTION

Comparez le LSTM avec le SimpleRNN :
- Le LSTM fait-il mieux que le SimpleRNN ? Le RMSE a-t-il diminu√© ?
- L'entra√Ænement est-il plus lent ? De combien ?
- Les pr√©dictions sur les pics sont-elles meilleures ?

*(vos observations ici)*

---

## √âtape 4 ‚Äî Comparer les deux approches

On met c√¥te √† c√¥te les r√©sultats du SimpleRNN et du LSTM.

In [None]:
# Comparaison visuelle
fig, axes = plt.subplots(1, 2, figsize=(16, 5))

# SimpleRNN
axes[0].plot(y_test, label='R√©alit√©', linewidth=1.5)
axes[0].plot(y_pred_simple, label='SimpleRNN', linewidth=1.5, alpha=0.8)
axes[0].set_title(f'SimpleRNN ‚Äî RMSE: {rmse_simple:.4f}')
axes[0].set_xlabel('Observations')
axes[0].legend()
axes[0].grid(True, alpha=0.3)

# LSTM
axes[1].plot(y_test, label='R√©alit√©', linewidth=1.5)
axes[1].plot(y_pred_lstm, label='LSTM', linewidth=1.5, alpha=0.8)
axes[1].set_title(f'LSTM ‚Äî RMSE: {rmse_lstm:.4f}')
axes[1].set_xlabel('Observations')
axes[1].legend()
axes[1].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

In [None]:
# Tableau r√©capitulatif
print("=" * 60)
print("COMPARAISON SimpleRNN vs LSTM")
print("=" * 60)
print(f"{'M√©trique':<30} {'SimpleRNN':>12} {'LSTM':>12}")
print("-" * 60)
print(f"{'RMSE':<30} {rmse_simple:>12.4f} {rmse_lstm:>12.4f}")
print(f"{'Param√®tres':<30} {simple_rnn_model.count_params():>12,} {lstm_model.count_params():>12,}")
print(f"{'Temps entra√Ænement (s)':<30} {time_simple:>12.1f} {time_lstm:>12.1f}")
print("=" * 60)

### ‚ùì QUESTIONS

Observez le tableau et les graphiques :

1. **Lequel est meilleur** en termes de RMSE ?
2. **Le gain de performance justifie-t-il** la complexit√© suppl√©mentaire (plus de param√®tres, entra√Ænement plus long) ?
3. **√Ä partir de quelle epoch** les courbes de validation stagnent-elles pour chaque mod√®le ?

*(vos r√©ponses ici)*

---

## √âtape 5 ‚Äî Exp√©rimenter

Maintenant c'est √† vous de jouer. Choisissez **une ou plusieurs** exp√©rimentations parmi les suivantes.

Pour chaque exp√©rimentation :
1. Demandez √† Gemini de g√©n√©rer le code
2. Lisez le code et demandez √† Gemini de vous l'expliquer
3. Ex√©cutez et observez les r√©sultats
4. Notez vos conclusions

---

### Exp√©rimentation A ‚Äî GRU

Le **GRU** (Gated Recurrent Unit) est un compromis entre SimpleRNN et LSTM : il a des portes comme le LSTM, mais avec une architecture plus simple (2 portes au lieu de 3). Il est souvent aussi performant que le LSTM mais plus rapide √† entra√Æner.

### ü§ñ GEMINI

Demandez √† Gemini :

> *"Cr√©e un mod√®le GRU avec la m√™me structure que le LSTM : 1 couche GRU(50), Dense(1), compile avec Adam et MSE. Entra√Æne pendant 20 epochs avec batch_size=32 et validation_data=(X_test, y_test). Mesure le temps d'entra√Ænement. Stocke dans `gru_model`, `history_gru`, `time_gru`. Affiche le summary."*

Puis demandez :

> *"Quelle est la diff√©rence entre GRU et LSTM ? Lequel a le plus de param√®tres ? Pourquoi ?"*

In [None]:
# VOTRE CODE G√âN√âR√â PAR GEMINI ICI


In [None]:
# Visualiser les r√©sultats du GRU
plot_training(history_gru, "GRU")

y_pred_gru = gru_model.predict(X_test)
plot_predictions(y_test, y_pred_gru, "GRU")

rmse_gru = np.sqrt(mean_squared_error(y_test.flatten(), y_pred_gru.flatten()))
print(f"RMSE GRU : {rmse_gru:.4f}")
print(f"Temps d'entra√Ænement : {time_gru:.1f}s")

### ‚ùì QUESTION

- Le GRU est-il plus rapide que le LSTM ? De combien ?
- La performance (RMSE) est-elle comparable ?
- Combien de param√®tres a le GRU par rapport au LSTM ?

*(vos observations ici)*

---

### Exp√©rimentation B ‚Äî Empiler des couches

### ü§ñ GEMINI

Demandez √† Gemini :

> *"Cr√©e un mod√®le avec 2 couches LSTM empil√©es : LSTM(50, return_sequences=True) pour la premi√®re couche, LSTM(50) pour la deuxi√®me, puis Dense(1). Attention : la premi√®re couche doit avoir `return_sequences=True` pour transmettre la s√©quence compl√®te √† la couche suivante. Compile avec Adam et MSE. Entra√Æne 20 epochs, batch_size=32, validation_data=(X_test, y_test). Stocke dans `stacked_model`, `history_stacked`, `time_stacked`. Affiche le summary."*

Puis demandez :

> *"Pourquoi faut-il `return_sequences=True` sur la premi√®re couche LSTM mais pas sur la derni√®re ?"*

In [None]:
# VOTRE CODE G√âN√âR√â PAR GEMINI ICI


In [None]:
# Visualiser les r√©sultats du mod√®le empil√©
plot_training(history_stacked, "LSTM empil√© (2 couches)")

y_pred_stacked = stacked_model.predict(X_test)
plot_predictions(y_test, y_pred_stacked, "LSTM empil√© (2 couches)")

rmse_stacked = np.sqrt(mean_squared_error(y_test.flatten(), y_pred_stacked.flatten()))
print(f"RMSE LSTM empil√© : {rmse_stacked:.4f}")
print(f"Param√®tres : {stacked_model.count_params():,}")

### ‚ùì QUESTION

- Le mod√®le empil√© est-il meilleur que le LSTM √† 1 couche ?
- Combien de param√®tres suppl√©mentaires a-t-il ?
- L'ajout de profondeur aide-t-il toujours ?

*(vos observations ici)*

---

### Exp√©rimentation C ‚Äî Ajouter du Dropout

### ü§ñ GEMINI

Demandez √† Gemini :

> *"Cr√©e un mod√®le LSTM avec Dropout : LSTM(50), Dropout(0.2), Dense(1). Compile avec Adam et MSE. Entra√Æne 20 epochs, batch_size=32, validation_data=(X_test, y_test). Stocke dans `dropout_model`, `history_dropout`, `time_dropout`. Affiche le summary."*

Puis demandez :

> *"Que fait le Dropout ? Pourquoi aide-t-il √† r√©duire l'overfitting ? Que signifie Dropout(0.2) ?"*

In [None]:
# VOTRE CODE G√âN√âR√â PAR GEMINI ICI


In [None]:
# Visualiser les r√©sultats du mod√®le avec Dropout
plot_training(history_dropout, "LSTM + Dropout")

y_pred_dropout = dropout_model.predict(X_test)
plot_predictions(y_test, y_pred_dropout, "LSTM + Dropout")

rmse_dropout = np.sqrt(mean_squared_error(y_test.flatten(), y_pred_dropout.flatten()))
print(f"RMSE LSTM + Dropout : {rmse_dropout:.4f}")

### ‚ùì QUESTION

- L'√©cart entre loss train et loss validation a-t-il diminu√© avec le Dropout ?
- La RMSE est-elle meilleure ou moins bonne ?
- Le Dropout r√©gularise-t-il efficacement ce mod√®le ?

*(vos observations ici)*

---

### Exp√©rimentation D ‚Äî Changer la taille de la fen√™tre

### ü§ñ GEMINI

Demandez √† Gemini :

> *"Teste le mod√®le LSTM avec deux tailles de fen√™tre diff√©rentes : window=20 et window=100. Pour chaque taille :
> 1. Recr√©e les s√©quences X_train et X_test avec `create_sequences` et la nouvelle taille de fen√™tre
> 2. Reshape les donn√©es en tenseur 3D
> 3. Cr√©e un LSTM(50) + Dense(1), compile avec Adam et MSE
> 4. Entra√Æne 20 epochs, batch_size=32
> 5. Calcule la RMSE
>
> Affiche les pr√©dictions des deux mod√®les c√¥te √† c√¥te avec les RMSE dans les titres. Utilise `scaled_train` et `scaled_test` comme donn√©es source."*

Puis demandez :

> *"Comment la taille de la fen√™tre affecte-t-elle les pr√©dictions ? Pourquoi une fen√™tre trop petite est probl√©matique ? Et trop grande ?"*

In [None]:
# VOTRE CODE G√âN√âR√â PAR GEMINI ICI


### ‚ùì QUESTION

- Quelle taille de fen√™tre donne les meilleurs r√©sultats ?
- Sachant que le cycle solaire dure environ 11 ans (~132 mois), une fen√™tre de 50 capture-t-elle un cycle complet ?
- Y a-t-il un trade-off entre la taille de la fen√™tre et le nombre d'√©chantillons d'entra√Ænement ?

*(vos observations ici)*

---

## √âtape 6 ‚Äî TensorBoard

TensorBoard permet de visualiser l'entra√Ænement en temps r√©el : loss, poids, distributions. On va r√©-entra√Æner notre meilleur mod√®le avec un callback TensorBoard.

In [None]:
%load_ext tensorboard

In [None]:
# Cr√©er un nouveau mod√®le LSTM pour TensorBoard
tb_model = Sequential([
    LSTM(50, activation='relu', input_shape=(WINDOW_SIZE, 1)),
    Dense(1)
])

tb_model.compile(optimizer='adam', loss='mse')

# Callback TensorBoard
logdir = os.path.join("logs", datetime.datetime.now().strftime("%Y%m%d-%H%M%S"))
tensorboard_callback = tf.keras.callbacks.TensorBoard(logdir, histogram_freq=1)

print(f"Logs TensorBoard dans : {logdir}")
print("Entra√Ænement avec TensorBoard...")

tb_model.fit(
    X_train, y_train,
    epochs=20,
    batch_size=32,
    validation_data=(X_test, y_test),
    callbacks=[tensorboard_callback]
)

In [None]:
%tensorboard --logdir logs

### ü§ñ GEMINI ‚Äî Comprendre TensorBoard

Demandez √† Gemini :

> *"Explique-moi ce que montrent les onglets Scalars et Histograms dans TensorBoard. √Ä quoi servent-ils pour le diagnostic d'un mod√®le de deep learning ?"*

---

## √âtape 7 ‚Äî Synth√®se

Vous avez construit et compar√© plusieurs approches pour pr√©dire les taches solaires :

| | SimpleRNN | LSTM | GRU |
|---|---|---|---|
| **Principe** | RNN basique, pas de portes | 3 portes (oubli, entr√©e, sortie) | 2 portes (reset, update) |
| **M√©moire longue** | Faible (vanishing gradient) | Bonne | Bonne |
| **Param√®tres** | Le moins | Le plus (~4x SimpleRNN) | Interm√©diaire (~3x SimpleRNN) |
| **Vitesse** | Le plus rapide | Le plus lent | Interm√©diaire |
| **Cas d'usage** | S√©quences courtes | S√©quences longues, d√©pendances complexes | Bon compromis performance/vitesse |

### ‚ùì QUESTIONS FINALES

1. **Cas d'usage** : dans votre domaine professionnel, imaginez un cas d'usage de RNN sur une s√©rie temporelle. D√©crivez-le en 2-3 phrases.

2. **Conseil** : un coll√®gue veut pr√©dire des ventes mensuelles avec seulement 100 points de donn√©es. Que lui conseillez-vous ? Quel mod√®le ? Quelle taille de fen√™tre ?

3. **Limites** : pourquoi le mod√®le a-t-il du mal avec les pics extr√™mes de la s√©rie ? Que pourrait-on faire pour am√©liorer les pr√©dictions ?

4. **Surprise** : qu'est-ce qui vous a le plus surpris dans cet atelier ?

*(vos r√©ponses ici)*

---

## Pour aller plus loin (optionnel)

Si vous avez du temps et de la curiosit√©, voici quelques pistes d'exploration. Utilisez Gemini pour vous guider.

- **Pr√©diction multi-step** : au lieu de pr√©dire 1 seul point, pr√©dire les 10 prochains points. Demandez √† Gemini *"Modifie le mod√®le pour qu'il pr√©dise les 10 prochains points au lieu d'un seul. Comment faut-il changer la couche Dense de sortie et les cibles y ?"*
- **Bidirectional LSTM** : demandez √† Gemini *"Enveloppe la couche LSTM dans un `Bidirectional()`. Quel avantage cela apporte-t-il pour une s√©rie temporelle ?"*
- **Autre dataset** : essayez avec des donn√©es de temp√©rature, de trafic web ou de cours de bourse
- **Attention mechanism** : demandez √† Gemini *"Ajoute une couche d'attention apr√®s le LSTM. Qu'est-ce que cela change ?"*

In [None]:
# VOTRE EXPLORATION ICI
