# Exploration du mod√®le Chronos-2

Ce notebook permet d'explorer la structure du mod√®le Chronos-2 depuis Hugging Face.


## 1. Installation et imports


In [None]:
# Configuration SSL pour macOS
import ssl
import certifi

# Utiliser les certificats de certifi
ssl._create_default_https_context = ssl._create_unverified_context

print("‚úì Configuration SSL appliqu√©e")


In [None]:
import torch
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from transformers import AutoModel, AutoConfig
from huggingface_hub import list_repo_files, model_info

print(f"PyTorch version: {torch.__version__}")
print(f"CUDA disponible: {torch.cuda.is_available()}")


## 2. √Ä propos de Chronos-2

**Chronos-2** est un mod√®le de fondation pour la pr√©vision de s√©ries temporelles d√©velopp√© par Amazon. 

Il supporte :
- Pr√©visions **univari√©es** (une seule s√©rie)
- Pr√©visions **multivari√©es** (plusieurs s√©ries simultan√©ment)
- Pr√©visions **inform√©es par des covariables** (variables externes)

Tout cela dans une architecture unique et unifi√©e !


In [None]:
# Utiliser le mod√®le Chronos-2 officiel
model_name = "amazon/chronos-2"

print(f"Mod√®le s√©lectionn√©: {model_name}")
print("Chronos-2 est la derni√®re version du mod√®le Amazon pour la pr√©vision de s√©ries temporelles")


## 3. Informations sur le mod√®le depuis Hugging Face


In [None]:
# R√©cup√©rer les informations du mod√®le
info = model_info(model_name)

print(f"Nom du mod√®le: {info.modelId}")
print(f"Auteur: {info.author}")
print(f"Tags: {info.tags}")
print(f"Pipeline: {info.pipeline_tag}")
print(f"Derni√®re modification: {info.lastModified}")


In [None]:
# Lister les fichiers du repository
files = list_repo_files(model_name)
print("\nFichiers dans le repository:")
for file in files:
    print(f"  - {file}")


## 4. Chargement de la configuration du mod√®le


In [None]:
# Charger la configuration sans t√©l√©charger les poids
config = AutoConfig.from_pretrained(model_name)

print("Configuration du mod√®le:")
print(f"  - Architecture: {config.model_type}")
print(f"  - Nombre de couches: {config.num_layers}")
print(f"  - Nombre de t√™tes d'attention: {config.num_heads}")
print(f"  - Dimension du mod√®le: {config.d_model}")
print(f"  - Dimension FFN: {config.d_ff}")
print(f"  - Taille du vocabulaire: {config.vocab_size}")
print(f"  - Longueur max: {config.n_positions if hasattr(config, 'n_positions') else 'N/A'}")


In [None]:
# Afficher toute la configuration
print("\nConfiguration compl√®te:")
print(config)


## 5. T√©l√©chargement et chargement du mod√®le

**Attention**: Le t√©l√©chargement peut prendre du temps selon la taille du mod√®le et votre connexion internet.


In [None]:
# Charger le mod√®le Chronos-2 avec la bonne classe
from chronos import Chronos2Pipeline

print("T√©l√©chargement du mod√®le Chronos-2 en cours...")
print("Note: Le t√©l√©chargement peut prendre plusieurs minutes...")

# Utiliser Chronos2Pipeline au lieu de AutoModel pour charger correctement les poids
pipeline = Chronos2Pipeline.from_pretrained(
    model_name, 
    device_map="mps",  # "mps" pour Apple Silicon, "cuda" pour GPU NVIDIA, "cpu" pour CPU
    torch_dtype="auto"
)
print("Mod√®le Chronos-2 charg√© avec succ√®s!")
print(f"Device utilis√©: {pipeline.model.device}")


## 6. Exploration de la structure du mod√®le


In [None]:
# Afficher l'architecture du mod√®le
print("Architecture du mod√®le:")
print(pipeline.model)


In [None]:
# Compter les param√®tres
def count_parameters(model):
    total_params = sum(p.numel() for p in model.parameters())
    trainable_params = sum(p.numel() for p in model.parameters() if p.requires_grad)
    return total_params, trainable_params

# Acc√©der au mod√®le T5 sous-jacent dans le pipeline
total, trainable = count_parameters(pipeline.model)
print(f"\nNombre total de param√®tres: {total:,}")
print(f"Param√®tres entra√Ænables: {trainable:,}")
print(f"Taille approximative en m√©moire: {total * 4 / (1024**2):.2f} MB (float32)")


In [None]:
# Lister tous les modules du mod√®le
print("\nModules principaux:")
for name, module in pipeline.model.named_children():
    print(f"  - {name}: {type(module).__name__}")


In [None]:
# Explorer les couches en d√©tail
print("\nCouches du mod√®le (premier niveau):")
for name, param in pipeline.model.named_parameters():
    if param.requires_grad:
        print(f"  - {name}: {param.shape}")


## 7. Analyse des composants cl√©s


In [None]:
# Analyser l'encoder
if hasattr(pipeline.model, 'encoder'):
    print("Structure de l'Encoder:")
    print(pipeline.model.encoder)
    print(f"\nNombre de couches dans l'encoder: {len(list(pipeline.model.encoder.children()))}")


In [None]:
# Analyser le decoder
if hasattr(pipeline.model, 'decoder'):
    print("Structure du Decoder:")
    print(pipeline.model.decoder)
    print(f"\nNombre de couches dans le decoder: {len(list(pipeline.model.decoder.children()))}")


## 11. Exemple d'utilisation de Chronos-2 pour la pr√©vision

Voici comment utiliser Chronos-2 pour faire des pr√©visions sur vos propres donn√©es.


In [None]:
import pandas as pd  # requires: pip install 'pandas[pyarrow]'
from chronos import Chronos2Pipeline

pipeline = Chronos2Pipeline.from_pretrained("amazon/chronos-2", device_map="mps")

# Load historical target values and past values of covariates
context_df = pd.read_parquet("https://autogluon.s3.amazonaws.com/datasets/timeseries/electricity_price/train.parquet")

# (Optional) Load future values of covariates
test_df = pd.read_parquet("https://autogluon.s3.amazonaws.com/datasets/timeseries/electricity_price/test.parquet")
future_df = test_df.drop(columns="target")

# Generate predictions with covariates
pred_df = pipeline.predict_df(
    context_df,
    future_df=future_df,
    prediction_length=24,  # Number of steps to forecast
    quantile_levels=[0.1, 0.5, 0.9],  # Quantiles for probabilistic forecast
    id_column="id",  # Column identifying different time series
    timestamp_column="timestamp",  # Column with datetime information
    target="target",  # Column(s) with time series values to predict
)


## 12. Param√®tres d'inf√©rence du Chronos2Pipeline

Explorons les param√®tres disponibles pour l'inf√©rence avec Chronos-2.


In [None]:
# Examiner la signature de la m√©thode predict_df
import inspect

print("=== Signature de predict_df ===\n")
print(inspect.signature(pipeline.predict_df))
print("\n" + "="*60 + "\n")

# Afficher la documentation compl√®te
print("=== Documentation de predict_df ===\n")
print(pipeline.predict_df.__doc__)


In [None]:
# Examiner aussi la m√©thode predict (pour les arrays numpy/tensors)
print("=== Signature de predict ===\n")
print(inspect.signature(pipeline.predict))
print("\n" + "="*60 + "\n")

print("=== Documentation de predict ===\n")
print(pipeline.predict.__doc__)


## 13. Exemple d'inf√©rence avec param√®tres personnalis√©s

Voici comment utiliser les diff√©rents param√®tres d'inf√©rence disponibles dans Chronos-2.


In [None]:
# Cr√©er des donn√©es de test simples
import pandas as pd
import numpy as np

# Cr√©er une s√©rie temporelle simple pour tester
dates = pd.date_range(start='2024-01-01', periods=100, freq='D')
values = np.sin(np.linspace(0, 4*np.pi, 100)) + np.random.normal(0, 0.1, 100)

# Cr√©er un DataFrame de contexte
simple_context_df = pd.DataFrame({
    'id': ['series_1'] * 100,
    'timestamp': dates,
    'target': values
})

print("Donn√©es de test cr√©√©es:")
print(simple_context_df.head())
print(f"\nTaille: {len(simple_context_df)} observations")


In [None]:
# Exemple 1: Inf√©rence avec param√®tres par d√©faut
print("=== Inf√©rence avec param√®tres par d√©faut ===\n")

pred_default = pipeline.predict_df(
    simple_context_df,
    prediction_length=10,  # Nombre de pas de temps √† pr√©dire
    id_column="id",
    timestamp_column="timestamp",
    target="target"
)

print(pred_default.head(15))
print(f"\nShape: {pred_default.shape}")


In [None]:
# Exemple 2: Inf√©rence avec quantiles sp√©cifiques
print("=== Inf√©rence avec quantiles personnalis√©s ===\n")

pred_quantiles = pipeline.predict_df(
    simple_context_df,
    prediction_length=10,
    quantile_levels=[0.05, 0.25, 0.5, 0.75, 0.95],  # Quantiles pour intervalles de confiance
    id_column="id",
    timestamp_column="timestamp",
    target="target"
)

print(pred_quantiles.head(15))
print(f"\nColonnes disponibles: {pred_quantiles.columns.tolist()}")


In [None]:
# Visualiser les pr√©dictions avec intervalles de confiance
import matplotlib.pyplot as plt

fig, ax = plt.subplots(figsize=(14, 6))

# Afficher les donn√©es historiques
ax.plot(simple_context_df['timestamp'], simple_context_df['target'], 
        label='Donn√©es historiques', linewidth=2, color='blue')

# Extraire les pr√©dictions
pred_filtered = pred_quantiles[pred_quantiles['id'] == 'series_1']

# Afficher la m√©diane (quantile 0.5)
if '0.5' in pred_filtered.columns:
    ax.plot(pred_filtered['timestamp'], pred_filtered['0.5'], 
            label='Pr√©diction (m√©diane)', linewidth=2, color='red', linestyle='--')

# Afficher les intervalles de confiance
if '0.05' in pred_filtered.columns and '0.95' in pred_filtered.columns:
    ax.fill_between(pred_filtered['timestamp'], 
                     pred_filtered['0.05'], 
                     pred_filtered['0.95'],
                     alpha=0.2, color='red', label='IC 90%')

if '0.25' in pred_filtered.columns and '0.75' in pred_filtered.columns:
    ax.fill_between(pred_filtered['timestamp'], 
                     pred_filtered['0.25'], 
                     pred_filtered['0.75'],
                     alpha=0.3, color='red', label='IC 50%')

ax.set_xlabel('Date', fontsize=12)
ax.set_ylabel('Valeur', fontsize=12)
ax.set_title('Pr√©visions Chronos-2 avec intervalles de confiance', fontsize=14, fontweight='bold')
ax.legend(loc='best')
ax.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()


### Param√®tres avanc√©s d'inf√©rence

Les param√®tres principaux disponibles pour l'inf√©rence avec Chronos-2 incluent g√©n√©ralement :

- **`prediction_length`**: Nombre de pas de temps √† pr√©dire
- **`quantile_levels`**: Liste des quantiles pour les pr√©visions probabilistes (ex: [0.1, 0.5, 0.9])
- **`num_samples`**: Nombre d'√©chantillons √† g√©n√©rer pour les pr√©visions probabilistes
- **`temperature`**: Contr√¥le la diversit√© des pr√©dictions (plus √©lev√© = plus de variance)
- **`top_k`**: Consid√®re uniquement les k tokens les plus probables
- **`top_p`**: √âchantillonnage nucleus (consid√®re les tokens dont la prob cumul√©e < p)
- **`batch_size`**: Taille des lots pour le traitement
- **`limit_prediction_length`**: Limite la longueur maximale des pr√©dictions


In [None]:
# Exemple 3: Exploration des param√®tres disponibles dans le pipeline
print("=== Attributs du pipeline ===\n")

# Afficher les attributs principaux du pipeline
if hasattr(pipeline, '__dict__'):
    print("Attributs disponibles:")
    for key, value in pipeline.__dict__.items():
        if not key.startswith('_'):
            print(f"  - {key}: {type(value).__name__}")

# V√©rifier s'il y a une configuration
if hasattr(pipeline, 'model') and hasattr(pipeline.model, 'config'):
    print("\n=== Configuration du mod√®le ===\n")
    config = pipeline.model.config
    if hasattr(config, 'chronos_config'):
        chronos_cfg = config.chronos_config
        print("Configuration Chronos:")
        for key, value in chronos_cfg.items():
            print(f"  - {key}: {value}")


In [None]:
# Exemple 4: Pr√©visions avec num_samples (si disponible)
# Testons diff√©rents sc√©narios pour voir quels param√®tres sont accept√©s

print("=== Test avec diff√©rents param√®tres ===\n")

try:
    # Essayer avec num_samples
    pred_samples = pipeline.predict_df(
        simple_context_df,
        prediction_length=10,
        num_samples=100,  # Nombre d'√©chantillons pour pr√©visions probabilistes
        id_column="id",
        timestamp_column="timestamp",
        target="target"
    )
    print("‚úì num_samples est support√©")
    print(f"  Shape des pr√©dictions: {pred_samples.shape}")
except TypeError as e:
    print(f"‚úó num_samples n'est pas support√© ou mal utilis√©")
    print(f"  Erreur: {str(e)}")


In [None]:
# Exemple 5: Tester temperature (si disponible)
try:
    pred_temp = pipeline.predict_df(
        simple_context_df,
        prediction_length=10,
        temperature=0.8,  # Contr√¥le la diversit√© des pr√©dictions
        quantile_levels=[0.1, 0.5, 0.9],
        id_column="id",
        timestamp_column="timestamp",
        target="target"
    )
    print("‚úì temperature est support√©")
    print(f"  Shape des pr√©dictions: {pred_temp.shape}")
except TypeError as e:
    print(f"‚úó temperature n'est pas support√© ou mal utilis√©")
    print(f"  Erreur: {str(e)}")


In [None]:
print("\n=== Utilisation de predict() avec arrays ===\n")

# 1) S√©rie historique univari√©e
context_tensor = torch.tensor(
    simple_context_df['target'].values,
    dtype=torch.float32
)  # shape: (T,)

# 2) Passage en 3D : (n_series, n_variates, history_length)
#    Ici: (1, 1, T)
context_3d = context_tensor.unsqueeze(0).unsqueeze(0)

# 3) Pr√©dictions
predictions = pipeline.predict(
    inputs=context_3d,    # ou juste pipeline.predict(context_3d, prediction_length=10)
    prediction_length=10
)

print(f"Type des pr√©dictions: {type(predictions)}")
print(f"\nPr√©dictions:\n{predictions}")

## 14. R√©sum√© des param√®tres d'inf√©rence

Voici un r√©sum√© des param√®tres principaux pour faire de l'inf√©rence avec Chronos-2 :

### Param√®tres essentiels pour `predict_df()`:

1. **`context_df`**: DataFrame avec les donn√©es historiques (obligatoire)
2. **`prediction_length`**: Nombre de pas de temps √† pr√©dire (obligatoire)
3. **`id_column`**: Nom de la colonne identifiant les diff√©rentes s√©ries (par d√©faut: "id")
4. **`timestamp_column`**: Nom de la colonne avec les timestamps (par d√©faut: "timestamp")
5. **`target`**: Nom de la colonne cible √† pr√©dire (obligatoire)
6. **`quantile_levels`**: Liste des quantiles pour pr√©visions probabilistes (ex: [0.1, 0.5, 0.9])
7. **`future_df`**: DataFrame avec les valeurs futures des covariables (optionnel)
8. **`num_samples`**: Nombre d'√©chantillons √† g√©n√©rer (peut varier selon la version)
9. **`batch_size`**: Taille des lots pour le traitement (optionnel)

### Param√®tres essentiels pour `predict()`:

1. **`context`**: Tensor avec les donn√©es historiques
2. **`prediction_length`**: Nombre de pas de temps √† pr√©dire
3. **`num_samples`**: Nombre d'√©chantillons √† g√©n√©rer
4. **`temperature`**: Temp√©rature pour l'√©chantillonnage (peut √™tre disponible)
5. **`top_k`** / **`top_p`**: Param√®tres d'√©chantillonnage (selon la version)


## 15. Exemple complet d'inf√©rence avec tous les param√®tres

Voici un exemple complet montrant comment utiliser Chronos-2 avec tous les param√®tres principaux.


In [None]:
# Exemple complet avec configuration personnalis√©e
print("=== EXEMPLE COMPLET D'INF√âRENCE AVEC CHRONOS-2 ===\n")

# 1. Pr√©parer les donn√©es
context_df = simple_context_df.copy()
print(f"1. Donn√©es de contexte: {len(context_df)} observations")
print(f"   P√©riode: {context_df['timestamp'].min()} √† {context_df['timestamp'].max()}\n")

# 2. Configurer les param√®tres d'inf√©rence
prediction_config = {
    'prediction_length': 14,  # Pr√©dire 14 jours
    'quantile_levels': [0.01, 0.05, 0.1, 0.25, 0.5, 0.75, 0.9, 0.95, 0.99],  # Quantiles multiples
    'id_column': 'id',
    'timestamp_column': 'timestamp',
    'target': 'target'
}

print("2. Configuration des param√®tres:")
for param, value in prediction_config.items():
    print(f"   - {param}: {value}")

# 3. Faire les pr√©dictions
print("\n3. G√©n√©ration des pr√©dictions...")
predictions_df = pipeline.predict_df(
    context_df,
    **prediction_config
)

print(f"   ‚úì Pr√©dictions g√©n√©r√©es: {predictions_df.shape}")
print(f"   ‚úì Colonnes: {predictions_df.columns.tolist()}\n")

# 4. Afficher un √©chantillon des r√©sultats
print("4. Aper√ßu des pr√©dictions:")
print(predictions_df.head(10))

# 5. Statistiques sur les pr√©dictions
print("\n5. Statistiques des pr√©dictions:")
if '0.5' in predictions_df.columns:
    median_values = predictions_df['0.5']
    print(f"   - M√©diane min: {median_values.min():.4f}")
    print(f"   - M√©diane max: {median_values.max():.4f}")
    print(f"   - M√©diane moyenne: {median_values.mean():.4f}")
    
# 6. Calculer la largeur des intervalles de confiance
if '0.05' in predictions_df.columns and '0.95' in predictions_df.columns:
    ic_90 = predictions_df['0.95'] - predictions_df['0.05']
    print(f"   - Largeur moyenne IC 90%: {ic_90.mean():.4f}")
    
if '0.25' in predictions_df.columns and '0.75' in predictions_df.columns:
    ic_50 = predictions_df['0.75'] - predictions_df['0.25']
    print(f"   - Largeur moyenne IC 50%: {ic_50.mean():.4f}")


In [None]:
# Visualisation avanc√©e des pr√©dictions avec tous les quantiles
fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(16, 10))

# Pr√©parer les donn√©es
pred_plot = predictions_df[predictions_df['id'] == 'series_1'].copy()
hist_plot = context_df[context_df['id'] == 'series_1'].copy()

# --- Graphique 1: Vue d'ensemble avec tous les intervalles de confiance ---
ax1.plot(hist_plot['timestamp'], hist_plot['target'], 
         label='Donn√©es historiques', linewidth=2.5, color='#2E86AB', alpha=0.8)

# M√©diane
if '0.5' in pred_plot.columns:
    ax1.plot(pred_plot['timestamp'], pred_plot['0.5'], 
             label='Pr√©diction (m√©diane)', linewidth=2.5, color='#A23B72', linestyle='--')

# Intervalles de confiance empil√©s
intervals = [
    ('0.01', '0.99', 0.05, 'IC 98%'),
    ('0.05', '0.95', 0.10, 'IC 90%'),
    ('0.10', '0.90', 0.15, 'IC 80%'),
    ('0.25', '0.75', 0.25, 'IC 50%'),
]

colors = ['#F18F01', '#C73E1D', '#6A994E', '#A23B72']
for i, (q_low, q_high, alpha, label) in enumerate(intervals):
    if q_low in pred_plot.columns and q_high in pred_plot.columns:
        ax1.fill_between(pred_plot['timestamp'], 
                         pred_plot[q_low], 
                         pred_plot[q_high],
                         alpha=alpha, color=colors[i % len(colors)], label=label)

ax1.axvline(x=hist_plot['timestamp'].iloc[-1], color='gray', linestyle=':', 
            linewidth=2, label='D√©but des pr√©dictions')
ax1.set_xlabel('Date', fontsize=12, fontweight='bold')
ax1.set_ylabel('Valeur', fontsize=12, fontweight='bold')
ax1.set_title('Pr√©visions Chronos-2 avec intervalles de confiance multiples', 
              fontsize=14, fontweight='bold')
ax1.legend(loc='best', fontsize=10)
ax1.grid(True, alpha=0.3, linestyle='--')

# --- Graphique 2: Zoom sur les pr√©dictions uniquement ---
# M√©diane
if '0.5' in pred_plot.columns:
    ax2.plot(pred_plot['timestamp'], pred_plot['0.5'], 
             label='M√©diane (Q50)', linewidth=2.5, color='#A23B72', marker='o')

# Afficher plusieurs quantiles individuellement
quantiles_to_plot = ['0.05', '0.25', '0.75', '0.95']
quantile_colors = ['#C73E1D', '#F18F01', '#6A994E', '#2E86AB']

for q, color in zip(quantiles_to_plot, quantile_colors):
    if q in pred_plot.columns:
        q_label = f'Q{int(float(q)*100)}'
        ax2.plot(pred_plot['timestamp'], pred_plot[q], 
                 label=q_label, linewidth=1.5, color=color, 
                 marker='s', markersize=4, alpha=0.7)

ax2.set_xlabel('Date', fontsize=12, fontweight='bold')
ax2.set_ylabel('Valeur', fontsize=12, fontweight='bold')
ax2.set_title('D√©tail des quantiles de pr√©diction', fontsize=14, fontweight='bold')
ax2.legend(loc='best', fontsize=10, ncol=2)
ax2.grid(True, alpha=0.3, linestyle='--')

plt.tight_layout()
plt.show()

print("\n‚úì Visualisation compl√®te des pr√©dictions avec intervalles de confiance")


## 16. Bonnes pratiques pour l'inf√©rence avec Chronos-2

### üéØ Choix des param√®tres

**Quantiles (`quantile_levels`)**:
- Pour des intervalles de confiance standards : `[0.1, 0.5, 0.9]` (IC 80%)
- Pour une analyse d√©taill√©e : `[0.01, 0.05, 0.1, 0.25, 0.5, 0.75, 0.9, 0.95, 0.99]`
- Le quantile 0.5 correspond √† la m√©diane (pr√©diction centrale)

**Longueur de pr√©diction (`prediction_length`)**:
- D√©pend de la fr√©quence des donn√©es et de l'horizon souhait√©
- G√©n√©ralement : 10-20% de la longueur du contexte est raisonnable
- Pour des donn√©es journali√®res : 7-30 jours est courant

**Nombre d'√©chantillons (`num_samples`)**:
- Plus d'√©chantillons = pr√©dictions plus lisses mais calcul plus lent
- Valeurs typiques : 20-100 √©chantillons
- Pour production : 100-1000 √©chantillons selon la pr√©cision requise

### ‚ö° Performance

- Utilisez `batch_size` pour traiter plusieurs s√©ries en parall√®le
- Pour GPU: augmentez `batch_size` pour maximiser l'utilisation
- Pour CPU: r√©duisez `batch_size` si vous manquez de m√©moire

### üìä Interpr√©tation des r√©sultats

- Les quantiles extr√™mes (0.01, 0.99) capturent les sc√©narios rares
- L'√©cart entre quantiles indique l'incertitude du mod√®le
- Un IC large = haute incertitude, IC √©troit = haute confiance


## 17. Utilisation avanc√©e : m√©thode `predict()` avec tensors

La m√©thode `predict()` offre un contr√¥le plus bas niveau et permet de travailler directement avec des tensors PyTorch. Cette approche est utile pour :
- Int√©grer Chronos-2 dans un pipeline ML personnalis√©
- Avoir un contr√¥le fin sur les param√®tres d'inf√©rence
- Traiter des donn√©es d√©j√† sous forme de tensors


In [None]:
# Examiner en d√©tail la m√©thode predict et ses param√®tres
print("=== Documentation d√©taill√©e de la m√©thode predict() ===\n")

# Afficher la signature
print("Signature:")
print(inspect.signature(pipeline.predict))
print("\n" + "="*70 + "\n")

# Afficher la documentation
if pipeline.predict.__doc__:
    print("Documentation:")
    print(pipeline.predict.__doc__)
else:
    print("Pas de documentation disponible pour predict()")
    
# Explorer les attributs du pipeline
print("\n" + "="*70 + "\n")
print("Type du pipeline:", type(pipeline))
print("M√©thodes disponibles:")
for attr in dir(pipeline):
    if not attr.startswith('_') and callable(getattr(pipeline, attr)):
        print(f"  - {attr}")


In [None]:
# Exemple d'utilisation de predict() avec des tensors
print("=== Exemple avec predict() et tensors ===\n")

# Pr√©parer les donn√©es
context_values = simple_context_df['target'].values
context_tensor = torch.tensor(context_values, dtype=torch.float32).unsqueeze(0)  # Shape: (1, seq_len)

print(f"1. Contexte pr√©par√©:")
print(f"   - Shape: {context_tensor.shape}")
print(f"   - Type: {context_tensor.dtype}")
print(f"   - Device: {context_tensor.device}\n")

# Faire des pr√©dictions avec param√®tres par d√©faut
try:
    predictions_basic = pipeline.predict(
        context=context_tensor,
        prediction_length=10
    )
    
    print(f"2. Pr√©dictions g√©n√©r√©es:")
    print(f"   - Type: {type(predictions_basic)}")
    print(f"   - Shape: {predictions_basic.shape}")
    print(f"   - Device: {predictions_basic.device}\n")
    
    print(f"3. Aper√ßu des pr√©dictions:")
    print(predictions_basic)
    
except Exception as e:
    print(f"Erreur lors de l'inf√©rence: {e}")
    print(f"Type d'erreur: {type(e).__name__}")


In [None]:
# Essayer avec num_samples pour obtenir plusieurs trajectoires
print("\n=== Test avec num_samples ===\n")

try:
    predictions_samples = pipeline.predict(
        context=context_tensor,
        prediction_length=10,
        num_samples=20  # G√©n√©rer 20 trajectoires de pr√©diction
    )
    
    print(f"‚úì Pr√©dictions avec √©chantillons multiples:")
    print(f"   - Shape: {predictions_samples.shape}")
    print(f"   - Expected shape: (num_samples, batch_size, prediction_length)")
    
    # Calculer statistiques
    print(f"\n   Statistiques par pas de temps:")
    mean_pred = predictions_samples.mean(dim=0).squeeze()
    std_pred = predictions_samples.std(dim=0).squeeze()
    
    for i in range(min(5, len(mean_pred))):
        print(f"   - t+{i+1}: {mean_pred[i]:.4f} ¬± {std_pred[i]:.4f}")
        
except TypeError as e:
    print(f"‚úó num_samples non support√© dans cette signature")
    print(f"   Erreur: {e}")
except Exception as e:
    print(f"‚úó Erreur: {type(e).__name__}: {e}")


In [None]:
# Tester d'autres param√®tres potentiels
print("\n=== Test de param√®tres additionnels ===\n")

# Liste de param√®tres √† tester
params_to_test = [
    ('temperature', 0.8, "Contr√¥le la diversit√© des pr√©dictions"),
    ('top_k', 50, "Limite aux k tokens les plus probables"),
    ('top_p', 0.9, "√âchantillonnage nucleus"),
    ('batch_size', 1, "Taille du batch"),
]

for param_name, param_value, description in params_to_test:
    try:
        kwargs = {
            'context': context_tensor,
            'prediction_length': 10,
            param_name: param_value
        }
        
        pred_test = pipeline.predict(**kwargs)
        print(f"‚úì {param_name:20s}: Support√© - {description}")
        print(f"  Shape: {pred_test.shape}")
        
    except TypeError as e:
        if "unexpected keyword argument" in str(e):
            print(f"‚úó {param_name:20s}: Non support√© dans cette version")
        else:
            print(f"‚úó {param_name:20s}: Erreur - {str(e)[:60]}")
    except Exception as e:
        print(f"‚úó {param_name:20s}: Erreur - {type(e).__name__}")


## 18. Code template r√©utilisable pour l'inf√©rence

Voici un template complet que vous pouvez r√©utiliser pour faire de l'inf√©rence avec Chronos-2 :


In [None]:
"""
TEMPLATE R√âUTILISABLE POUR L'INF√âRENCE AVEC CHRONOS-2
========================================================

Ce template peut √™tre copi√© et adapt√© pour vos propres donn√©es.
"""

def make_chronos2_predictions(
    context_df,
    prediction_length=30,
    quantile_levels=None,
    id_column="id",
    timestamp_column="timestamp",
    target_column="target",
    future_df=None,
    pipeline=None
):
    """
    Fait des pr√©dictions avec Chronos-2 sur un DataFrame pandas.
    
    Parameters
    ----------
    context_df : pd.DataFrame
        DataFrame avec les donn√©es historiques
    prediction_length : int
        Nombre de pas de temps √† pr√©dire
    quantile_levels : list, optional
        Liste des quantiles √† calculer (default: [0.1, 0.5, 0.9])
    id_column : str
        Nom de la colonne identifiant les s√©ries
    timestamp_column : str
        Nom de la colonne avec les timestamps
    target_column : str
        Nom de la colonne cible
    future_df : pd.DataFrame, optional
        DataFrame avec les valeurs futures des covariables
    pipeline : Chronos2Pipeline
        Instance du pipeline Chronos-2 (sera cr√©√©e si None)
    
    Returns
    -------
    pd.DataFrame
        DataFrame avec les pr√©dictions pour chaque quantile
    """
    import pandas as pd
    from chronos import Chronos2Pipeline
    
    # Param√®tres par d√©faut
    if quantile_levels is None:
        quantile_levels = [0.1, 0.5, 0.9]
    
    # Charger le pipeline si n√©cessaire
    if pipeline is None:
        print("Chargement du pipeline Chronos-2...")
        pipeline = Chronos2Pipeline.from_pretrained(
            "amazon/chronos-2",
            device_map="mps"  # ou "cuda" pour GPU NVIDIA, "cpu" pour CPU
        )
    
    # Configuration de la pr√©diction
    config = {
        'prediction_length': prediction_length,
        'quantile_levels': quantile_levels,
        'id_column': id_column,
        'timestamp_column': timestamp_column,
        'target': target_column
    }
    
    # Ajouter les covariables si disponibles
    if future_df is not None:
        config['future_df'] = future_df
    
    # Faire les pr√©dictions
    print(f"G√©n√©ration de {prediction_length} pr√©dictions...")
    predictions_df = pipeline.predict_df(context_df, **config)
    
    print(f"‚úì Pr√©dictions g√©n√©r√©es: {predictions_df.shape}")
    
    return predictions_df

# Exemple d'utilisation du template
print("=== EXEMPLE D'UTILISATION DU TEMPLATE ===\n")

predictions = make_chronos2_predictions(
    context_df=simple_context_df,
    prediction_length=14,
    quantile_levels=[0.05, 0.25, 0.5, 0.75, 0.95],
    id_column="id",
    timestamp_column="timestamp",
    target_column="target",
    pipeline=pipeline  # R√©utiliser le pipeline d√©j√† charg√©
)

print("\nR√©sultat:")
print(predictions.head(10))


## 19. Ressources utiles

### Documentation officielle

- **Page du mod√®le**: https://huggingface.co/amazon/chronos-2
- **GitHub Repository**: https://github.com/amazon-science/chronos-forecasting
- **Paper Chronos-2**: https://arxiv.org/abs/2510.15821

### Param√®tres d'inf√©rence principaux

| Param√®tre | Description | Valeurs typiques |
|-----------|-------------|------------------|
| `prediction_length` | Horizon de pr√©vision | 7-30 pour donn√©es journali√®res |
| `quantile_levels` | Quantiles pour IC | [0.1, 0.5, 0.9] ou [0.05, 0.25, 0.5, 0.75, 0.95] |
| `num_samples` | Nombre d'√©chantillons | 20-100 (dev), 100-1000 (prod) |
| `batch_size` | Taille des lots | Selon m√©moire disponible |
| `temperature` | Diversit√© des pr√©dictions | 0.7-1.0 (si disponible) |


---

## ‚úÖ R√©sum√©

Ce notebook vous a montr√© comment :

1. ‚úì Charger et explorer le mod√®le Chronos-2
2. ‚úì Utiliser la m√©thode `predict_df()` pour faire des pr√©dictions sur des DataFrames
3. ‚úì Sp√©cifier les param√®tres d'inf√©rence (quantiles, prediction_length, etc.)
4. ‚úì Utiliser la m√©thode `predict()` pour un contr√¥le bas niveau avec des tensors
5. ‚úì Visualiser les pr√©dictions avec des intervalles de confiance
6. ‚úì Cr√©er un template r√©utilisable pour vos propres projets

**Param√®tres d'inf√©rence principaux :**
- `prediction_length`: Horizon de pr√©vision
- `quantile_levels`: Quantiles pour pr√©visions probabilistes
- `num_samples`: Nombre d'√©chantillons √† g√©n√©rer
- `id_column`, `timestamp_column`, `target`: Colonnes du DataFrame
- `future_df`: Covariables futures (optionnel)

Vous √™tes maintenant pr√™t √† utiliser Chronos-2 pour vos propres pr√©visions de s√©ries temporelles ! üöÄ


## 20. Utilisation avec votre propre dataset

Cette section montre comment utiliser Chronos-2 avec votre dataset personnalis√©.


In [None]:
# Pr√©paration de votre dataset pour Chronos-2
# 
# Votre dataset doit avoir:
# - Une colonne 'date' (ou similaire) avec les timestamps
# - Des colonnes num√©riques pour les s√©ries temporelles √† pr√©dire
# - Optionnellement: d'autres colonnes comme covariables

print("=== PR√âPARATION DU DATASET ===\n")

# Supposons que vous avez votre DataFrame dans une variable 'df'
# Si ce n'est pas le cas, chargez-le ici:
# df = pd.read_csv('votre_fichier.csv')
# ou
# df = pd.read_excel('votre_fichier.xlsx')

# Afficher les informations du dataset
print("Structure du dataset:")
print(f"  - Nombre de lignes: {len(df)}")
print(f"  - Nombre de colonnes: {len(df.columns)}")
print(f"  - Colonnes: {df.columns.tolist()}\n")

# Afficher les premi√®res lignes
print("Premi√®res lignes:")
print(df.head())
print("\n" + "="*60 + "\n")

# V√©rifier les types de donn√©es
print("Types de donn√©es:")
print(df.dtypes)
print("\n" + "="*60 + "\n")

# V√©rifier les valeurs manquantes
print("Valeurs manquantes par colonne:")
missing = df.isnull().sum()
print(missing[missing > 0])


In [None]:
# Fonction pour pr√©parer le dataset au format Chronos-2
def prepare_data_for_chronos2(
    df,
    date_column='date',
    target_columns=None,
    covariate_columns=None,
    id_value='series_1',
    freq=None,
    fill_method='forward'
):
    """
    Pr√©pare un DataFrame pour l'inf√©rence avec Chronos-2.
    
    Parameters
    ----------
    df : pd.DataFrame
        DataFrame avec les donn√©es brutes
    date_column : str
        Nom de la colonne contenant les dates
    target_columns : list or str
        Colonne(s) √† pr√©dire. Si None, utilise toutes les colonnes num√©riques sauf date
    covariate_columns : list
        Colonnes √† utiliser comme covariables (optionnel)
    id_value : str
        Identifiant de la s√©rie temporelle
    freq : str or None
        Fr√©quence des donn√©es (ex: 'D' pour quotidien, 'M' pour mensuel)
        Si None, sera inf√©r√©e automatiquement
    fill_method : str
        M√©thode pour remplir les valeurs manquantes lors de la cr√©ation d'une s√©rie r√©guli√®re
        'forward': forward fill, 'backward': backward fill, 'interpolate': interpolation lin√©aire
    
    Returns
    -------
    pd.DataFrame
        DataFrame format√© pour Chronos-2 avec colonnes: id, timestamp, target, [covariates]
    """
    # Copier le DataFrame
    df_prep = df.copy()
    
    # Convertir la colonne de date en timestamp
    if date_column in df_prep.columns:
        df_prep['timestamp'] = pd.to_datetime(df_prep[date_column])
    else:
        raise ValueError(f"Colonne '{date_column}' introuvable dans le DataFrame")
    
    # Trier par timestamp et supprimer les doublons
    df_prep = df_prep.sort_values('timestamp').drop_duplicates(subset=['timestamp']).reset_index(drop=True)
    
    # Identifier les colonnes num√©riques (sauf date et timestamp)
    numeric_cols = df_prep.select_dtypes(include=[np.number]).columns.tolist()
    if 'timestamp' in numeric_cols:
        numeric_cols.remove('timestamp')
    
    # D√©terminer les colonnes cibles
    if target_columns is None:
        # Par d√©faut, utiliser toutes les colonnes num√©riques
        target_columns = numeric_cols
    elif isinstance(target_columns, str):
        target_columns = [target_columns]
    
    # V√©rifier que les colonnes cibles existent
    for col in target_columns:
        if col not in df_prep.columns:
            raise ValueError(f"Colonne cible '{col}' introuvable")
    
    # D√©terminer les covariables (toutes les autres colonnes num√©riques)
    if covariate_columns is None:
        covariate_columns = [col for col in numeric_cols if col not in target_columns]
    
    # Inf√©rer ou d√©terminer la fr√©quence
    if freq is None:
        # Essayer d'inf√©rer la fr√©quence √† partir des timestamps
        timestamps_sorted = df_prep['timestamp'].sort_values().reset_index(drop=True)
        freq = pd.infer_freq(timestamps_sorted)
        
        if freq is None:
            # Si l'inf√©rence √©choue, calculer la fr√©quence la plus commune
            if len(timestamps_sorted) > 1:
                diffs = timestamps_sorted.diff().dropna()
                most_common_diff = diffs.mode()
                if len(most_common_diff) > 0:
                    # Convertir la diff√©rence la plus commune en fr√©quence
                    diff_value = most_common_diff.iloc[0]
                    if pd.Timedelta(days=1) <= diff_value <= pd.Timedelta(days=1.5):
                        freq = 'D'  # Daily
                    elif pd.Timedelta(days=7) <= diff_value <= pd.Timedelta(days=8):
                        freq = 'W'  # Weekly
                    elif pd.Timedelta(days=28) <= diff_value <= pd.Timedelta(days=32):
                        freq = 'M'  # Monthly
                    elif pd.Timedelta(days=90) <= diff_value <= pd.Timedelta(days=95):
                        freq = 'Q'  # Quarterly
                    else:
                        # Utiliser la diff√©rence moyenne comme fr√©quence personnalis√©e
                        freq = diff_value
                        print(f"‚ö†Ô∏è  Utilisation d'une fr√©quence personnalis√©e: {freq}")
                else:
                    raise ValueError("Impossible de d√©terminer la fr√©quence des donn√©es. Veuillez sp√©cifier 'freq' manuellement.")
            else:
                raise ValueError("Pas assez de donn√©es pour inf√©rer la fr√©quence. Veuillez sp√©cifier 'freq' manuellement.")
    
    print(f"‚úì Fr√©quence utilis√©e: {freq}")
    
    # Cr√©er une s√©rie de timestamps r√©guli√®re
    min_timestamp = df_prep['timestamp'].min()
    max_timestamp = df_prep['timestamp'].max()
    
    # Cr√©er un index de dates r√©guli√®res
    if isinstance(freq, str):
        regular_index = pd.date_range(start=min_timestamp, end=max_timestamp, freq=freq)
    else:
        # Si freq est un Timedelta, cr√©er manuellement
        regular_index = pd.date_range(start=min_timestamp, end=max_timestamp, freq=freq)
    
    print(f"‚úì S√©rie r√©guli√®re cr√©√©e: {len(regular_index)} timestamps de {min_timestamp} √† {max_timestamp}")
    
    # Cr√©er le DataFrame au format long pour Chronos-2
    result_dfs = []
    
    for target_col in target_columns:
        # Cr√©er un DataFrame pour cette s√©rie avec les timestamps r√©guliers
        series_df = pd.DataFrame({
            'id': [id_value] * len(regular_index),
            'timestamp': regular_index
        })
        
        # R√©indexer les donn√©es originales sur les timestamps r√©guliers
        target_series = df_prep.set_index('timestamp')[target_col]
        target_series = target_series.reindex(regular_index)
        
        # Remplir les valeurs manquantes
        if fill_method == 'forward':
            target_series = target_series.ffill()
        elif fill_method == 'backward':
            target_series = target_series.bfill()
        elif fill_method == 'interpolate':
            target_series = target_series.interpolate(method='linear')
        else:
            # Par d√©faut, forward fill puis backward fill
            target_series = target_series.ffill().bfill()
        
        series_df['target'] = target_series.values
        
        # Ajouter les covariables si sp√©cifi√©es
        for cov_col in covariate_columns:
            if cov_col in df_prep.columns:
                cov_series = df_prep.set_index('timestamp')[cov_col]
                cov_series = cov_series.reindex(regular_index)
                
                # Remplir les valeurs manquantes de la m√™me mani√®re
                if fill_method == 'forward':
                    cov_series = cov_series.ffill()
                elif fill_method == 'backward':
                    cov_series = cov_series.bfill()
                elif fill_method == 'interpolate':
                    cov_series = cov_series.interpolate(method='linear')
                else:
                    cov_series = cov_series.ffill().bfill()
                
                series_df[cov_col] = cov_series.values
        
        # Supprimer les lignes o√π target est toujours NaN (au d√©but si n√©cessaire)
        series_df = series_df.dropna(subset=['target']).reset_index(drop=True)
        
        result_dfs.append(series_df)
    
    # Si une seule colonne cible, retourner directement
    if len(result_dfs) == 1:
        result_df = result_dfs[0]
    else:
        # Sinon, concat√©ner avec un id diff√©rent pour chaque s√©rie
        for i, df_series in enumerate(result_dfs):
            df_series['id'] = f"{id_value}_{target_columns[i]}"
        result_df = pd.concat(result_dfs, ignore_index=True)
    
    # V√©rifier que la fr√©quence est bien r√©guli√®re
    if len(result_df) > 1:
        inferred_freq = pd.infer_freq(result_df['timestamp'].unique())
        if inferred_freq is None:
            print("‚ö†Ô∏è  Attention: La s√©rie finale n'a pas une fr√©quence r√©guli√®re d√©tectable")
        else:
            print(f"‚úì Fr√©quence finale v√©rifi√©e: {inferred_freq}")
    
    return result_df, target_columns, covariate_columns

print("‚úì Fonction de pr√©paration cr√©√©e")


In [None]:
# Exemple 1: Pr√©parer le dataset pour une seule colonne cible
# Remplacez 'gdp' par la colonne que vous souhaitez pr√©dire

print("=== EXEMPLE 1: PR√âDICTION UNIVARI√âE ===\n")

# Choisir une colonne cible (exemple: 'gdp')
# Vous pouvez changer cette valeur selon vos besoins
target_column = 'gdp'  # Changez selon votre besoin

# Pr√©parer les donn√©es
try:
    context_df, targets, covariates = prepare_data_for_chronos2(
        df=df,
        date_column='date',
        target_columns=target_column,  # Pr√©dire une seule colonne
        id_value='ecb_data',
        freq=None  # Sera inf√©r√© automatiquement
    )
    
    print(f"‚úì Dataset pr√©par√©:")
    print(f"  - Colonne cible: {target_column}")
    print(f"  - Covariables: {covariates[:5] if len(covariates) > 5 else covariates}...")
    print(f"  - Nombre de lignes: {len(context_df)}")
    print(f"  - P√©riode: {context_df['timestamp'].min()} √† {context_df['timestamp'].max()}\n")
    
    # Afficher un aper√ßu
    print("Aper√ßu des donn√©es pr√©par√©es:")
    print(context_df.head(10))
    print(f"\nColonnes: {context_df.columns.tolist()}")
    
except Exception as e:
    print(f"‚ùå Erreur lors de la pr√©paration: {e}")
    print(f"   Type: {type(e).__name__}")
    import traceback
    traceback.print_exc()


### üìä Inspection des donn√©es d'entr√©e du mod√®le

Avant de faire les pr√©dictions, examinons exactement ce qui est donn√© au mod√®le Chronos-2.


In [None]:
# Inspecter les donn√©es qui seront pass√©es au mod√®le
print("=== DONN√âES D'ENTR√âE DU MOD√àLE CHRONOS-2 ===\n")

if 'context_df' in globals():
    print("üìã Structure du DataFrame 'context_df' (donn√©es historiques):")
    print(f"  - Nombre de lignes: {len(context_df)}")
    print(f"  - Nombre de colonnes: {len(context_df.columns)}")
    print(f"  - Colonnes: {context_df.columns.tolist()}\n")
    
    print("üìÖ Informations temporelles:")
    print(f"  - Premi√®re date: {context_df['timestamp'].min()}")
    print(f"  - Derni√®re date: {context_df['timestamp'].max()}")
    print(f"  - P√©riode couverte: {(context_df['timestamp'].max() - context_df['timestamp'].min()).days} jours")
    
    # V√©rifier la fr√©quence
    freq = pd.infer_freq(context_df['timestamp'].sort_values())
    if freq:
        print(f"  - Fr√©quence d√©tect√©e: {freq}")
    else:
        print(f"  - ‚ö†Ô∏è  Fr√©quence non d√©tect√©e automatiquement")
    print()
    
    print("üéØ Colonne cible (target):")
    target_col = 'target'
    if target_col in context_df.columns:
        print(f"  - Nom: '{target_col}'")
        print(f"  - Type: {context_df[target_col].dtype}")
        print(f"  - Valeurs non-nulles: {context_df[target_col].notna().sum()} / {len(context_df)}")
        print(f"  - Valeurs manquantes: {context_df[target_col].isna().sum()}")
        print(f"  - Min: {context_df[target_col].min():.4f}")
        print(f"  - Max: {context_df[target_col].max():.4f}")
        print(f"  - Moyenne: {context_df[target_col].mean():.4f}")
    print()
    
    print("üìä Aper√ßu des donn√©es (premi√®res 10 lignes):")
    print(context_df.head(10))
    print()
    
    print("üìä Aper√ßu des donn√©es (derni√®res 10 lignes):")
    print(context_df.tail(10))
    print()
    
    # Identifier les covariables (colonnes autres que id, timestamp, target)
    covariate_cols = [col for col in context_df.columns 
                     if col not in ['id', 'timestamp', 'target']]
    
    if covariate_cols:
        print(f"üìà Covariables d√©tect√©es ({len(covariate_cols)}):")
        for col in covariate_cols:
            non_null = context_df[col].notna().sum()
            print(f"  - '{col}': {non_null}/{len(context_df)} valeurs non-nulles")
        print()
    else:
        print("üìà Covariables: Aucune (pr√©diction univari√©e pure)\n")
    
    print("="*70)
    print("\nüí° R√âSUM√â: Ce qui est donn√© au mod√®le Chronos-2:")
    print(f"  1. ‚úÖ {len(context_df)} observations historiques")
    print(f"  2. ‚úÖ Colonne 'id': identifie la s√©rie temporelle")
    print(f"  3. ‚úÖ Colonne 'timestamp': dates r√©guli√®res")
    print(f"  4. ‚úÖ Colonne 'target': valeurs historiques √† pr√©dire")
    if covariate_cols:
        print(f"  5. ‚úÖ {len(covariate_cols)} covariables: {', '.join(covariate_cols[:3])}{'...' if len(covariate_cols) > 3 else ''}")
    
    # Calculer la longueur de pr√©diction
    pred_len = min(1024, max(12, len(context_df) // 10))
    print(f"\n   Le mod√®le va utiliser ces donn√©es historiques pour pr√©dire")
    print(f"   les {pred_len} prochaines valeurs.\n")
    
else:
    print("‚ö†Ô∏è  Le DataFrame 'context_df' n'existe pas encore.")
    print("   Ex√©cutez d'abord la cellule 'Exemple 1' pour pr√©parer les donn√©es.\n")


In [None]:
# Visualiser les donn√©es d'entr√©e du mod√®le
import matplotlib.pyplot as plt

print("=== VISUALISATION DES DONN√âES D'ENTR√âE ===\n")

if 'context_df' in globals():
    try:
        fig, ax = plt.subplots(figsize=(14, 6))
        
        # Tracer la s√©rie temporelle historique
        ax.plot(context_df['timestamp'], context_df['target'], 
                linewidth=2, color='#2E86AB', marker='o', markersize=3, 
                label='Donn√©es historiques (entr√©e du mod√®le)')
        
        # Marquer le dernier point (point de d√©part pour les pr√©dictions)
        last_idx = len(context_df) - 1
        ax.plot(context_df['timestamp'].iloc[last_idx], context_df['target'].iloc[last_idx],
                marker='*', markersize=15, color='red', 
                label='Dernier point (d√©but des pr√©dictions)')
        
        ax.set_xlabel('Date', fontsize=12, fontweight='bold')
        ax.set_ylabel('Valeur (target)', fontsize=12, fontweight='bold')
        ax.set_title('Donn√©es historiques fournies au mod√®le Chronos-2', 
                     fontsize=14, fontweight='bold')
        ax.legend(loc='best', fontsize=10)
        ax.grid(True, alpha=0.3, linestyle='--')
        
        plt.xticks(rotation=45)
        plt.tight_layout()
        plt.show()
        
        print("‚úì Graphique des donn√©es d'entr√©e cr√©√©")
        print(f"\nüìä Statistiques de la s√©rie:")
        print(f"   - Nombre de points: {len(context_df)}")
        print(f"   - P√©riode: {context_df['timestamp'].min().strftime('%Y-%m-%d')} √† {context_df['timestamp'].max().strftime('%Y-%m-%d')}")
        print(f"   - Valeur min: {context_df['target'].min():.4f}")
        print(f"   - Valeur max: {context_df['target'].max():.4f}")
        print(f"   - Valeur moyenne: {context_df['target'].mean():.4f}")
        print(f"   - √âcart-type: {context_df['target'].std():.4f}\n")
        
    except Exception as e:
        print(f"‚ùå Erreur lors de la visualisation: {e}")
        import traceback
        traceback.print_exc()
else:
    print("‚ö†Ô∏è  Le DataFrame 'context_df' n'existe pas encore.")
    print("   Ex√©cutez d'abord la cellule 'Exemple 1' pour pr√©parer les donn√©es.\n")


In [None]:
# Exemple 2: Faire des pr√©dictions avec votre dataset
print("=== EXEMPLE 2: INF√âRENCE AVEC VOTRE DATASET ===\n")

# S'assurer que le pipeline est charg√©
if 'pipeline' not in globals():
    print("Chargement du pipeline Chronos-2...")
    from chronos import Chronos2Pipeline
    pipeline = Chronos2Pipeline.from_pretrained(
        "amazon/chronos-2",
        device_map="mps"  # ou "cuda" pour GPU NVIDIA, "cpu" pour CPU
    )
    print("‚úì Pipeline charg√©\n")

# Faire des pr√©dictions
try:
    # D√©terminer la longueur de pr√©diction (par exemple, 10% de la longueur du contexte)
    # Limiter √† 1024 car Chronos-2 recommande prediction_length <= 1024
    prediction_length = min(1024, max(12, len(context_df) // 10))
    print(f"Longueur de pr√©diction: {prediction_length} pas de temps")
    if len(context_df) // 10 > 1024:
        print(f"‚ö†Ô∏è  Note: La longueur calcul√©e ({len(context_df) // 10}) a √©t√© limit√©e √† 1024 (recommandation Chronos-2)\n")
    else:
        print()
    
    predictions = pipeline.predict_df(
        context_df,
        prediction_length=prediction_length,
        quantile_levels=[0.05, 0.25, 0.5, 0.75, 0.95],  # Quantiles pour intervalles de confiance
        id_column="id",
        timestamp_column="timestamp",
        target="target"
    )
    
    print(f"‚úì Pr√©dictions g√©n√©r√©es avec succ√®s!")
    print(f"  - Shape: {predictions.shape}")
    print(f"  - Colonnes: {predictions.columns.tolist()}\n")
    
    print("Aper√ßu des pr√©dictions:")
    print(predictions.head(10))
    
except Exception as e:
    print(f"‚ùå Erreur lors de l'inf√©rence: {e}")
    print(f"   Type: {type(e).__name__}")
    import traceback
    traceback.print_exc()


In [None]:
# Visualiser les pr√©dictions avec les donn√©es historiques
import matplotlib.pyplot as plt

print("=== VISUALISATION DES PR√âDICTIONS ===\n")

try:
    fig, ax = plt.subplots(figsize=(16, 8))
    
    # Filtrer les donn√©es pour la s√©rie sp√©cifique
    series_id = context_df['id'].iloc[0]
    hist_data = context_df[context_df['id'] == series_id].copy()
    pred_data = predictions[predictions['id'] == series_id].copy()
    
    # Afficher les donn√©es historiques
    ax.plot(hist_data['timestamp'], hist_data['target'], 
            label='Donn√©es historiques', linewidth=2.5, color='#2E86AB', marker='o', markersize=3)
    
    # Afficher la m√©diane (quantile 0.5)
    if '0.5' in pred_data.columns:
        ax.plot(pred_data['timestamp'], pred_data['0.5'], 
                label='Pr√©diction (m√©diane)', linewidth=2.5, color='#A23B72', 
                linestyle='--', marker='s', markersize=4)
    
    # Afficher les intervalles de confiance
    if '0.05' in pred_data.columns and '0.95' in pred_data.columns:
        ax.fill_between(pred_data['timestamp'], 
                         pred_data['0.05'], 
                         pred_data['0.95'],
                         alpha=0.2, color='red', label='IC 90%')
    
    if '0.25' in pred_data.columns and '0.75' in pred_data.columns:
        ax.fill_between(pred_data['timestamp'], 
                         pred_data['0.25'], 
                         pred_data['0.75'],
                         alpha=0.3, color='red', label='IC 50%')
    
    # Ligne verticale pour s√©parer historique et pr√©dictions
    if len(hist_data) > 0:
        ax.axvline(x=hist_data['timestamp'].iloc[-1], color='gray', 
                   linestyle=':', linewidth=2, label='D√©but des pr√©dictions')
    
    ax.set_xlabel('Date', fontsize=12, fontweight='bold')
    ax.set_ylabel(f'Valeur ({target_column})', fontsize=12, fontweight='bold')
    ax.set_title(f'Pr√©visions Chronos-2 pour {target_column}', fontsize=14, fontweight='bold')
    ax.legend(loc='best', fontsize=10)
    ax.grid(True, alpha=0.3, linestyle='--')
    
    plt.xticks(rotation=45)
    plt.tight_layout()
    plt.show()
    
    print("‚úì Visualisation cr√©√©e")
    
except Exception as e:
    print(f"‚ùå Erreur lors de la visualisation: {e}")
    import traceback
    traceback.print_exc()


In [None]:
# Exemple 3: Pr√©dire plusieurs colonnes simultan√©ment (multivari√©)
print("=== EXEMPLE 3: PR√âDICTION MULTIVARI√âE ===\n")

# Choisir plusieurs colonnes √† pr√©dire
# Exemple: pr√©dire gdp, investment, et production_kg simultan√©ment
target_columns_multivariate = ['gdp', 'investment', 'production_kg']  # Changez selon vos besoins

# Filtrer pour ne garder que les colonnes qui existent
target_columns_multivariate = [col for col in target_columns_multivariate if col in df.columns]

if len(target_columns_multivariate) > 0:
    print(f"Colonnes s√©lectionn√©es pour pr√©diction multivari√©e: {target_columns_multivariate}\n")
    
    try:
        # Pr√©parer les donn√©es pour chaque colonne
        all_context_dfs = []
        
        for target_col in target_columns_multivariate:
            context_df_multi, _, _ = prepare_data_for_chronos2(
                df=df,
                date_column='date',
                target_columns=target_col,
                id_value=f'ecb_{target_col}',
                freq=None
            )
            all_context_dfs.append(context_df_multi)
        
        # Concat√©ner tous les DataFrames
        context_df_multi = pd.concat(all_context_dfs, ignore_index=True)
        
        print(f"‚úì Dataset multivari√© pr√©par√©:")
        print(f"  - Nombre de s√©ries: {len(target_columns_multivariate)}")
        print(f"  - Nombre total de lignes: {len(context_df_multi)}")
        print(f"  - IDs uniques: {context_df_multi['id'].unique().tolist()}\n")
        
        # Faire des pr√©dictions pour toutes les s√©ries
        # Limiter √† 1024 car Chronos-2 recommande prediction_length <= 1024
        prediction_length_multi = min(1024, max(12, len(context_df_multi) // (10 * len(target_columns_multivariate))))
        
        predictions_multi = pipeline.predict_df(
            context_df_multi,
            prediction_length=prediction_length_multi,
            quantile_levels=[0.1, 0.5, 0.9],
            id_column="id",
            timestamp_column="timestamp",
            target="target"
        )
        
        print(f"‚úì Pr√©dictions multivari√©es g√©n√©r√©es!")
        print(f"  - Shape: {predictions_multi.shape}")
        print(f"\nAper√ßu:")
        print(predictions_multi.head(15))
        
    except Exception as e:
        print(f"‚ùå Erreur: {e}")
        import traceback
        traceback.print_exc()
else:
    print("‚ö†Ô∏è  Aucune colonne valide s√©lectionn√©e pour la pr√©diction multivari√©e")


In [None]:
# Exemple 4: Utiliser des covariables pour am√©liorer les pr√©dictions
print("=== EXEMPLE 4: PR√âDICTION AVEC COVARIABLES ===\n")

# Dans cet exemple, on pr√©dit une colonne cible en utilisant d'autres colonnes comme covariables
target_with_covariates = 'gdp'  # Colonne √† pr√©dire

# Choisir des covariables (colonnes qui peuvent aider √† pr√©dire la cible)
# Exemple: utiliser investment, production_kg, etc. comme covariables
potential_covariates = ['investment', 'production_kg', 'capacityutil_kg', 'confidence_kg']
covariates_to_use = [col for col in potential_covariates if col in df.columns and col != target_with_covariates]

print(f"Colonne cible: {target_with_covariates}")
print(f"Covariables s√©lectionn√©es: {covariates_to_use}\n")

try:
    # Pr√©parer les donn√©es avec covariables
    context_df_cov, _, _ = prepare_data_for_chronos2(
        df=df,
        date_column='date',
        target_columns=target_with_covariates,
        covariate_columns=covariates_to_use,
        id_value='ecb_with_covariates',
        freq=None
    )
    
    print(f"‚úì Dataset avec covariables pr√©par√©:")
    print(f"  - Colonnes: {context_df_cov.columns.tolist()}")
    print(f"  - Nombre de lignes: {len(context_df_cov)}\n")
    
    # Afficher un aper√ßu
    print("Aper√ßu des donn√©es avec covariables:")
    print(context_df_cov.head(10))
    
    # Note: Pour utiliser les covariables dans les pr√©dictions futures,
    # vous devrez fournir un future_df avec les valeurs futures des covariables
    # Pour l'instant, Chronos-2 utilisera les valeurs pass√©es des covariables
    
    # Limiter √† 1024 car Chronos-2 recommande prediction_length <= 1024
    prediction_length_cov = min(1024, max(12, len(context_df_cov) // 10))
    
    predictions_cov = pipeline.predict_df(
        context_df_cov,
        prediction_length=prediction_length_cov,
        quantile_levels=[0.1, 0.5, 0.9],
        id_column="id",
        timestamp_column="timestamp",
        target="target"
    )
    
    print(f"\n‚úì Pr√©dictions avec covariables g√©n√©r√©es!")
    print(f"  - Shape: {predictions_cov.shape}")
    print(f"\nAper√ßu des pr√©dictions:")
    print(predictions_cov.head(10))
    
except Exception as e:
    print(f"‚ùå Erreur: {e}")
    import traceback
    traceback.print_exc()

### üìù Notes importantes pour votre dataset

1. **Format des donn√©es**: 
   - La colonne `date` doit √™tre convertible en datetime
   - Les colonnes num√©riques ne doivent pas avoir trop de valeurs manquantes

2. **Choix de la colonne cible**:
   - Remplacez `'gdp'` dans les exemples par la colonne que vous souhaitez pr√©dire
   - Vous pouvez pr√©dire plusieurs colonnes en les listant dans `target_columns`

3. **Covariables**:
   - Les autres colonnes num√©riques peuvent √™tre utilis√©es comme covariables
   - Chronos-2 utilisera automatiquement les valeurs pass√©es des covariables

4. **Longueur de pr√©diction**:
   - Ajustez `prediction_length` selon votre horizon de pr√©vision souhait√©
   - G√©n√©ralement: 10-20% de la longueur du contexte est raisonnable

5. **Valeurs manquantes**:
   - Chronos-2 peut g√©rer certaines valeurs manquantes, mais il est recommand√©
     de les traiter avant l'inf√©rence (interpolation, forward fill, etc.)
