# Optimisation PhysAE avec validation et r√©utilisation des donn√©es

Ce carnet illustre un flux complet pour contr√¥ler la coh√©rence des fichiers YAML, pr√©parer un environnement d'entra√Ænement r√©utilisable, effectuer un entra√Ænement rapide sur les phases A et B2 puis lancer une recherche d'hyperparam√®tres avec Optuna.

> ‚öôÔ∏è Les exemples utilisent volontairement de petits jeux de donn√©es et quelques √©poques pour rester rapides. Adaptez les param√®tres (tailles, nombres d'√©poques, etc.) selon vos besoins.

In [None]:
from physae.config_loader import load_data_config, load_stage_config
from physae.validation import validate_data_config, validate_stage_config
from physae.factory import prepare_training_environment
from physae.training import train_stage_A, train_stage_B2
from physae.optimization import optimise_stage


In [None]:
# V√©rification rapide des fichiers YAML
data_cfg = load_data_config()
data_report = validate_data_config(data_cfg, name="configuration donn√©es")
print(data_report)
for stage in ("A", "B1", "B2"):
    report = validate_stage_config(load_stage_config(stage), name=f"stage {stage}")
    print(report)


In [None]:
# Construction d'un environnement r√©utilisable avec un jeu r√©duit pour des essais rapides
data_overrides = {
    'n_train': 256,
    'n_val': 64,
    'batch_size': 8,
}
env = prepare_training_environment(config_overrides=data_overrides)
env.summary()


In [None]:
# Entra√Ænement rapide de la phase A
model = env.spawn_model()
train_stage_A(
    model,
    env.train_loader,
    env.val_loader,
    config_overrides={'epochs': 5},
    enable_progress_bar=True,
)


In [None]:
# Phase B2 sur le m√™me environnement (les poids de la phase A sont r√©utilis√©s)
train_stage_B2(
    model,
    env.train_loader,
    env.val_loader,
    config_overrides={'epochs': 5},
    enable_progress_bar=True,
)


In [None]:
# Recherche d'hyperparam√®tres Optuna sur la phase A
study = optimise_stage(
    'A',
    n_trials=3,
    metric='val_loss',
    data_overrides=data_overrides,
    stage_overrides={'epochs': 5},
    reuse_dataloaders=True,
    show_progress_bar=True,
)
print('Meilleurs hyperparam√®tres:', study.best_params)
print('Score associ√©:', study.best_value)
for trial in study.trials:
    metrics = trial.user_attrs.get('metrics', {})
    val_loss = metrics.get('val_loss')
    print(f"Trial {trial.number}: val_loss={val_loss} params={trial.params}")


> üí° Gr√¢ce √† `prepare_training_environment` les DataLoader sont partag√©s entre les diff√©rentes √©tapes et entre les essais Optuna, ce qui r√©duit nettement le co√ªt de pr√©paration. Utilisez `env.spawn_model()` pour obtenir un nouveau r√©seau lorsque vous souhaitez recommencer un entra√Ænement depuis z√©ro.