# 03B — Búsqueda de hiperparámetros con Optuna (Continual Learning)

Este cuaderno automatiza la **optimización de hiperparámetros (HPO)** para métodos de aprendizaje continuo:
- **naive** (baseline, sin HPs),
- **ewc** (Elastic Weight Consolidation),
- **rehearsal** (rejuego con buffer),
- **rehearsal+ewc** (combinación).

Se apoya en:
- `configs/presets.yaml` (misma configuración que el resto de notebooks),
- `build_make_loader_fn` (carga CSV+runtime o H5 offline),
- `run_continual` (entrena & evalúa y guarda métricas).

---

### Métrica objetivo (minimizar)
\[
\textbf{Objetivo} = \text{MAE}_{\text{tarea final}} + \alpha \cdot \max(0, \text{OlvidoRelativo} \%)
\]
- **MAE_tarea final**: error en la **última** tarea (queremos aprender bien lo nuevo).
- **OlvidoRelativo %**: cuánto **empeora** la primera tarea tras aprender la segunda.
- **α**: peso del olvido (por defecto 0.5). Sube α si quieres penalizar más el olvido.

## ✅ Prerrequisitos
- `pip install optuna`
- Datos preparados (`tasks.json` o `tasks_balanced.json`).
- Idealmente H5 offline si `use_offline_spikes: true` en el preset.

<a id="toc"></a>

## 🧭 Índice
- [1) Imports y setup](#sec-01)
- [2) Carga de preset y construcción de modelo/transform](#sec-02)
- [3) Tareas y factory de loaders](#sec-03)
- [4) Métricas y objetivo para Optuna](#sec-04)
- [5) Espacios de búsqueda (por método)](#sec-05)
- [6) Estudio Optuna — un método concreto](#sec-06)
- [7) Estudio Optuna conjunto (elige método + HPs)](#sec-07)
- [8) Re-entrena con los mejores hiperparámetros](#sec-08)
- [9) Resumen rápido de runs (tabla)](#sec-09)


---

> **Consejo**: empieza con el preset `fast` y `N_TRIALS` pequeño; si todo va bien, sube `N_TRIALS` y/o las `epochs`.


<a id="sec-01"></a>

## 1) Imports y setup de entorno

- Limitamos hilos BLAS (`OMP`, `MKL`, `OPENBLAS`) para evitar sobrecarga de CPU.
- Configuramos **CUDA/TF32** para acelerar en GPUs NVIDIA.
- Insertamos la **raíz del repo** en `sys.path` para importar módulos locales.
- Comprobamos el **dispositivo** (`cuda`/`cpu`).

> Si notas que el equipo va justo de CPU, baja `torch.set_num_threads(4)` a `2`.

[↑ Volver al índice](#toc)

In [1]:
# Limitar threads BLAS (opcional)
import os
os.environ["OMP_NUM_THREADS"] = "1"
os.environ["MKL_NUM_THREADS"] = "1"
os.environ["OPENBLAS_NUM_THREADS"] = "1"

from pathlib import Path
import sys, json, copy, time
import torch
import optuna

# Raíz del repo y sys.path
ROOT = Path.cwd().parents[0] if (Path.cwd().name == "notebooks") else Path.cwd()
if str(ROOT) not in sys.path:
    sys.path.append(str(ROOT))

# Proyecto
from src.utils import load_preset, build_make_loader_fn
from src.datasets import ImageTransform, AugmentConfig
from src.models import build_model
from src.runner import run_continual

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
torch.set_num_threads(4)
torch.backends.cudnn.benchmark = True
torch.backends.cuda.matmul.allow_tf32 = True
torch.backends.cudnn.allow_tf32 = True
torch.set_float32_matmul_precision("high")

print("Device:", device)

  from .autonotebook import tqdm as notebook_tqdm


Device: cuda


<a id="sec-02"></a>

## 2) Carga de preset y construcción de modelo/transform

- `PRESET` se carga desde `configs/presets.yaml`.
- Extraemos:
  - **Modelo** y el **transform** de imagen (`ImageTransform`) acorde a `img_w`, `img_h`, `to_gray`.
  - Parámetros de **codificación temporal** (`encoder`, `T`, `gain`) y **semilla**.
  - Flags de **carga de datos**: `use_offline_spikes` (H5), `encode_runtime` (codifica en GPU), `use_offline_balanced`.
  - Parámetros del **DataLoader** (workers, prefetch, pin_memory, etc.) y **balanceo online**.

- `make_model_fn(tfm)` devuelve el modelo (por ejemplo, `pilotnet_snn` con `beta/threshold`).

> Mantener aquí la **fuente de la verdad** del experimento (preset) ahorra inconsistencias respecto a otros notebooks.

[↑ Volver al índice](#toc)

In [2]:
PRESET = "fast"  # fast | std | accurate
CFG = load_preset(ROOT / "configs" / "presets.yaml", PRESET)

# Modelo / tfm
MODEL_NAME = CFG["model"]["name"]
tfm = ImageTransform(
    CFG["model"]["img_w"], CFG["model"]["img_h"],
    to_gray=bool(CFG["model"]["to_gray"]),
    crop_top=None
)

# Datos / codificación temporal
ENCODER  = CFG["data"]["encoder"]
T        = int(CFG["data"]["T"])
GAIN     = float(CFG["data"]["gain"])
SEED     = int(CFG["data"]["seed"])

# Flags & loader
USE_OFFLINE_SPIKES   = bool(CFG["data"]["use_offline_spikes"])
USE_OFFLINE_BALANCED = bool(CFG["data"]["use_offline_balanced"])
RUNTIME_ENCODE       = bool(CFG["data"]["encode_runtime"])

NUM_WORKERS   = int(CFG["data"]["num_workers"])
PREFETCH      = CFG["data"]["prefetch_factor"]
PIN_MEMORY    = bool(CFG["data"]["pin_memory"])
PERSISTENT    = bool(CFG["data"]["persistent_workers"])
AUG_CFG       = AugmentConfig(**CFG["data"]["aug_train"]) if CFG["data"]["aug_train"] else None
USE_ONLINE_BAL = bool(CFG["data"]["balance_online"])\
                if "balance_online" in CFG["data"] else False
BAL_BINS      = int(CFG["data"].get("balance_bins", 21))
BAL_EPS       = float(CFG["data"].get("balance_smooth_eps", 0.001))

print(f"[PRESET={PRESET}] model={MODEL_NAME} {tfm.w}x{tfm.h} gray={tfm.to_gray}")
print(f"[DATA] encoder={ENCODER} T={T} gain={GAIN} seed={SEED}")
print(f"[LOADER] workers={NUM_WORKERS} prefetch={PREFETCH} pin={PIN_MEMORY} persistent={PERSISTENT}")
print(f"[BALANCE] offline={USE_OFFLINE_BALANCED} online={USE_ONLINE_BAL} bins={BAL_BINS}")
print(f"[RUNTIME_ENCODE] {RUNTIME_ENCODE} | [OFFLINE_SPIKES] {USE_OFFLINE_SPIKES}")

def make_model_fn(tfm):
    # kwargs específicos de pilotnet_snn; ignorados para otros
    return build_model(MODEL_NAME, tfm, beta=0.9, threshold=0.5)

[PRESET=fast] model=pilotnet_snn 200x66 gray=True
[DATA] encoder=rate T=10 gain=0.5 seed=42
[LOADER] workers=8 prefetch=2 pin=True persistent=True
[BALANCE] offline=False online=False bins=21
[RUNTIME_ENCODE] False | [OFFLINE_SPIKES] True


<a id="sec-03"></a>

## 3) Tareas y factory de loaders

- Leemos `tasks.json` o `tasks_balanced.json` desde `data/processed/`.
- Cada tarea apunta a CSV/H5 de `train/val/test`.
- Si `use_offline_spikes: true`, `build_make_loader_fn` **elige H5**; si no, usa **CSV + runtime encode** en GPU.

El **wrapper** `make_loader_fn(...)` simplemente pasa argumentos al factory real; así el `runner` puede inyectar kwargs (augment, balanceo online, etc.) sin reescribir nada aquí.

> Si activas **offline balanceado**, el **train** debería ser `train_balanced.csv` o el H5 derivado. El notebook advierte si no coincide.

[↑ Volver al índice](#toc)

In [3]:
# Leer tasks.json / tasks_balanced.json
PROC = ROOT / "data" / "processed"
TASKS_FILE = PROC / ("tasks_balanced.json" if USE_OFFLINE_BALANCED else "tasks.json")
with open(TASKS_FILE, "r", encoding="utf-8") as f:
    tasks_json = json.load(f)

task_list = [{"name": n, "paths": tasks_json["splits"][n]} for n in tasks_json["tasks_order"]]
print("Tareas y TRAIN CSV/H5 a usar:")
for t in task_list:
    from pathlib import Path as _P
    print(f" - {t['name']}: {_P(t['paths']['train']).name}")

# Guardarraíl si activas OFFLINE balanceado
if USE_OFFLINE_BALANCED:
    from pathlib import Path as _P
    for t in task_list:
        train_path = _P(t["paths"]["train"])
        if train_path.name != "train_balanced.csv" and not train_path.name.startswith("train_rate_"):
            print(f"[WARN] {t['name']}: esperaba 'train_balanced.csv' u H5 equivalente; encontrado {train_path.name}")

# Factory de loaders
_raw_make_loader_fn = build_make_loader_fn(
    root=ROOT,
    use_offline_spikes=USE_OFFLINE_SPIKES,
    runtime_encode=RUNTIME_ENCODE,
)

def make_loader_fn(task, batch_size, encoder, T, gain, tfm, seed, **dl_kwargs):
    """Wrapper pass-through: el runner añade dl_kwargs; aquí solo los propagamos."""
    return _raw_make_loader_fn(
        task=task, batch_size=batch_size, encoder=encoder, T=T, gain=gain, tfm=tfm, seed=seed,
        **dl_kwargs
    )
print("make_loader_fn listo.")

Tareas y TRAIN CSV/H5 a usar:
 - circuito1: train.csv
 - circuito2: train.csv
make_loader_fn listo.


<a id="sec-04"></a>

## 4) Métricas y objetivo para Optuna

**Cómo se calcula:**
1. Cargamos `continual_results.json` del run.
2. Detectamos **primera** y **última** tarea (heurística simple: la última no tiene claves `after_*`).
3. Extraemos:
   - `c1_mae`: MAE en la **primera** tarea en su propio test.
   - `c1_after_c2_mae`: MAE de la **primera** *después* de aprender la segunda (olvido).
   - `c2_mae`: MAE de la **última** tarea.
4. **Olvido relativo %** = \((c1\_after\_c2 - c1\_mae) / c1\_mae \times 100\).

**Objetivo** = `c2_mae + ALPHA_FORGET * max(0, olvido_relativo_%)`  
- **Minimizar** este valor favorece: buen rendimiento en la **tarea final** y **poco olvido** de la primera.
- Ajusta `ALPHA_FORGET` si quieres **penalizar más** el olvido (sube α) o **priorizar** la tarea nueva (baja α).

> Si el JSON no existe o faltan métricas, devolvemos `inf` para que ese trial no gane.

[↑ Volver al índice](#toc)

In [4]:
import math
from copy import deepcopy

ALPHA_FORGET = 0.5   # peso del olvido relativo (%) en la métrica objetivo

def _load_results(out_dir: Path) -> dict:
    p = Path(out_dir) / "continual_results.json"
    if not p.exists():
        return {}
    return json.loads(p.read_text(encoding="utf-8"))

def _pick_first_last_task(results: dict):
    # heurística: primera = la que tenga claves 'after_*' (porque fue evaluada después),
    # última = la que NO tenga 'after_*'
    if not results:
        return None, None
    task_names = list(results.keys())
    def is_last(d: dict) -> bool:
        return not any(k.startswith("after_") for k in d.keys())

    first_task = None
    last_task = None
    for tn in task_names:
        if is_last(results[tn]):
            last_task = tn
        else:
            first_task = tn

    if first_task is None or last_task is None:
        # fallback: orden alfabético
        task_names_sorted = sorted(task_names)
        first_task = task_names_sorted[0]
        last_task  = task_names_sorted[-1]
    return first_task, last_task

def extract_metrics(results: dict):
    """Devuelve dict con:
       - c1_mae, c1_after_c2_mae, forget_rel_%
       - c2_mae
    """
    if not results:
        return {"c1_mae": math.nan, "c1_after_c2_mae": math.nan, "forget_rel_%": math.nan, "c2_mae": math.nan}

    c1, c2 = _pick_first_last_task(results)
    if c1 is None or c2 is None:
        return {"c1_mae": math.nan, "c1_after_c2_mae": math.nan, "forget_rel_%": math.nan, "c2_mae": math.nan}

    c1_test_mae = float(results[c1].get("test_mae", math.nan))
    c2_test_mae = float(results[c2].get("test_mae", math.nan))
    c1_after_c2 = float(results[c1].get(f"after_{c2}_mae", math.nan))

    forgetting_abs = c1_after_c2 - c1_test_mae
    forgetting_rel = (forgetting_abs / c1_test_mae * 100.0) if (c1_test_mae == c1_test_mae and c1_test_mae != 0.0) else math.nan

    return {
        "c1_mae": c1_test_mae,
        "c1_after_c2_mae": c1_after_c2,
        "forget_rel_%": forgetting_rel,
        "c2_mae": c2_test_mae,
    }

def objective_value(metrics: dict, alpha: float = ALPHA_FORGET) -> float:
    """Menor es mejor. Combina rendimiento en la última tarea y olvido relativo en la primera."""
    m2 = metrics.get("c2_mae", math.nan)
    f  = metrics.get("forget_rel_%", math.nan)
    if math.isnan(m2) or math.isnan(f):
        return float("inf")
    return float(m2 + alpha * max(0.0, f))

<a id="sec-05"></a>

## 5) Espacios de búsqueda (por método)

Definimos qué hiperparámetros explora **Optuna** en cada método:

- **ewc**:
  - `lam` (*lambda*): [3e8, 2e9] (log-uniform). Penalización de estabilidad (evita olvidar).
  - `fisher_batches`: [200, 1200]. Cuánta info de Fisher acumulamos (coste ↑).

- **rehearsal**:
  - `buffer_size`: [1000, 8000]. Tamaño de memoria de rejuego.
  - `replay_ratio`: [0.05, 0.4]. Fracción de muestras de memoria por minibatch.

- **rehearsal+ewc**: combina ambos sets.

- **naive**: sin hiperparámetros (sirve como línea base).

> Rango amplio = más tiempo pero más opciones. Ajusta rangos cuando tengas intuición.

[↑ Volver al índice](#toc)

In [5]:
def suggest_params_for_method(trial: optuna.Trial, method: str) -> dict:
    method = method.lower()
    if method == "ewc":
        lam = trial.suggest_float("lam", 3e8, 2e9, log=True)
        fisher_batches = trial.suggest_int("fisher_batches", 200, 1200, step=100)
        return {"lam": lam, "fisher_batches": fisher_batches}
    elif method == "rehearsal":
        buffer_size  = trial.suggest_int("buffer_size", 1000, 8000, step=1000)
        replay_ratio = trial.suggest_float("replay_ratio", 0.05, 0.4, step=0.05)
        return {"buffer_size": buffer_size, "replay_ratio": replay_ratio}
    elif method == "rehearsal+ewc":
        buffer_size  = trial.suggest_int("buffer_size", 1000, 8000, step=1000)
        replay_ratio = trial.suggest_float("replay_ratio", 0.05, 0.4, step=0.05)
        lam = trial.suggest_float("lam", 3e8, 2e9, log=True)
        fisher_batches = trial.suggest_int("fisher_batches", 200, 1200, step=100)
        return {"buffer_size": buffer_size, "replay_ratio": replay_ratio, "lam": lam, "fisher_batches": fisher_batches}
    else:  # naive (sin HPs)
        return {}

<a id="sec-06"></a>

## 6) Estudio Optuna — un método concreto

- **Study**: contenedor de la búsqueda.
- **Trial**: una configuración (punto) en el espacio de HPs.
- **Objective**: función que entrena/evalúa y devuelve un **valor a minimizar**.

Parámetros clave:
- `METHOD_TO_OPTIMIZE`: `"ewc"`, `"rehearsal"`, `"rehearsal+ewc"` o `"naive"`.
- `N_TRIALS`: nº de configuraciones a probar.
- `HPO_EPOCHS`: si no es `None`, **sobrescribe** las `epochs` del preset **solo durante HPO** (acelera la búsqueda). Luego reentrenas a tope en la Sección 8.

**Qué hace cada trial:**
1. Sugerir HPs (`suggest_*`).
2. Construir `cfg` con esos HPs (y `epochs` reducidas si `HPO_EPOCHS`).
3. Ejecutar `run_continual(...)`.
4. Leer `continual_results.json`, calcular métrica objetivo y devolvérsela a Optuna.

**Salida:**
- `study.best_params`: mejores HPs.
- `study.best_value`: valor objetivo mínimo.
- `study.best_trial.user_attrs`: metadatos (ruta del experimento, métricas) que guardamos nosotros.

> **Tip:** Para runs largos añade *pruning* o una base de datos (`optuna.create_study(storage=...)`) si quieres **reanudar** búsquedas en varias sesiones.

[↑ Volver al índice](#toc)

In [6]:
# Configuración del estudio
METHOD_TO_OPTIMIZE = "ewc"   # "naive" | "ewc" | "rehearsal" | "rehearsal+ewc"
N_TRIALS = 8                 # súbelo cuando estés satisfecho con tiempos/estabilidad
HPO_EPOCHS = None            # None -> usar epochs del preset; o pon un int (ej. 3) para acelerar

def build_cfg_with_method(base_cfg: dict, method_name: str, params: dict, hpo_epochs: int|None):
    cfg = copy.deepcopy(base_cfg)
    cfg["continual"]["method"] = method_name
    cfg["continual"]["params"] = params or {}

    if hpo_epochs is not None:
        cfg["optim"]["epochs"] = int(hpo_epochs)
    return cfg

def run_one_cfg(cfg: dict) -> tuple[Path, dict, dict]:
    out_dir, res = run_continual(
        task_list=task_list,
        make_loader_fn=make_loader_fn,
        make_model_fn=make_model_fn,
        tfm=tfm,
        cfg=cfg,
        preset_name=PRESET,
        out_root=ROOT / "outputs",
        verbose=True,
    )
    # Nota: algunos runners devuelven res; aun así, leemos del JSON para robustez
    results = _load_results(out_dir) or (res if isinstance(res, dict) else {})
    return out_dir, res, results

def optuna_objective(trial: optuna.Trial):
    params = suggest_params_for_method(trial, METHOD_TO_OPTIMIZE)
    cfg_i  = build_cfg_with_method(CFG, METHOD_TO_OPTIMIZE, params, HPO_EPOCHS)
    out_dir, _, results = run_one_cfg(cfg_i)
    metrics = extract_metrics(results)
    val = objective_value(metrics, ALPHA_FORGET)
    trial.set_user_attr("out_dir", str(out_dir))
    trial.set_user_attr("metrics", metrics)
    return val

study = optuna.create_study(direction="minimize", study_name=f"HPO_{METHOD_TO_OPTIMIZE}")
study.optimize(optuna_objective, n_trials=N_TRIALS, show_progress_bar=True)

print("Best value:", study.best_value)
print("Best params:", study.best_params)
print("Best attrs:", study.best_trial.user_attrs)

[I 2025-08-25 21:02:12,348] A new study created in memory with name: HPO_ewc
  0%|          | 0/8 [00:00<?, ?it/s]


--- Tarea 1/2: circuito1 | preset=fast | method=ewc_lam_6e+08 | B=64 T=10 AMP=True | enc=rate ---





--- Tarea 2/2: circuito2 | preset=fast | method=ewc_lam_6e+08 | B=64 T=10 AMP=True | enc=rate ---


Best trial: 0. Best value: 0.247424:  12%|█▎        | 1/8 [00:51<06:01, 51.57s/it]

[I 2025-08-25 21:03:03,919] Trial 0 finished with value: 0.2474242219137164 and parameters: {'lam': 636904071.0268946, 'fisher_batches': 200}. Best is trial 0 with value: 0.2474242219137164.

--- Tarea 1/2: circuito1 | preset=fast | method=ewc_lam_8e+08 | B=64 T=10 AMP=True | enc=rate ---





--- Tarea 2/2: circuito2 | preset=fast | method=ewc_lam_8e+08 | B=64 T=10 AMP=True | enc=rate ---


Best trial: 1. Best value: 0.231704:  25%|██▌       | 2/8 [01:45<05:18, 53.04s/it]

[I 2025-08-25 21:03:57,992] Trial 1 finished with value: 0.2317043848066445 and parameters: {'lam': 776858846.9216224, 'fisher_batches': 200}. Best is trial 1 with value: 0.2317043848066445.

--- Tarea 1/2: circuito1 | preset=fast | method=ewc_lam_2e+09 | B=64 T=10 AMP=True | enc=rate ---





--- Tarea 2/2: circuito2 | preset=fast | method=ewc_lam_2e+09 | B=64 T=10 AMP=True | enc=rate ---


Best trial: 1. Best value: 0.231704:  38%|███▊      | 3/8 [02:46<04:43, 56.64s/it]

[I 2025-08-25 21:04:58,922] Trial 2 finished with value: 0.23170851655753263 and parameters: {'lam': 1910609758.0186343, 'fisher_batches': 1100}. Best is trial 1 with value: 0.2317043848066445.

--- Tarea 1/2: circuito1 | preset=fast | method=ewc_lam_2e+09 | B=64 T=10 AMP=True | enc=rate ---





--- Tarea 2/2: circuito2 | preset=fast | method=ewc_lam_2e+09 | B=64 T=10 AMP=True | enc=rate ---


Best trial: 1. Best value: 0.231704:  50%|█████     | 4/8 [03:49<03:56, 59.19s/it]

[I 2025-08-25 21:06:02,012] Trial 3 finished with value: 0.24299607820134583 and parameters: {'lam': 1542524932.2622232, 'fisher_batches': 900}. Best is trial 1 with value: 0.2317043848066445.

--- Tarea 1/2: circuito1 | preset=fast | method=ewc_lam_1e+09 | B=64 T=10 AMP=True | enc=rate ---





--- Tarea 2/2: circuito2 | preset=fast | method=ewc_lam_1e+09 | B=64 T=10 AMP=True | enc=rate ---


Best trial: 1. Best value: 0.231704:  62%|██████▎   | 5/8 [04:53<03:02, 60.72s/it]

[I 2025-08-25 21:07:05,434] Trial 4 finished with value: 0.2351206714246099 and parameters: {'lam': 1433808445.2063448, 'fisher_batches': 500}. Best is trial 1 with value: 0.2317043848066445.

--- Tarea 1/2: circuito1 | preset=fast | method=ewc_lam_1e+09 | B=64 T=10 AMP=True | enc=rate ---





--- Tarea 2/2: circuito2 | preset=fast | method=ewc_lam_1e+09 | B=64 T=10 AMP=True | enc=rate ---


Best trial: 1. Best value: 0.231704:  75%|███████▌  | 6/8 [05:55<02:02, 61.17s/it]

[I 2025-08-25 21:08:07,482] Trial 5 finished with value: 0.24938545821489738 and parameters: {'lam': 1175183383.2060442, 'fisher_batches': 800}. Best is trial 1 with value: 0.2317043848066445.

--- Tarea 1/2: circuito1 | preset=fast | method=ewc_lam_3e+08 | B=64 T=10 AMP=True | enc=rate ---





--- Tarea 2/2: circuito2 | preset=fast | method=ewc_lam_3e+08 | B=64 T=10 AMP=True | enc=rate ---


Best trial: 1. Best value: 0.231704:  88%|████████▊ | 7/8 [06:56<01:01, 61.16s/it]

[I 2025-08-25 21:09:08,628] Trial 6 finished with value: 0.23821051972319834 and parameters: {'lam': 320801412.077849, 'fisher_batches': 1200}. Best is trial 1 with value: 0.2317043848066445.

--- Tarea 1/2: circuito1 | preset=fast | method=ewc_lam_2e+09 | B=64 T=10 AMP=True | enc=rate ---





--- Tarea 2/2: circuito2 | preset=fast | method=ewc_lam_2e+09 | B=64 T=10 AMP=True | enc=rate ---


Best trial: 1. Best value: 0.231704: 100%|██████████| 8/8 [07:55<00:00, 59.47s/it]

[I 2025-08-25 21:10:08,102] Trial 7 finished with value: 0.23170798137245407 and parameters: {'lam': 1862719599.5859733, 'fisher_batches': 200}. Best is trial 1 with value: 0.2317043848066445.
Best value: 0.2317043848066445
Best params: {'lam': 776858846.9216224, 'fisher_batches': 200}
Best attrs: {'out_dir': '/home/cesar/proyectos/TFM_SNN/outputs/continual_fast_ewc_lam_8e+08_lam_8e+08_rate_model-PilotNetSNN_66x200_gray_seed_42', 'metrics': {'c1_mae': 0.17073977488271364, 'c1_after_c2_mae': 0.17072396584782734, 'forget_rel_%': -0.009259140055182528, 'c2_mae': 0.2317043848066445}}





<a id="sec-07"></a>

## 7) Estudio Optuna conjunto (elige método + HPs)

Si `RUN_JOINT=True`, el **trial** también elige el **método**:
- `method ∈ {naive, ewc, rehearsal, rehearsal+ewc}`
- Y luego sus HPs correspondientes.

Útil cuando:
- No sabes qué método es mejor en tu dataset.
- Quieres una **comparativa automática** con el mismo presupuesto de cómputo.

> Empieza con `RUN_JOINT=False` para validar el flujo con un único método. Luego enciéndelo y sube `N_TRIALS_JOINT`.

[↑ Volver al índice](#toc)

In [7]:
RUN_JOINT = False   # Pon True si quieres lanzar el estudio conjunto
N_TRIALS_JOINT = 10

def optuna_objective_joint(trial: optuna.Trial):
    method = trial.suggest_categorical("method", ["naive","ewc","rehearsal","rehearsal+ewc"])
    params = suggest_params_for_method(trial, method)
    cfg_i  = build_cfg_with_method(CFG, method, params, HPO_EPOCHS)
    out_dir, _, results = run_one_cfg(cfg_i)
    metrics = extract_metrics(results)
    val = objective_value(metrics, ALPHA_FORGET)
    trial.set_user_attr("out_dir", str(out_dir))
    trial.set_user_attr("metrics", metrics)
    trial.set_user_attr("method", method)
    return val

if RUN_JOINT:
    study_joint = optuna.create_study(direction="minimize", study_name="HPO_joint")
    study_joint.optimize(optuna_objective_joint, n_trials=N_TRIALS_JOINT, show_progress_bar=True)
    print("Best value:", study_joint.best_value)
    print("Best params:", study_joint.best_params)
    print("Best attrs:", study_joint.best_trial.user_attrs)
else:
    print("RUN_JOINT=False — omitido.")

RUN_JOINT=False — omitido.


<a id="sec-08"></a>

## 8) Re-entrena con los mejores hiperparámetros

- Coge `study.best_params` y `METHOD_TO_OPTIMIZE`.
- Reconstruye `cfg_best` con el **método ganador + HPs**.
- (Opcional) Restablece `epochs` del preset si usaste `HPO_EPOCHS` para acelerar.
- Lanza `run_continual(...)` **a pleno rendimiento**.
- Muestra métricas finales y la **carpeta de salida**.

> Así separas la **búsqueda rápida** (pocas epochs) del **entrenamiento serio** (epochs del preset).

[↑ Volver al índice](#toc)

In [8]:
# Usa el mejor del estudio por método (arriba)
BEST_PARAMS = study.best_params
BEST_METHOD = METHOD_TO_OPTIMIZE

print("Mejor método:", BEST_METHOD)
print("Mejores HPs:", BEST_PARAMS)

cfg_best = copy.deepcopy(CFG)
cfg_best["continual"]["method"] = BEST_METHOD
cfg_best["continual"]["params"] = BEST_PARAMS

# (Opcional) restablecer epochs al valor del preset si redujiste para HPO
# cfg_best["optim"]["epochs"] = load_preset(ROOT / "configs" / "presets.yaml", PRESET)["optim"]["epochs"]

out_dir, _, results = run_one_cfg(cfg_best)
metrics = extract_metrics(results)
print("Resultados finales (re-train):", metrics)
print("Guardado en:", out_dir)

Mejor método: ewc
Mejores HPs: {'lam': 776858846.9216224, 'fisher_batches': 200}

--- Tarea 1/2: circuito1 | preset=fast | method=ewc_lam_8e+08 | B=64 T=10 AMP=True | enc=rate ---


                                                            


--- Tarea 2/2: circuito2 | preset=fast | method=ewc_lam_8e+08 | B=64 T=10 AMP=True | enc=rate ---


                                                          

Resultados finales (re-train): {'c1_mae': 0.17073977488271364, 'c1_after_c2_mae': 0.17072396584782734, 'forget_rel_%': -0.009259140055182528, 'c2_mae': 0.2317043848066445}
Guardado en: /home/cesar/proyectos/TFM_SNN/outputs/continual_fast_ewc_lam_8e+08_lam_8e+08_rate_model-PilotNetSNN_66x200_gray_seed_42


<a id="sec-09"></a>

## 9) Resumen rápido de runs (tabla)

- Recorremos `outputs/continual_*` y leemos `continual_results.json`.
- Extraemos y tabulamos:
  - `preset`, `method`, `encoder`, `seed`, (y `lambda` si aplica),
  - `c1_mae`, `c1_after_c2_mae`, `forget_rel_%`, `c2_mae`.

**Cómo leerla:**
- **`c2_mae`** bajo → aprende bien la última tarea.
- **`forget_rel_%`** bajo → **poco olvido** de la primera.
- Filtra por preset/método para comparar **manzanas con manzanas**.

> Consejo: Exporta a CSV/Parquet si quieres hacer gráficas comparativas a posteriori.

[↑ Volver al índice](#toc)

In [9]:
import re, pandas as pd

ALLOWED_ENC = r"(rate|latency|raw|image)"

def parse_exp_name(name: str):
    pat = re.compile(rf"^continual_(?P<preset>[^_]+)_(?P<tag>.+)_(?P<enc>{ALLOWED_ENC})(?:_model\-(?P<model>.+?))?(?:_seed_(?P<seed>\d+))?$")
    m = pat.match(name)
    meta = {"preset": None, "method": None, "lambda": None, "encoder": None, "seed": None, "model": None}
    if not m:
        return meta
    preset = m.group("preset"); tag = m.group("tag"); enc = m.group("enc")
    seed = m.group("seed"); model = m.group("model")
    lam = None; mlam = re.search(r"_lam_([^_]+)", tag)
    if mlam:
        lam = mlam.group(1)
        method = tag.replace(f"_lam_{lam}", "")
    else:
        method = tag
    return {"preset": preset, "method": method, "lambda": lam, "encoder": enc,
            "seed": int(seed) if seed is not None else None, "model": model}

rows = []
root_out = ROOT / "outputs"
for exp_dir in sorted(root_out.glob("continual_*")):
    name = exp_dir.name
    meta = parse_exp_name(name)
    if meta["preset"] is None:
        continue
    results_path = exp_dir / "continual_results.json"
    if not results_path.exists():
        continue
    with open(results_path, "r", encoding="utf-8") as f:
        res = json.load(f)

    # métrica mínima para la tabla
    m = extract_metrics(res)
    rows.append({
        "exp": name,
        "preset": meta["preset"],
        "method": meta["method"],
        "lambda": meta["lambda"],
        "encoder": meta["encoder"],
        "model": meta["model"],
        "seed": meta["seed"],
        "c1_mae": m["c1_mae"],
        "c1_after_c2_mae": m["c1_after_c2_mae"],
        "forget_rel_%": m["forget_rel_%"],
        "c2_mae": m["c2_mae"],
    })

df = pd.DataFrame(rows)
print(f"runs en resumen: {len(df)}")
if not df.empty:
    display(df.sort_values(["preset","method","encoder","lambda"], na_position="last", ignore_index=True))
else:
    print("No hay filas (¿no existen JSONs o solo hubo 1 tarea por run?).")

runs en resumen: 13


Unnamed: 0,exp,preset,method,lambda,encoder,model,seed,c1_mae,c1_after_c2_mae,forget_rel_%,c2_mae
0,continual_fast_ewc_lam_1e+09_lam_1e+09_rate_mo...,fast,ewc,1000000000.0,rate,PilotNetSNN_66x200_gray,42,0.17074,0.1708,0.035296,0.231737
1,continual_fast_ewc_lam_1e+09_lam_1e+09_rate_mo...,fast,ewc,1000000000.0,rate,PilotNetSNN_66x200_gray,43,0.169534,0.169597,0.037209,0.231211
2,continual_fast_ewc_lam_2e+09_lam_2e+09_rate_mo...,fast,ewc,2000000000.0,rate,PilotNetSNN_66x200_gray,42,0.17074,0.170732,-0.004426,0.231708
3,continual_fast_ewc_lam_3e+08_lam_3e+08_rate_mo...,fast,ewc,300000000.0,rate,PilotNetSNN_66x200_gray,42,0.17074,0.170762,0.012979,0.231721
4,continual_fast_ewc_lam_6e+08_lam_6e+08_rate_mo...,fast,ewc,600000000.0,rate,PilotNetSNN_66x200_gray,42,0.172047,0.172099,0.030214,0.232317
5,continual_fast_ewc_lam_7e+08_lam_7e+08_rate_mo...,fast,ewc,700000000.0,rate,PilotNetSNN_66x200_gray,42,0.172236,0.172333,0.056096,0.23243
6,continual_fast_ewc_lam_8e+08_lam_8e+08_rate_mo...,fast,ewc,800000000.0,rate,PilotNetSNN_66x200_gray,42,0.17074,0.170724,-0.009259,0.231704
7,continual_fast_naive_rate_model-PilotNetSNN_66...,fast,naive,,rate,PilotNetSNN_66x200_gray,42,0.112226,0.17796,58.573375,0.155876
8,continual_fast_naive_rate_model-PilotNetSNN_66...,fast,naive,,rate,PilotNetSNN_66x200_gray,43,0.173744,0.183369,5.539713,0.239302
9,continual_fast_naive_rate_model-SNNVisionRegre...,fast,naive,,rate,SNNVisionRegressor_80x160_gray,42,0.17712,0.221733,25.188146,0.177002


## Apéndice — Optuna en 90 segundos

- **Study**: el proyecto de HPO (contiene todos los trials).
- **Trial**: una evaluación con un conjunto de HPs (`suggest_int`, `suggest_float`, etc.).
- **Sampler**: estrategia para elegir el siguiente punto (por defecto, TPE).
- **Pruner**: **corta** trials que pintan mal (acelera búsquedas largas).
- **Storage**: base de datos (SQLite, PostgreSQL) para **reanudar** y/o **paralelizar**.

### Reanudar búsquedas
Puedes crear el estudio con almacenamiento:
```python
study = optuna.create_study(
    direction="minimize",
    study_name="HPO_ewc",
    storage=f"sqlite:///{ROOT/'outputs'/'optuna_ewc.sqlite'}",
    load_if_exists=True,
)
