# CHARM • Enchanted Valley — Core Run

Notebook mínimo para ejecutar el experimento de CHARM sobre el entorno
Enchanted Valley y visualizar curvas básicas.

Ajusta los hiperparámetros de abajo, ejecuta las celdas y observa cómo
reaccionan la recompensa, λ y la polarización isomérica promedio.


In [None]:
import os, sys
import numpy as np
import matplotlib.pyplot as plt

# Añadir la carpeta `levo` al path cuando este notebook se abre
# desde `Quarks/CHARM/Charm/notebooks`.
ROOT = os.path.dirname(os.path.dirname(os.getcwd()))
LEVO_PATH = os.path.join(ROOT, "levo")
if LEVO_PATH not in sys.path:
    sys.path.append(LEVO_PATH)

import charm_enchanted_valley as charm

# Hiperparámetros estratégicos
n_episodes = 400
gamma = 0.97
lambda_init = 0.2
diffusion_K = 3

cfg_overrides = dict(
    gamma=gamma,
    lambda_init=lambda_init,
    diffusion_K=diffusion_K,
)

stats = charm.train_charm_enchanted_valley(
    n_episodes=n_episodes,
    cfg_overrides=cfg_overrides,
)

rewards = stats["rewards"]
lambdas = stats["lambda"]
rho_mean = stats["rho_mean"]

print(f"Episodios: {len(rewards)}")
print(f"Reward medio: {rewards.mean():.3f}")


In [None]:
# Recompensa por episodio
plt.figure()
plt.plot(rewards)
plt.xlabel("Episodio")
plt.ylabel("Recompensa")
plt.title("Charm — Reward por episodio")
plt.show()


In [None]:
# Lambda por episodio
plt.figure()
plt.plot(lambdas)
plt.xlabel("Episodio")
plt.ylabel("lambda")
plt.title("Charm — λ por episodio")
plt.show()


In [None]:
# Rho media por episodio
plt.figure()
plt.plot(rho_mean)
plt.xlabel("Episodio")
plt.ylabel("rho_mean")
plt.title("Charm — ρ̄ por episodio")
plt.show()
