In [23]:
# === BLOQUE 0: Bootstrap de Kedro desde un notebook ===
import os, sys, glob
from pathlib import Path

print("CWD Notebook:", os.getcwd())

# (Opcional) Silenciar telemetr√≠a de Kedro en este entorno
os.environ.setdefault("KEDRO_DISABLE_TELEMETRY", "1")

# 1) Detectar ra√≠z del proyecto (carpeta con pyproject.toml y src/)
nb_dir = Path.cwd()
candidatos = [nb_dir / "../..", nb_dir / "..", nb_dir]
project_root = None
for c in candidatos:
    c = Path(c).resolve()
    if (c / "pyproject.toml").exists() and (c / "src").exists():
        project_root = c
        break
if project_root is None:
    raise RuntimeError("‚ùå No pude localizar la ra√≠z del proyecto (pyproject.toml y src/ no encontrados).")

print("Project root:", project_root)

# 2) Asegurar src/ en sys.path
src_path = str(project_root / "src")
if src_path not in sys.path:
    sys.path.insert(0, src_path)
print("sys.path ok:", src_path in sys.path)

# 3) Exponer la ruta del proyecto como variable de entorno (√∫til para algunos plugins)
os.environ["KEDRO_PROJECT_PATH"] = str(project_root)

# 4) Bootstrap del proyecto (inicializa settings y PACKAGE_NAME internos)
from kedro.framework.startup import bootstrap_project
bootstrap_project(project_path=str(project_root))

# 5) Crear sesi√≥n y obtener contexto + cat√°logo (helpers)
from kedro.framework.session import KedroSession

def _new_session():
    """Crea una nueva sesi√≥n y devuelve (session, context, catalog)."""
    session = KedroSession.create(str(project_root))
    context = session.load_context()
    catalog = context.catalog
    return session, context, catalog

# Sesi√≥n inicial
session, context, catalog = _new_session()
print("Kedro listo ‚úÖ")
# Algunas versiones no exponen package_name; mostramos informaci√≥n segura:
try:
    from kedro.framework.project import settings
    print("PACKAGE_NAME:", getattr(settings, "PACKAGE_NAME", "(no disponible)"))
except Exception:
    pass
print("Project path:", getattr(context, "project_path", project_root))

# ==== Utilidades pr√°cticas ====

def reload_context():
    """
    Relee catalog/params tras editar conf/ (√∫til tras cambios en catalog.yml).
    Tambi√©n reinicia la sesi√≥n para evitar estados previos.
    """
    global session, context, catalog
    try:
        session.close()
    except Exception:
        pass
    session, context, catalog = _new_session()
    try:
        ds = list(catalog.list())
        print(f"üîÑ Contexto recargado. Datasets disponibles: {len(ds)} (usa catalog.list())")
    except Exception:
        print("üîÑ Contexto recargado.")

def run_pipeline(name: str):
    """
    Ejecuta una pipeline por nombre dentro de una sesi√≥n NUEVA (evita error de 'run' duplicado).
    """
    with KedroSession.create(str(project_root)) as s:
        print(f"‚ñ∂Ô∏è Ejecutando pipeline: {name}")
        s.run(pipeline_name=name)
    print("‚úÖ Pipeline completada:", name)

# Helpers para m√©tricas: intenta CSVDataSet fijo y si no existe, cae a timestamped
import pandas as pd

def _load_metrics_fixed_or_latest(dataset_name: str, base_dir="data/07_model_output", prefix=None):
    """
    Intenta cargar un dataset de m√©tricas declarado en catalog (CSVDataSet con ruta fija).
    Si el archivo no existe o no est√° declarado, busca el CSV m√°s reciente con prefijo timestamped.
    """
    # 1) Intentar v√≠a catalog
    try:
        df = catalog.load(dataset_name)
        print(f"üì• Cargado desde catalog: '{dataset_name}' (ruta fija)")
        return df
    except Exception as e:
        print(f"‚ö†Ô∏è No se pudo cargar '{dataset_name}' desde catalog (intentando timestamped). Detalle: {e}")

    # 2) Buscar √∫ltimo timestamped
    if prefix is None:
        prefix = dataset_name  # por convenci√≥n, usamos el mismo nombre
    base_path = project_root / base_dir
    pattern = str(base_path / f"{prefix}_*.csv")
    archivos = sorted(glob.glob(pattern))
    if not archivos:
        raise FileNotFoundError(
            f"No encontr√© archivos timestamped '{prefix}_*.csv' en {base_dir}. "
            f"Ejecuta la pipeline o ajusta el prefijo."
        )
    print("‚è±Ô∏è Usando el m√°s reciente:", archivos[-1])
    return pd.read_csv(archivos[-1])

def load_regression_metrics():
    """
    Carga m√©tricas de regresi√≥n intentando primero 'regression_metrics' del catalog y,
    si falla, usa el √∫ltimo 'regression_metrics_YYYYMMDD-HHMMSS.csv'.
    """
    return _load_metrics_fixed_or_latest("regression_metrics", prefix="regression_metrics")

def load_classification_metrics():
    """
    Carga m√©tricas de clasificaci√≥n intentando primero 'classification_metrics' del catalog y,
    si falla, usa el √∫ltimo 'classification_metrics_YYYYMMDD-HHMMSS.csv'.
    """
    return _load_metrics_fixed_or_latest("classification_metrics", prefix="classification_metrics")

print("‚ÑπÔ∏è Utilidades disponibles: reload_context(), run_pipeline(name), load_regression_metrics(), load_classification_metrics()")

# (Opcional) Pruebas r√°pidas:
# df = catalog.load("merged_data"); print("merged_data shape:", df.shape)
# run_pipeline("regression"); reg = load_regression_metrics(); reg.head()
# run_pipeline("classification"); clf = load_classification_metrics(); clf.head()


CWD Notebook: c:\Users\Gamer\Desktop\Machine_learning\Proyectomachinelearning\proyectomachineml\notebooks
Project root: C:\Users\Gamer\Desktop\Machine_learning\Proyectomachinelearning\proyectomachineml
sys.path ok: True
Kedro listo ‚úÖ
PACKAGE_NAME: (no disponible)
Project path: C:\Users\Gamer\Desktop\Machine_learning\Proyectomachinelearning\proyectomachineml
‚ÑπÔ∏è Utilidades disponibles: reload_context(), run_pipeline(name), load_regression_metrics(), load_classification_metrics()


In [28]:
reload_context()
run_pipeline("regression")
run_pipeline("classification")


üîÑ Contexto recargado. Datasets disponibles: 15 (usa catalog.list())
‚ñ∂Ô∏è Ejecutando pipeline: regression


‚úÖ Pipeline completada: regression
‚ñ∂Ô∏è Ejecutando pipeline: classification


‚úÖ Pipeline completada: classification
