# 02 — Modelado (Entrenamiento y Evaluación)

Este notebook demuestra cómo entrenar los modelos (RF, MLP, HGB) y evaluar resultados usando los scripts en `src/`.
Se asume que el dataset está en `data/tested.csv`.


In [None]:
import os, sys, subprocess, json
from pathlib import Path

PROJECT_ROOT = Path('..').resolve()
DATA = PROJECT_ROOT / 'data' / 'tested.csv'
MODELS = PROJECT_ROOT / 'models'
REPORTS = PROJECT_ROOT / 'reports'

print('DATA exists?', DATA.exists())
print('MODELS dir:', MODELS)
print('REPORTS dir:', REPORTS)

## Entrenamiento de modelos
Ejecuta `src.train` para entrenar RandomForest, MLP y HGB.


In [None]:
cmd = [sys.executable, '-m', 'src.train', '--data', str(DATA), '--models', 'rf', 'mlp', 'hgb', '--save_dir', str(MODELS), '--reports_dir', str(REPORTS)]
print(' '.join(cmd))
# Descomentar para ejecutar:
# subprocess.run(cmd, check=True)

## Evaluación de modelos
Ejecuta `src.evaluate` para generar métricas y figuras.


In [None]:
cmd = [sys.executable, '-m', 'src.evaluate', '--data', str(DATA), '--models_dir', str(MODELS), '--out_dir', str(REPORTS)]
print(' '.join(cmd))
# Descomentar para ejecutar:
# subprocess.run(cmd, check=True)

## Inspección de resultados
El resumen consolidado se guarda en `reports/metrics/metrics_summary.json`.


In [None]:
summary_path = REPORTS / 'metrics' / 'metrics_summary.json'
if summary_path.exists():
    with open(summary_path, 'r') as f:
        summary = json.load(f)
    summary
else:
    print('Aún no se ha generado metrics_summary.json')
