# üíª Notebook: Entrenamiento y Evaluaci√≥n del Modelo SARIMAX Vectorial

### **Paso 1: Configuraci√≥n, Carga de Datos y Par√°metros**

Cargamos las librer√≠as necesarias para el modelado, los datos estacionarios que creamos y, crucialmente, los par√°metros de reversi√≥n.

In [1]:
import pandas as pd
import numpy as np
import json
# ¬°SOLUCI√ìN! Usamos VARMAX para modelos vectoriales
from statsmodels.tsa.statespace.varmax import VARMAX 
import itertools
import warnings
import joblib # Necesario para guardar el modelo

# Ignorar advertencias de convergencia durante el Grid Search
warnings.filterwarnings("ignore") 

# --- A. CARGA DE DATOS ESTACIONARIOS ---
# Aseg√∫rate de que las rutas sean correctas
try:
    df_stationary = pd.read_csv('datos_temperaturas_estacionarios.csv', index_col='Fecha', parse_dates=True)
except FileNotFoundError:
    df_stationary = pd.read_csv('dataset/datos_temperaturas_estacionarios.csv', index_col='Fecha', parse_dates=True)

# --- B. CARGA DE PAR√ÅMETROS DE REVERSI√ìN ---
try:
    with open('parametros_reversion.json', 'r') as f:
        params_reversion = json.load(f)
except FileNotFoundError:
    with open('dataset/parametros_reversion.json', 'r') as f:
        params_reversion = json.load(f)
    
if df_stationary is not None and params_reversion is not None:
    print(f"‚úÖ Datos estacionarios cargados (N={len(df_stationary)}).")
    print(f"‚úÖ Par√°metros de reversi√≥n cargados. √öltima fecha hist√≥rica: {params_reversion['ultima_fecha_historica']}.")

‚úÖ Datos estacionarios cargados (N=670).
‚úÖ Par√°metros de reversi√≥n cargados. √öltima fecha hist√≥rica: 2025-11-01.


### **Paso 2: B√∫squeda por Rejilla (Grid Search) de √ìrdenes √ìptimos**

Encontramos la combinaci√≥n de √≥rdenes $(p, q)$ (no estacional) y $(P, Q)$ (estacional) que minimice el Criterio de Informaci√≥n de Akaike (AIC), que equilibra el ajuste del modelo y su complejidad.

**Nota:** Como es un modelo Vectorial (SARIMAX para series m√∫ltiples), los √≥rdenes se aplican al sistema en su conjunto.

In [2]:
# --- 2.1. DEFINICI√ìN DE RANGOS DE B√öSQUEDA ---
# VARMAX: Solo requiere √≥rdenes AR (p) y MA (q) para los datos ya estacionarios.
p = q = range(0, 3) # p, q de 0 a 2
P = Q = range(0, 2) # P, Q estacionales de 0 a 1
S = 365 # Estacionalidad anual

# Creamos todos los posibles pares (p, q) y (P, Q)
pq = list(itertools.product(p, q))
PQ = list(itertools.product(P, Q))

# Generamos la lista de tuplas de √≥rdenes VARMAX
VARMAX_orders = list(itertools.product(pq, PQ))

# --- 2.2. FUNCI√ìN DE B√öSQUEDA (CORREGIDA) ---
def grid_search_varmax(data, varmax_orders):
    """Realiza la b√∫squeda por rejilla para encontrar el modelo con menor AIC."""
    best_aic = np.inf
    best_order = None
    best_seasonal_order = None

    for order in varmax_orders:
        try:
            order_ns = order[0]  # (p, q)
            order_s = order[1] + (S,) # (P, Q, S)
            
            # ¬°CLAVE! Usamos VARMAX aqu√≠
            model = VARMAX(
                data,
                order=order_ns,
                seasonal_order=order_s,
                # En VARMAX no se usan enforce_stationarity ni enforce_invertibility
            ).fit(maxiter=50, disp=False) 

            if model.aic < best_aic:
                best_aic = model.aic
                best_order = order_ns
                best_seasonal_order = order_s

        except Exception as e:
            # print(f"Error con √≥rdenes {order}: {e}")
            continue

    return best_order, best_seasonal_order, best_aic

# Ejecutar el Grid Search
print("\nIniciando Grid Search para √≥rdenes VARMAX (Minimizar AIC)...")
optimal_order, optimal_seasonal_order, optimal_aic = grid_search_varmax(
    df_stationary,
    VARMAX_orders
)

print("\n=======================================================")
print("üèÜ RESULTADOS DEL GRID SEARCH")
print(f"√ìrdenes No Estacionales (p, q): {optimal_order}") 
print(f"√ìrdenes Estacionales (P, Q, S): {optimal_seasonal_order}")
print(f"M√≠nimo AIC Obtenido: {optimal_aic:.2f}")
print("=======================================================")


Iniciando Grid Search para √≥rdenes VARMAX (Minimizar AIC)...

üèÜ RESULTADOS DEL GRID SEARCH
√ìrdenes No Estacionales (p, q): (2, 1)
√ìrdenes Estacionales (P, Q, S): (0, 0, 365)
M√≠nimo AIC Obtenido: 32686.95


### **Paso 3: Entrenamiento Final y Resumen**

Entrenamos el modelo con los √≥rdenes √≥ptimos encontrados para obtener el resumen estad√≠stico.

In [3]:
# --- 3.1. ENTRENAMIENTO FINAL (CORREGIDO) ---
# ¬°CLAVE! Usamos VARMAX con los √≥rdenes √≥ptimos.
final_model = VARMAX(
    df_stationary,
    order=optimal_order,
    seasonal_order=optimal_seasonal_order,
).fit(disp=False, maxiter=100) # M√°s iteraciones para el modelo final

# --- 3.2. REPORTE DEL MODELO ---
print("\n\n*******************************************************")
print("               RESUMEN DEL MODELO VARMAX")
print("*******************************************************")
print(final_model.summary())
print("*******************************************************\n\n")



*******************************************************
               RESUMEN DEL MODELO VARMAX
*******************************************************
                                     Statespace Model Results                                     
Dep. Variable:     ['Diff_BoxCox_Max', 'Diff_BoxCox_Min']   No. Observations:                  670
Model:                                         VARMA(2,1)   Log Likelihood              -16325.852
                                              + intercept   AIC                          32685.704
Date:                                    Mon, 15 Dec 2025   BIC                          32762.328
Time:                                            08:08:15   HQIC                         32715.383
Sample:                                        01-02-2024                                         
                                             - 11-01-2025                                         
Covariance Type:                                     