# üíæ Notebook: Persistencia de Datos Transformados y Par√°metros

### **Paso 1: Ejecutar Transformaciones y Obtener Par√°metros de Reversi√≥n**

Volvemos a ejecutar la l√≥gica de las transformaciones, pero con un enfoque en capturar los valores clave necesarios para la reversi√≥n de la serie.

In [1]:
import pandas as pd
import numpy as np
import json # Necesario para guardar los par√°metros en formato JSON
from scipy.stats import boxcox

# --- 1. CARGA Y PREPARACI√ìN DE DATOS ---
try:
    df = pd.read_csv('pinar_del_rio_temperaturas_LIMPIO_FINAL.csv')
except FileNotFoundError:
    df = pd.read_csv('dataset/pinar_del_rio_temperaturas_LIMPIO_FINAL.csv')

df['Fecha'] = pd.to_datetime(df['Fecha'])
df = df.set_index('Fecha')


# --- 2. BOX-COX (Obtener Lambda y Transformar) ---
data_max = df['Temp_Maxima_C'].values
_, lambda_max = boxcox(data_max) 
df['BoxCox_Max'] = boxcox(df['Temp_Maxima_C'], lmbda=lambda_max)

data_min = df['Temp_Minima_C'].values
_, lambda_min = boxcox(data_min)
df['BoxCox_Min'] = boxcox(df['Temp_Minima_C'], lmbda=lambda_min)

print(f"Lambdas Box-Cox obtenidos: Max={lambda_max:.4f}, Min={lambda_min:.4f}")


# --- 3. DIFERENCIACI√ìN (d=1) ---
df['Diff_BoxCox_Max'] = df['BoxCox_Max'].diff(1)
df['Diff_BoxCox_Min'] = df['BoxCox_Min'].diff(1)


# --- 4. DATASETS FINALES ---
# 4a. DataFrame para el Modelado (Estacionario)
df_stationary = df[['Diff_BoxCox_Max', 'Diff_BoxCox_Min']].dropna()
print(f"DataFrame Estacionario listo. Tama√±o: {len(df_stationary)} filas.")


# 4b. Obtener el √∫ltimo valor Box-Cox ANTES de la diferenciaci√≥n.
# Este valor es el "seed" o "semilla" que se necesita para revertir la diferenciaci√≥n.
last_boxcox_max = df['BoxCox_Max'].iloc[-1]
last_boxcox_min = df['BoxCox_Min'].iloc[-1]

# Tambi√©n capturamos los √∫ltimos valores originales, aunque la reversi√≥n se hace sobre Box-Cox,
# es √∫til tener el √∫ltimo valor original para referencia y validaci√≥n.
last_original_max = df['Temp_Maxima_C'].iloc[-1]
last_original_min = df['Temp_Minima_C'].iloc[-1]
last_original_date = df.index[-1].strftime('%Y-%m-%d')

print(f"√öltima fecha de observaci√≥n: {last_original_date}")

Lambdas Box-Cox obtenidos: Max=4.3777, Min=4.2651
DataFrame Estacionario listo. Tama√±o: 670 filas.
√öltima fecha de observaci√≥n: 2025-11-01


### **Paso 2: Guardar Datos Transformados (CSV)**

Guardamos el DataFrame que el modelo utilizar√° para el entrenamiento.

In [2]:
# Guardar el dataset estacionario en un nuevo archivo CSV
df_stationary.to_csv('dataset/datos_temperaturas_estacionarios.csv', index=True)

print("\n=========================================================================")
print("‚úÖ Archivo 'datos_temperaturas_estacionarios.csv' guardado exitosamente.")
print("=========================================================================")


‚úÖ Archivo 'datos_temperaturas_estacionarios.csv' guardado exitosamente.


### **Paso 3: Guardar Par√°metros de Reversi√≥n (JSON)**

Guardamos todos los coeficientes y valores iniciales necesarios para la funci√≥n de De-Transformaci√≥n de la predicci√≥n.

In [3]:
# Estructura del diccionario de par√°metros
transformation_params = {
    "ultima_fecha_historica": last_original_date,
    
    # 1. Par√°metros de Box-Cox (Para revertir Box-Cox)
    "boxcox_lambda": {
        "maxima": lambda_max,
        "minima": lambda_min
    },
    
    # 2. √öltimo valor Box-Cox (Para revertir la Diferenciaci√≥n)
    "ultimo_valor_boxcox": {
        # Este es el valor de Y(t-1) Box-Cox que se usar√° como semilla para la reversi√≥n
        "maxima": last_boxcox_max,
        "minima": last_boxcox_min
    },
    
    # 3. √öltimo valor Original (Solo para referencia y validaci√≥n)
    "ultimo_valor_original": {
        "maxima": last_original_max,
        "minima": last_original_min
    }
}

# Guardar en archivo JSON
with open('dataset/parametros_reversion.json', 'w') as f:
    json.dump(transformation_params, f, indent=4)

print("‚úÖ Archivo 'parametros_reversion.json' guardado exitosamente.")

‚úÖ Archivo 'parametros_reversion.json' guardado exitosamente.


### **Pr√≥ximo Paso: Entrenamiento del Modelo**
Ahora tenemos dos activos clave:

datos_temperaturas_estacionarios.csv: El input perfecto para entrenar el modelo.

parametros_reversion.json: La "llave" para interpretar las predicciones en el futuro.

El camino l√≥gico es ahora: Selecci√≥n del Modelo y Entrenamiento SARIMAX Vectorial.