# Modelo Avanzado Tabular V2.0

## Importación de datos, imputación de NaN y features para modelo

Importación de librerías necesarias 

In [2]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

1) Carga 

In [3]:
ruta_dataset = "../data/processed/dataset_final_enriquecido.csv"
df = pd.read_csv(ruta_dataset)
df['date'] = pd.to_datetime(df['date'])
print(f"✅ Dataset enriquecido cargado. Dimensiones: {df.shape}")

✅ Dataset enriquecido cargado. Dimensiones: (37399, 25)


2) Limpieza final

In [None]:
# Lógica de imputación para asegurar que no haya NaN
mapeo_columnas = {
    'TMAX': 'om_temperature_2m_max', 'TMIN': 'om_temperature_2m_min',
    'TAVG': 'om_apparent_temperature_mean', 'PRCP': 'om_precipitation_sum'
}
for col_noaa, col_om in mapeo_columnas.items():
    df[col_noaa] = df[col_noaa].fillna(df[col_om])
df = df.interpolate(method='time').fillna(0)
print("✅ Limpieza de NaN finalizada.")

# INGENIERÍA DE CARACTERÍSTICAS
df['mes'] = df['date'].dt.month
df['dia_del_año'] = df['date'].dt.dayofyear
df['rango_temp_diario'] = df['TMAX'] - df['TMIN']
print("✅ Nuevas características ('mes', 'rango_temp_diario', etc.) creadas.")


3) Selección de Características y Objetivo

In [None]:
y = df['granizo']
columnas_a_excluir = [
    'date', 'station_name', 'granizo', 'latitude', 'longitude',
    'om_temperature_2m_max', 'om_temperature_2m_min', 
    'om_apparent_temperature_mean', 'om_precipitation_sum'
]
X = df.drop(columns=columnas_a_excluir)
print(f"\n✅ Datos separados. Usaremos {X.shape[1]} características para predecir.")


4) División de Entrenamiento y Prueba

In [None]:
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42, stratify=y
)
print("\n✅ Datos divididos en conjuntos de entrenamiento y prueba.")

5) Escalado de Características 

In [None]:
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)
print("✅ Datos escalados exitosamente.")