# 05 - Regularización (Producción)

**Objetivo:** Aplicar el modelo regularizado ganador a nuevos datos para generar predicciones.

In [1]:
import pandas as pd
import numpy as np
import joblib
import json

## 1. Cargar Modelo y Metadata

In [2]:
# Cargar modelo ganador
modelo = joblib.load('reg_lin_ganador/reg_lin_ganador_bundle/modelo_elasticnet.pkl')

# Cargar metadata
with open('reg_lin_ganador/reg_lin_ganador_bundle/metadata_modelo.json', 'r') as f:
    metadata = json.load(f)

print(f"Modelo cargado: {metadata['modelo']}")
print(f"Alpha: {metadata['alpha']}")
print(f"R² en test: {metadata['r2_score']:.4f}")

Modelo cargado: Ridge (L2)
Alpha: 24.420530945486497
R² en test: 0.7772


## 2. Cargar Nuevos Datos

In [3]:
# Cargar datos nuevos preprocesados
df_new = pd.read_csv('../01_preprocessing_results/preprocessing_production/T_new_final.csv')

# Verificar columnas
expected_cols = metadata['features']
X_new = df_new[expected_cols]

print(f"Datos nuevos: {X_new.shape[0]} muestras, {X_new.shape[1]} features")

Datos nuevos: 100 muestras, 20 features


## 3. Generar Predicciones

In [4]:
# Predicciones
y_pred = modelo.predict(X_new)

print(f"Predicciones generadas: {len(y_pred)}")
print(f"Min: {y_pred.min():.2f}, Max: {y_pred.max():.2f}, Media: {y_pred.mean():.2f}")

Predicciones generadas: 100
Min: -21.52, Max: 396.65, Media: 132.72


In [5]:
# Crear DataFrame con predicciones
df_predicciones = X_new.copy()
df_predicciones['yhat'] = y_pred

# Guardar
df_predicciones.to_csv('Regresion_ganadora_nuevos_predicciones.csv', index=False)

print("\nPredicciones guardadas en: Regresion_ganadora_nuevos_predicciones.csv")
print("\nPrimeras 5 predicciones:")
print(df_predicciones[['PC1', 'PC2', 'yhat']].head())


Predicciones guardadas en: Regresion_ganadora_nuevos_predicciones.csv

Primeras 5 predicciones:
        PC1       PC2        yhat
0 -0.784609 -0.254918  121.795653
1 -2.047901 -0.561701   93.740635
2 -1.970934 -1.089211   54.548910
3  2.291329  0.141745  156.446398
4 -2.384895 -1.040506   57.338023
