# Evaluación de Modelos

Este cuaderno se encarga de evaluar el rendimiento de los modelos de machine learning entrenados en el cuaderno anterior. Se compararán las métricas de rendimiento y se seleccionará el mejor modelo para su implementación.

In [None]:
# Importar librerías necesarias
import pandas as pd
import numpy as np
import pickle
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score
import matplotlib.pyplot as plt
import seaborn as sns

sns.set(style='whitegrid')

print('Librerías importadas correctamente')

## Cargar Datos Procesados

Cargamos el dataset procesado que se utilizará para la evaluación de los modelos.

In [None]:
# Cargar el dataset procesado
df = pd.read_csv('../data/processed/sales_clean.csv')

print(f'Dataset cargado: {df.shape[0]} filas, {df.shape[1]} columnas')

## Cargar Modelos Pre-entrenados

Cargamos los modelos pre-entrenados que se evaluarán.

In [None]:
# Cargar modelos pre-entrenados
with open('../models/random_forest.pkl', 'rb') as f:
    rf_model = pickle.load(f)

with open('../models/xgboost.pkl', 'rb') as f:
    xgb_model = pickle.load(f)

print('Modelos cargados correctamente')

## Preparar Datos para Evaluación

Separar las características y la variable objetivo del dataset.

In [None]:
# Separar características y variable objetivo
X = df.drop('sales', axis=1)
y = df['sales']

print(f'Características: {X.shape[1]}, Variable objetivo: {y.shape[0]}')

## Evaluar Modelos

Realizamos predicciones con ambos modelos y calculamos las métricas de rendimiento.

In [None]:
# Evaluar Random Forest
rf_predictions = rf_model.predict(X)
rf_accuracy = accuracy_score(y, rf_predictions)
rf_precision = precision_score(y, rf_predictions, average='weighted')
rf_recall = recall_score(y, rf_predictions, average='weighted')
rf_f1 = f1_score(y, rf_predictions, average='weighted')

# Evaluar XGBoost
xgb_predictions = xgb_model.predict(X)
xgb_accuracy = accuracy_score(y, xgb_predictions)
xgb_precision = precision_score(y, xgb_predictions, average='weighted')
xgb_recall = recall_score(y, xgb_predictions, average='weighted')
xgb_f1 = f1_score(y, xgb_predictions, average='weighted')

metrics = pd.DataFrame({
    'Modelo': ['Random Forest', 'XGBoost'],
    'Precisión': [rf_accuracy, xgb_accuracy],
    'Precisión (weighted)': [rf_precision, xgb_precision],
    'Recall (weighted)': [rf_recall, xgb_recall],
    'F1 Score (weighted)': [rf_f1, xgb_f1]
})

print(metrics)

## Conclusiones

En base a las métricas obtenidas, se puede determinar cuál modelo tiene un mejor rendimiento y es más adecuado para su implementación.