<a href="https://colab.research.google.com/github/dtoralg/IE_Calidad_ML/blob/main/Ejercicios/Modulo%205/Modulo_5_Ejercicio_5_CrossValidation.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

### **Ejercicio 5: ¿Cuán estable es tu modelo? Evalúa su rendimiento con validación cruzada (dataset balanceado)**
**Aplicación de Hold-out, KFold y StratifiedKFold en un problema de clasificación binaria con clases balanceadas**

### **Introducción**
En este ejercicio aprenderás a aplicar correctamente la **validación cruzada** para evaluar la estabilidad de un modelo y su capacidad de generalización. Usaremos un dataset con clases balanceadas para comprobar cómo la validación cruzada mejora la estimación del rendimiento comparado con una simple partición de entrenamiento/prueba. Analizaremos la variabilidad de métricas como **accuracy** y **F1 Score**, comparando los resultados de **Hold-out**, **KFold**, y **StratifiedKFold**.

In [None]:
# Celda 1: Carga de librerías
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split, KFold, StratifiedKFold, cross_val_score
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report
from sklearn.impute import SimpleImputer
from sklearn.preprocessing import StandardScaler
sns.set(style='whitegrid')

In [None]:
# Celda 2: Cargar dataset balanceado
url = 'https://github.com/dtoralg/IE_Calidad_ML/raw/main/Data/control_calidad_piezas_metalicas.csv'
df = pd.read_csv(url)
...

In [None]:
# Celda 3: Preparación de variables, drop ID y mapear defecto a binario
...

In [None]:
# Celda 4: Codificación, imputación y escalado
...

In [None]:
# Celda 5: Hold-out (train/test split) + entrenamiento de RandomForest, predicciones y classification_report
...


In [None]:
# Celda 6: Validación cruzada con KFold (3 particiones)
# Ten paciencia, este cálculo puede tardar > 20 min en Colab
kf = KFold(...)
f1_kf = cross_val_score(..., cv=kf, scoring='f1')
acc_kf = cross_val_score(..., cv=kf, scoring='accuracy')
print('F1 Score por fold (KFold):', f1_kf)
print('Accuracy por fold (KFold):', acc_kf)

In [None]:
# Celda 7: Validación cruzada con StratifiedKFold (3 particiones)
# Puede tardar > 20 min en Colab
skf = StratifiedKFold(...)
f1_skf = cross_val_score(..., cv=skf, scoring='f1')
acc_skf = cross_val_score(..., cv=skf, scoring='accuracy')
print('F1 Score por fold (StratifiedKFold):', f1_skf)
print('Accuracy por fold (StratifiedKFold):', acc_skf)

In [None]:
# Celda 8: Visualización con boxplots
df_cv = pd.DataFrame({
    'KFold - F1': ...,
    'StratifiedKFold - F1': ...,
    'KFold - Accuracy': ...,
    'StratifiedKFold - Accuracy': ...
})
plt.figure(figsize=(10,6))
sns.boxplot(data=df_cv)
plt.title('Comparación de variabilidad entre métodos de validación')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

### **Conclusiones**
- En datasets **balanceados**, tanto KFold como StratifiedKFold ofrecen estimaciones consistentes del rendimiento.
- Aunque en este caso el desbalance no es un problema, **StratifiedKFold** sigue siendo una práctica recomendable.
- La comparación con `train_test_split` muestra que la validación cruzada **reduce la dependencia del azar** al evaluar modelos.

### **Preguntas para reflexionar**
- ¿Qué métrica muestra más variabilidad entre folds: F1 o Accuracy?
- ¿En qué casos podrías confiar solo en `train_test_split`?
- ¿Cuál sería una buena estrategia de validación si los datos fueran muy escasos?