# Validación Cruzada en Machine Learning

La validación cruzada es una técnica utilizada para evaluar el rendimiento de un modelo de aprendizaje automático. En este ejemplo, vamos a usar K-Fold Cross-Validation para evaluar un modelo de regresión logística en el conjunto de datos Iris.

In [None]:

# Importar las librerías necesarias
import numpy as np
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import cross_val_score
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import StratifiedKFold
import matplotlib.pyplot as plt

# Cargar el dataset Iris
iris = load_iris()
X = iris.data
y = iris.target

# Crear el modelo (Logistic Regression)
model = LogisticRegression(max_iter=200)

# Usar K-Fold Cross-Validation
# Aquí usamos StratifiedKFold para asegurarnos de que las proporciones de las clases sean equilibradas en cada fold
cv = StratifiedKFold(n_splits=5, shuffle=True, random_state=42)

# Evaluar el modelo utilizando validación cruzada
scores = cross_val_score(model, X, y, cv=cv, scoring='accuracy')

# Mostrar los resultados
print(f"Precisión en cada fold: {scores}")
print(f"Precisión media (cross-validation): {np.mean(scores):.2f}")

# Graficar los resultados de la validación cruzada
plt.boxplot(scores)
plt.title("Distribución de la Precisión en K-Fold Cross-Validation")
plt.ylabel("Precisión")
plt.show()
