# 🔀 Cross Validation

La validación cruzada, o cross-validation en inglés, **es una técnica utilizada para evaluar el rendimiento de un modelo de machine learning**. 

Consiste en **dividir el conjunto de datos en subconjuntos más pequeños**, llamados "folds", **y realizar múltiples iteraciones de entrenamiento y evaluación del modelo** en diferentes combinaciones de estos folds.

El objetivo principal de la validación cruzada es obtener una estimación más precisa del rendimiento del modelo al entrenarlo y evaluarlo en diferentes subconjuntos de datos. Esto ayuda a detectar problemas de sobreajuste o subajuste y proporciona una evaluación más robusta del modelo.

Aquí tienes un ejemplo simple de cómo realizar validación cruzada en Python utilizando la librería `scikit-learn`:

In [1]:
from sklearn.datasets import load_iris
from sklearn.model_selection import cross_val_score
from sklearn.svm import SVC
import numpy as np

In [2]:
# Cargar el conjunto de datos Iris
iris = load_iris()
X = iris.data
y = iris.target

In [3]:
# Creamos un modelo de SVM (Support Vector Machine)
model = SVC()

In [4]:
# Realizamos la validación cruzada con 5 folds
# Utilizamos la métrica de accuracy para evaluar el rendimiento
scores = cross_val_score(model, X, y, cv=5, scoring='accuracy')

# Calculamos el promedio de los scores obtenidos
mean_accuracy = scores.mean()

print("Accuracy Scores:", np.round(scores,4) )
print("Mean Accuracy:", mean_accuracy)

Accuracy Scores: [0.9667 0.9667 0.9667 0.9333 1.    ]
Mean Accuracy: 0.9666666666666666


En este ejemplo, cargamos el conjunto de datos Iris y creamos un modelo de clasificación SVM (_Support Vector Machine_). Luego, utilizamos la validación cruzada con 5 folds para evaluar el rendimiento del modelo. La métrica de evaluación que utilizamos es la precisión (_accuracy_). Finalmente, calculamos el promedio de las puntuaciones de precisión obtenidas en cada fold.