<a href="https://colab.research.google.com/github/hectorjavi/Validaci-n-Cruzada/blob/main/Validaci%C3%B3n_Cruzada.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Validación cruzada K-fold







*   Se utiliza el conjunto de datos Iris.
*   Se crea un clasificador SVM con un kernel lineal.
*   Se especifica el número de divisiones para la validación cruzada (n_splits=5), pero puedes ajustar este valor según tus necesidades.
*   Se realiza la validación cruzada y se obtienen las puntuaciones de precisión para cada iteración.
*   Se imprime la precisión para cada iteración y el promedio de todas las iteraciones.








In [5]:
from sklearn.model_selection import KFold
from sklearn.model_selection import cross_val_score
from sklearn import datasets
from sklearn import svm

# Cargar un conjunto de datos de ejemplo (iris dataset en este caso)
iris = datasets.load_iris()
X = iris.data
y = iris.target

# Crear un clasificador SVM (Support Vector Machine)
clf = svm.SVC(kernel='linear', C=1)

# Especificar el número de divisiones para la validación cruzada (K = 5 en este caso)
k_fold = KFold(n_splits=5, shuffle=True, random_state=42)

# Realizar validación cruzada y obtener los resultados de la métrica deseada (precisión en este caso)
cross_val_results = cross_val_score(clf, X, y, cv=k_fold, scoring='accuracy')

# Imprimir los resultados de cada iteración y el resultado promedio
for i, acc in enumerate(cross_val_results, 1):
    print(f"Iteración {i}: {acc:.4f}")

print(f"\nAccuracy promedio: {cross_val_results.mean():.4f}")


Iteración 1: 1.0000
Iteración 2: 1.0000
Iteración 3: 0.9667
Iteración 4: 0.9333
Iteración 5: 0.9667

Accuracy promedio: 0.9733


## Validación cruzada K-fold estratificada

*   Cargar el conjunto de datos: Utilizamos el conjunto de datos Iris como ejemplo. Puedes reemplazarlo con tu propio conjunto de datos.
*   Crear el clasificador: En este ejemplo, utilizamos un clasificador SVM con un kernel lineal. Puedes cambiar el clasificador según tus necesidades.
*   Especificar la estrategia de validación cruzada estratificada: Creamos un objeto StratifiedKFold con 5 divisiones (n_splits=5). Asegura la estratificación de las clases durante la división de los datos.
*   Realizar la validación cruzada: Utilizamos cross_val_score para realizar la validación cruzada con el clasificador, los datos y la estrategia de validación cruzada especificados.
*   Imprimir los resultados: Iteramos sobre los resultados de cada iteración y mostramos la precisión de cada fold. Imprimimos la precisión promedio.

Ajusta el clasificador, el conjunto de datos y la métrica de evaluación según tus necesidades específicas. La validación cruzada estratificada es útil cuando trabajas con conjuntos de datos desequilibrados.

In [9]:
from sklearn.model_selection import StratifiedKFold
from sklearn.model_selection import cross_val_score
from sklearn import datasets
from sklearn import svm

# Cargar un conjunto de datos de ejemplo (iris dataset en este caso)
iris = datasets.load_iris()
X = iris.data
y = iris.target

# Crear un clasificador SVM (Support Vector Machine)
clf = svm.SVC(kernel='linear', C=1)

# Especificar el número de divisiones para la validación cruzada estratificada (K = 5 en este caso)
stratified_k_fold = StratifiedKFold(n_splits=5, shuffle=True, random_state=42)

# Realizar validación cruzada estratificada y obtener los resultados de la métrica deseada (precisión en este caso)
cross_val_results = cross_val_score(clf, X, y, cv=stratified_k_fold, scoring='accuracy')

# Imprimir los resultados de cada iteración y el resultado promedio
for i, acc in enumerate(cross_val_results, 1):
    print(f"Iteración {i}: {acc:.4f}")

print(f"\nAccuracy promedio: {cross_val_results.mean():.4f}")


Iteración 1: 1.0000
Iteración 2: 1.0000
Iteración 3: 0.9333
Iteración 4: 1.0000
Iteración 5: 1.0000

Accuracy promedio: 0.9867


## Validación cruzada leave-one-out


La validación cruzada Leave-One-Out (LOO) es un caso especial de validación cruzada K-fold donde se utiliza un solo dato como conjunto de prueba y el resto se utiliza como conjunto de entrenamiento. Aquí tienes un ejemplo de cómo realizar la validación cruzada Leave-One-Out en Python con scikit-learn:

En este ejemplo:

*   Se utiliza el conjunto de datos Iris.
*   Se crea un clasificador SVM con un kernel lineal.
*   Se especifica LeaveOneOut() como la estrategia de validación cruzada.
*   Se realiza la validación cruzada Leave-One-Out y se obtienen las puntuaciones de precisión para cada iteración.
*   Se imprime la precisión para cada iteración y el promedio de todas las iteraciones.

Ten en cuenta que la validación cruzada Leave-One-Out puede ser computacionalmente costosa para conjuntos de datos grandes, ya que implica entrenar y evaluar el modelo para cada punto de datos individualmente.







In [None]:
from sklearn.model_selection import LeaveOneOut
from sklearn.model_selection import cross_val_score
from sklearn import datasets
from sklearn import svm

# Cargar un conjunto de datos de ejemplo (iris dataset en este caso)
iris = datasets.load_iris()
X = iris.data
y = iris.target

# Crear un clasificador SVM (Support Vector Machine)
clf = svm.SVC(kernel='linear', C=1)

# Especificar la estrategia de validación cruzada Leave-One-Out
leave_one_out = LeaveOneOut()

# Realizar validación cruzada Leave-One-Out y obtener los resultados de la métrica deseada (precisión en este caso)
cross_val_results = cross_val_score(clf, X, y, cv=leave_one_out, scoring='accuracy')

# Imprimir los resultados de cada iteración y el resultado promedio
for i, acc in enumerate(cross_val_results, 1):
    print(f"Iteración {i}: {acc:.4f}")

print(f"\nAccuracy promedio: {cross_val_results.mean():.4f}")


## Validación cruzada K-fold repetida

La validación cruzada K-fold repetida es una extensión de la validación cruzada K-fold, donde se repite el proceso de K-fold varias veces con diferentes particiones aleatorias de los datos. Esto ayuda a obtener una estimación más robusta del rendimiento del modelo. Aquí tienes un ejemplo de cómo realizar la validación cruzada K-fold repetida en Python con scikit-learn:

En este ejemplo:

*   Se utiliza el conjunto de datos Iris.
*   Se crea un clasificador SVM con un kernel lineal.
*   Se especifica RepeatedKFold como la estrategia de validación cruzada con 5 divisiones repetidas 3 veces (n_splits=5, n_repeats=3).
*   Se realiza la validación cruzada K-fold repetida y se obtienen las puntuaciones de precisión para cada iteración.
*   Se imprime la precisión para cada iteración y el promedio de todas las iteraciones.

Ajusta los valores de n_splits y n_repeats según tus necesidades específicas.

In [8]:
from sklearn.model_selection import RepeatedKFold
from sklearn.model_selection import cross_val_score
from sklearn import datasets
from sklearn import svm

# Cargar un conjunto de datos de ejemplo (iris dataset en este caso)
iris = datasets.load_iris()
X = iris.data
y = iris.target

# Crear un clasificador SVM (Support Vector Machine)
clf = svm.SVC(kernel='linear', C=1)

# Especificar la estrategia de validación cruzada K-fold repetida (K=5, n_repeats=3 en este caso)
repeated_kfold = RepeatedKFold(n_splits=5, n_repeats=3, random_state=42)

# Realizar validación cruzada K-fold repetida y obtener los resultados de la métrica deseada (precisión en este caso)
cross_val_results = cross_val_score(clf, X, y, cv=repeated_kfold, scoring='accuracy')

# Imprimir los resultados de cada iteración y el resultado promedio
for i, acc in enumerate(cross_val_results, 1):
    print(f"Iteración {i}: {acc:.4f}")

print(f"\nAccuracy promedio: {cross_val_results.mean():.4f}")


Iteración 1: 1.0000
Iteración 2: 1.0000
Iteración 3: 0.9667
Iteración 4: 0.9333
Iteración 5: 0.9667
Iteración 6: 1.0000
Iteración 7: 1.0000
Iteración 8: 0.9667
Iteración 9: 1.0000
Iteración 10: 0.9667
Iteración 11: 0.9667
Iteración 12: 0.9000
Iteración 13: 1.0000
Iteración 14: 1.0000
Iteración 15: 1.0000

Accuracy promedio: 0.9778
