<a href="https://colab.research.google.com/github/HectorDelgadoJ/M-todos-de-Validaci-n/blob/main/MetodosdeValidaci%C3%B3n.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Métodos de validación
En esta práctica exploraremos tres métodos de validación comunes en aprendizaje automático: Hold-Out, K-Fold Cross-Validation y Leave-One-Out, utilizando el Wine Dataset del repositorio UCI. Estos métodos nos permiten evaluar el rendimiento de un modelo clasificatorio al dividir el conjunto de datos en subconjuntos de entrenamiento y prueba, asegurando que los resultados sean confiables y aplicables a nuevos datos.
El objetivo es implementar cada uno de estos métodos con el clasificador K-Nearest Neighbors (KNN), generando conjuntos de datos disjuntos para su entrenamiento y evaluación. Posteriormente, compararemos la precisión obtenida con cada técnica para determinar cuál se adapta mejor al dataset y proporciona una mejor generalización.

* ##   1 Cargamos el Wine Dataset

In [None]:
from sklearn.datasets import load_wine
import pandas as pd

# Cargar el dataset
wine = load_wine(as_frame=True)
df_wine = wine.frame

# Separar características (X) y etiquetas (y)
X = df_wine.iloc[:, :-1]  # Todas las columnas excepto la última (características)
y = df_wine.iloc[:, -1]   # Última columna (etiquetas)


* ##  2 Hold-Out Validation

Puedes fijar el valor de r como el porcentaje de datos para el conjunto de prueba.

In [None]:
from sklearn.model_selection import train_test_split

# Método Hold-Out Validation
def hold_out_validation(X, y, test_size):
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=test_size)
    return X_train, X_test, y_train, y_test

# Ejemplo con 20% de datos para el conjunto de prueba
X_train, X_test, y_train, y_test = hold_out_validation(X, y, 0.2)


* ##  3 K-Fold Cross-Validation

Aquí, K es el número de particiones y lo defines tú.

In [None]:
from sklearn.model_selection import KFold

# Método K-Fold Cross-Validation
def k_fold_validation(X, y, k):
    kf = KFold(n_splits=k)
    for train_index, test_index in kf.split(X):
        X_train, X_test = X.iloc[train_index], X.iloc[test_index]
        y_train, y_test = y.iloc[train_index], y.iloc[test_index]
        # Puedes entrenar y evaluar un modelo en cada partición
        print(f"Train indices: {train_index}, Test indices: {test_index}")

# Ejemplo con K = 5
k_fold_validation(X, y, 5)


* ## 4 Leave-One-Out Validation

Leave-One-Out valida dejando una sola muestra para el conjunto de prueba en cada iteración.

In [None]:
from sklearn.model_selection import LeaveOneOut

# Método Leave-One-Out Validation
def leave_one_out_validation(X, y):
    loo = LeaveOneOut()
    for train_index, test_index in loo.split(X):
        X_train, X_test = X.iloc[train_index], X.iloc[test_index]
        y_train, y_test = y.iloc[train_index], y.iloc[test_index]
        # Puedes entrenar y evaluar un modelo en cada partición
        print(f"Train indices: {train_index}, Test index: {test_index}")

# Ejecutar Leave-One-Out
leave_one_out_validation(X, y)


* ## 5 Entrenamiento y evaluación



In [None]:
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score

# Entrenar y evaluar un modelo en Hold-Out
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)
y_pred = knn.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)

print(f"Hold-Out Accuracy: {accuracy}")


## Resultado Final

In [None]:
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split, KFold, LeaveOneOut
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score
import pandas as pd

# Cargar el Wine Dataset
wine = load_wine(as_frame=True)
df_wine = wine.frame

# Separar características (X) y etiquetas (y)
X = df_wine.iloc[:, :-1]
y = df_wine.iloc[:, -1]

# Modelo de clasificación
knn = KNeighborsClassifier(n_neighbors=3)

# Función para Hold-Out Validation
def hold_out_validation(X, y, test_size):
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=test_size)
    knn.fit(X_train, y_train)
    y_pred = knn.predict(X_test)
    accuracy = accuracy_score(y_test, y_pred)
    print(f"Hold-Out Accuracy (test_size={test_size}): {accuracy}")

# Función para K-Fold Cross-Validation
def k_fold_validation(X, y, k):
    kf = KFold(n_splits=k)
    accuracies = []
    for train_index, test_index in kf.split(X):
        X_train, X_test = X.iloc[train_index], X.iloc[test_index]
        y_train, y_test = y.iloc[train_index], y.iloc[test_index]
        knn.fit(X_train, y_train)
        y_pred = knn.predict(X_test)
        accuracy = accuracy_score(y_test, y_pred)
        accuracies.append(accuracy)
    print(f"K-Fold Accuracy (K={k}): {sum(accuracies)/len(accuracies)}")

# Función para Leave-One-Out Validation
def leave_one_out_validation(X, y):
    loo = LeaveOneOut()
    accuracies = []
    for train_index, test_index in loo.split(X):
        X_train, X_test = X.iloc[train_index], X.iloc[test_index]
        y_train, y_test = y.iloc[train_index], y.iloc[test_index]
        knn.fit(X_train, y_train)
        y_pred = knn.predict(X_test)
        accuracy = accuracy_score(y_test, y_pred)
        accuracies.append(accuracy)
    print(f"Leave-One-Out Accuracy: {sum(accuracies)/len(accuracies)}")

# Ejemplo de uso
print("Wine Dataset Validation Results:")

# Hold-Out Validation (con el 20% de datos para prueba)
hold_out_validation(X, y, 0.2)

# K-Fold Cross-Validation (con K=5)
k_fold_validation(X, y, 5)

# Leave-One-Out Validation
leave_one_out_validation(X, y)


## Ejemplo de Salida

In [None]:
Wine Dataset Validation Results:
Hold-Out Accuracy (test_size=0.2): 0.9722222222222222
K-Fold Accuracy (K=5): 0.9662921348314607
Leave-One-Out Accuracy: 0.9887640449438202
