### Repositorio
https://github.com/Diego2436/Inteligencia-Artificial/
### Nombres
- Olmos Verdin Diego
- Romero Hernández Oscar David
- Valentin Ramos Emmanuel Guadalupe

In [1]:
import numpy as np
import pandas as pd
from sklearn.datasets import load_iris, load_wine, load_breast_cancer
from sklearn.model_selection import train_test_split, cross_val_score, KFold, LeaveOneOut
from sklearn.metrics import accuracy_score, confusion_matrix
from sklearn.neural_network import MLPClassifier

  from pandas.core import (


In [2]:
# Cargar los datasets
datasets = {
    "Iris": load_iris(),
    "Wine": load_wine(),
    "Breast Cancer": load_breast_cancer()
}

# Inicializar los clasificadores
classifiers = {
    "Perceptrón Multicapa":MLPClassifier(max_iter=1000, learning_rate_init=0.001, random_state=42),
    "Red Neuronal RBF": MLPClassifier(hidden_layer_sizes=(100,), activation='tanh', max_iter=1000, random_state=42)
}

En este bloque de código, se cargan tres datasets predefinidos de la biblioteca **scikit-learn**: `Iris`, `Wine` y `Breast Cancer`, los cuales contienen datos etiquetados para problemas de clasificación. Estos datasets se almacenan en un diccionario llamado `datasets` para facilitar su manejo. Además, se inicializan dos clasificadores basados en redes neuronales: el **Perceptrón Multicapa**, configurado con un límite de 1000 iteraciones y una tasa de aprendizaje inicial de 0.001 para mejorar la convergencia, y una **Red Neuronal RBF**, configurada con una capa oculta de 100 neuronas y la función de activación `tanh` para emular una red basada en funciones de base radial. Estos clasificadores se almacenan en otro diccionario, `classifiers`, para su evaluación posterior en los diferentes conjuntos de datos.

In [3]:
# Función para entrenar y evaluar un clasificador
def evaluate_classifier(name, classifier, X, y):
    results = {"Method": [], "Accuracy": [], "Confusion Matrix": []}

    # Hold-Out 70/30
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
    classifier.fit(X_train, y_train)
    y_pred = classifier.predict(X_test)
    accuracy = accuracy_score(y_test, y_pred)
    cm = confusion_matrix(y_test, y_pred)
    results["Method"].append("Hold-Out 70/30")
    results["Accuracy"].append(accuracy)
    results["Confusion Matrix"].append(cm)

    # 10-Fold Cross-Validation
    kf = KFold(n_splits=10, shuffle=True, random_state=42)
    cv_scores = cross_val_score(classifier, X, y, cv=kf)
    accuracy = cv_scores.mean()
    classifier.fit(X, y)
    y_pred = classifier.predict(X)
    cm = confusion_matrix(y, y_pred)
    results["Method"].append("10-Fold Cross-Validation")
    results["Accuracy"].append(accuracy)
    results["Confusion Matrix"].append(cm)

    # Leave-One-Out Cross-Validation
    loo = LeaveOneOut()
    loo_scores = cross_val_score(classifier, X, y, cv=loo)
    accuracy = loo_scores.mean()
    classifier.fit(X, y)
    y_pred = classifier.predict(X)
    cm = confusion_matrix(y, y_pred)
    results["Method"].append("Leave-One-Out")
    results["Accuracy"].append(accuracy)
    results["Confusion Matrix"].append(cm)

    return pd.DataFrame(results)

Esta función, llamada `evaluate_classifier`, tiene como objetivo entrenar y evaluar un clasificador utilizando tres métodos de validación diferentes: **Hold-Out 70/30**, **10-Fold Cross-Validation**, y **Leave-One-Out Cross-Validation**. 

1. **Hold-Out 70/30**: Divide los datos en un 70% para entrenamiento y un 30% para prueba. Luego, entrena el clasificador, realiza las predicciones sobre el conjunto de prueba y calcula la **precisión** (accuracy) y la **matriz de confusión** (confusion matrix). Estos resultados se almacenan en un diccionario bajo el método "Hold-Out 70/30".

2. **10-Fold Cross-Validation**: Divide los datos en 10 subconjuntos, entrenando y evaluando el modelo 10 veces, cada vez utilizando un subconjunto diferente como conjunto de prueba y los otros 9 como entrenamiento. La **precisión promedio** se calcula a partir de las 10 iteraciones, y se genera una matriz de confusión sobre todos los datos.

3. **Leave-One-Out Cross-Validation**: Similar a la validación cruzada de 10 pliegues, pero en este caso, el conjunto de entrenamiento consta de todos los ejemplos excepto uno, el cual se usa para prueba. Este proceso se repite para cada muestra, y la **precisión promedio** se calcula de todas las iteraciones.

In [4]:
# Evaluar cada dataset y clasificador
for dataset_name, dataset in datasets.items():
    X, y = dataset.data, dataset.target
    print(f"--- Dataset: {dataset_name} ---\n")

    for clf_name, clf in classifiers.items():
        print(f"{clf_name} Results:")
        clf_results = evaluate_classifier(clf_name, clf, X, y)
        print(clf_results, "\n")

--- Dataset: Iris ---

Perceptrón Multicapa Results:
                     Method  Accuracy                      Confusion Matrix
0            Hold-Out 70/30  1.000000  [[19, 0, 0], [0, 13, 0], [0, 0, 13]]
1  10-Fold Cross-Validation  0.973333  [[50, 0, 0], [0, 47, 3], [0, 0, 50]]
2             Leave-One-Out  0.973333  [[50, 0, 0], [0, 47, 3], [0, 0, 50]] 

Red Neuronal RBF Results:
                     Method  Accuracy                      Confusion Matrix
0            Hold-Out 70/30  1.000000  [[19, 0, 0], [0, 13, 0], [0, 0, 13]]
1  10-Fold Cross-Validation  0.973333  [[50, 0, 0], [0, 48, 2], [0, 1, 49]]
2             Leave-One-Out  0.973333  [[50, 0, 0], [0, 48, 2], [0, 1, 49]] 

--- Dataset: Wine ---

Perceptrón Multicapa Results:




                     Method  Accuracy                      Confusion Matrix
0            Hold-Out 70/30  0.981481  [[18, 1, 0], [0, 21, 0], [0, 0, 14]]
1  10-Fold Cross-Validation  0.943791  [[58, 1, 0], [0, 71, 0], [0, 0, 48]]
2             Leave-One-Out  0.938202  [[58, 1, 0], [0, 71, 0], [0, 0, 48]] 

Red Neuronal RBF Results:
                     Method  Accuracy                      Confusion Matrix
0            Hold-Out 70/30  0.944444  [[18, 1, 0], [2, 19, 0], [0, 0, 14]]
1  10-Fold Cross-Validation  0.943791  [[58, 1, 0], [0, 71, 0], [0, 0, 48]]
2             Leave-One-Out  0.949438  [[58, 1, 0], [0, 71, 0], [0, 0, 48]] 

--- Dataset: Breast Cancer ---

Perceptrón Multicapa Results:
                     Method  Accuracy        Confusion Matrix
0            Hold-Out 70/30  0.959064     [[57, 6], [1, 107]]
1  10-Fold Cross-Validation  0.931391  [[193, 19], [14, 343]]
2             Leave-One-Out  0.943761  [[193, 19], [14, 343]] 

Red Neuronal RBF Results:
                     Met

Este bloque de código tiene como propósito evaluar el rendimiento de los clasificadores definidos previamente (Perceptrón Multicapa y Red Neuronal RBF) en cada uno de los datasets cargados (Iris, Wine y Breast Cancer). 

1. **Iteración sobre los datasets**: El código recorre cada dataset en el diccionario `datasets`. Para cada conjunto de datos (`X`, `y`), se extraen las características (`X`) y las etiquetas (`y`). Luego, se imprime el nombre del dataset actual para indicar cuál está siendo procesado.

2. **Iteración sobre los clasificadores**: Luego, para cada clasificador en el diccionario `classifiers`, el código imprime el nombre del clasificador (`clf_name`) y evalúa su rendimiento utilizando la función `evaluate_classifier`. Esta función realiza el entrenamiento y la evaluación de cada clasificador mediante los tres métodos de validación definidos previamente (Hold-Out, Cross-Validation 10-Fold, y Leave-One-Out). Los resultados, que incluyen precisión y matrices de confusión, son impresos en la consola.

3. **Impresión de los resultados**: Los resultados de la evaluación de cada clasificador en cada dataset se almacenan en un `DataFrame` y se imprimen para su revisión.

Este bloque permite realizar una comparación directa de los clasificadores en los diferentes datasets y obtener un análisis detallado de su rendimiento bajo diversos métodos de validación.