## Universidad Autonoma de Aguascalientes
## Departamento: Ciencias de la computacion
## Carrera: Ingenieria en Computacion Inteligente
## Curso: Machine  y Deep Learning
## Maestro: Dr. Francisco Javier Luna Rosas
## Alumno: Guillermo Gonzalez Lara
 Semestre: Enero_Junio del 2026

# Practica 10: Analisis Comparativo entre métodos de clasificación
## Un modelo de entrenamiento y prueba basado en una tabla de datos es un enfoque utilizado en aprendizaje automático

## Importamos librerías

In [1]:
import pandas as pd
import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.svm import SVC
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import confusion_matrix, accuracy_score, precision_score, recall_score

## 1. Preparación de los datos

In [2]:
# Cargamos el dataset
iris = load_iris()
X = iris.data
y = iris.target

# Para hacer el problema binario y un poco más desafiante,
# vamos a filtrar y quedarnos solo con las clases 1 (Versicolor) y 2 (Virginica).
# Ignoraremos la clase 0 (Setosa).
mask = y != 0
X_filtered = X[mask]
y_filtered = y[mask]

y_binary = y_filtered

## Dividimos en conjunto de entrenamiento (70%) y prueba (30%)

In [3]:
# Usamos random_state para que los resultados sean reproducibles.
X_train, X_test, y_train, y_test = train_test_split(
    X_filtered, y_binary, test_size=0.3, random_state=42, stratify=y_binary
)

## 2. Definición de los 3 Clasificadores

In [4]:
modelos = [
    ('Random Forest', RandomForestClassifier(random_state=42)),
    ('SVM', SVC(random_state=42)),
    ('KNN', KNeighborsClassifier(n_neighbors=5))
]

# Lista para guardar los resultados de cada modelo
resultados = []

## 3. Entrenamiento y Cálculo de Métricas

In [5]:
print("Entrenando modelos y calculando métricas...\n")

for nombre, modelo in modelos:
    # 1. Entrenar el modelo
    modelo.fit(X_train, y_train)
    
    # 2. Realizar predicciones en el conjunto de prueba
    y_pred = modelo.predict(X_test)
    
    # 3. Obtener la Matriz de Confusión
    # Esta es la clave para calcular todas las métricas detalladas.
    # scikit-learn la devuelve en el orden: [[TN, FP], [FN, TP]]
    tn, fp, fn, tp = confusion_matrix(y_test, y_pred).ravel()
    
    # 4. Calcular las Métricas (a mano para coincidir con la tabla)
    
    # Precisión Global (Accuracy)
    acc = accuracy_score(y_test, y_pred)
    
    # Error Global
    error = 1.0 - acc
    
    # Precisión Positiva (PP) -> Precision
    # (TP / total predichos positivos)
    pp = tp / (tp + fp) if (tp + fp) > 0 else 0
    
    # Precisión Negativa (PN) -> Valor Predictivo Negativo
    # (TN / total predichos negativos)
    pn = tn / (tn + fn) if (tn + fn) > 0 else 0
    
    # Tasa de Falsos Positivos (FP) -> False Positive Rate
    # (FP / total reales negativos)
    fpr = fp / (fp + tn) if (fp + tn) > 0 else 0
    
    # Tasa de Falsos Negativos (FN) -> False Negative Rate
    # (FN / total reales positivos)
    fnr = fn / (fn + tp) if (fn + tp) > 0 else 0
    
    # Asertividad Positiva (AP) -> Recall / Sensibilidad
    # (TP / total reales positivos)
    ap = tp / (tp + fn) if (tp + fn) > 0 else 0
    
    # Asertividad Negativa (AN) -> Especificidad
    # (TN / total reales negativos)
    an = tn / (tn + fp) if (tn + fp) > 0 else 0
    
    # Guardamos todo en un diccionario para este modelo
    resultados.append({
        'Modelo': nombre,
        'Precisión Global': acc,
        'Error Global': error,
        'Precisión Positiva (PP)': pp,
        'Precisión Negativa (PN)': pn,
        'Falsos Positivos (FP)': fpr,
        'Falsos Negativos (FN)': fnr,
        'Asertividad Positiva (AP)': ap,
        'Asertividad Negativa (AN)': an
    })

Entrenando modelos y calculando métricas...



## 4. Creación y Visualización de la Tabla

In [6]:
# Convertimos la lista de resultados en un DataFrame
df_resultados = pd.DataFrame(resultados)

# Ponemos el nombre del modelo como índice de la tabla
df_resultados.set_index('Modelo', inplace=True)

# Redondeamos a 6 decimales para que se parezca a la imagen de ejemplo
df_resultados = df_resultados.round(6)

# Mostramos la tabla resultante
print("--- Tabla Comparativa de Clasificadores ---")
display(df_resultados)

--- Tabla Comparativa de Clasificadores ---


Unnamed: 0_level_0,Precisión Global,Error Global,Precisión Positiva (PP),Precisión Negativa (PN),Falsos Positivos (FP),Falsos Negativos (FN),Asertividad Positiva (AP),Asertividad Negativa (AN)
Modelo,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
Random Forest,0.866667,0.133333,0.923077,0.823529,0.066667,0.2,0.8,0.933333
SVM,0.933333,0.066667,1.0,0.882353,0.0,0.133333,0.866667,1.0
KNN,0.866667,0.133333,0.823529,0.923077,0.2,0.066667,0.933333,0.8
