# Lab 07: Práctica de Métricas de Evaluación y Matriz de Confusión

En esta práctica aprenderemos a:
1. Calcular e interpretar la matriz de confusión
2. Calcular métricas de clasificación (Accuracy, Precision, Recall, F1-Score)
3. Elegir métricas apropiadas según el problema
4. Implementar validación cruzada
5. Evaluar modelos en datasets balanceados y desbalanceados

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import make_classification, make_blobs
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression

# Importar nuestras implementaciones
import sys
sys.path.append('..')
from codigo.metricas import MatrizConfusion, MetricasClasificacion, ValidacionCruzada

# Configuración
np.random.seed(42)
plt.style.use('seaborn-v0_8-darkgrid')
%matplotlib inline

## Parte 1: Entendiendo la Matriz de Confusión

In [None]:
# Ejemplo simple: Clasificación binaria
y_true = np.array([1, 0, 1, 1, 0, 1, 0, 0, 1, 0])
y_pred = np.array([1, 0, 1, 0, 0, 1, 0, 0, 1, 0])

print("Etiquetas Verdaderas:", y_true)
print("Predicciones:        ", y_pred)

# Crear matriz de confusión
matriz = MatrizConfusion(y_true, y_pred, labels=['Negativo', 'Positivo'])
print("\nMatriz de Confusión:")
print(matriz.matriz)

tp, fp, fn, tn = matriz.obtener_tp_fp_fn_tn()
print(f"\nTP: {tp}, FP: {fp}, FN: {fn}, TN: {tn}")

# Visualizar
matriz.visualizar()

## Parte 2: Calcular Métricas

In [None]:
# Calcular métricas manualmente
total = tp + fp + fn + tn
accuracy = (tp + tn) / total
precision = tp / (tp + fp) if (tp + fp) > 0 else 0
recall = tp / (tp + fn) if (tp + fn) > 0 else 0
f1 = 2 * (precision * recall) / (precision + recall) if (precision + recall) > 0 else 0

print("Métricas Calculadas:")
print(f"Accuracy:  {accuracy:.3f}")
print(f"Precision: {precision:.3f}")
print(f"Recall:    {recall:.3f}")
print(f"F1-Score:  {f1:.3f}")

# Verificar con implementación
reporte = MetricasClasificacion.reporte_clasificacion_binaria(y_true, y_pred)
print("\nVerificación:")
print(f"Accuracy:  {reporte['accuracy']:.3f}")
print(f"Precision: {reporte['precision']:.3f}")
print(f"Recall:    {reporte['recall']:.3f}")
print(f"F1-Score:  {reporte['f1_score']:.3f}")

## Parte 3: Dataset Balanceado vs Desbalanceado

In [None]:
# Crear dataset desbalanceado (95% clase 0, 5% clase 1)
X_desb, y_desb = make_classification(
    n_samples=1000,
    n_features=20,
    n_classes=2,
    weights=[0.95, 0.05],
    random_state=42
)

print(f"Clase 0: {np.sum(y_desb == 0)} ({np.sum(y_desb == 0) / len(y_desb) * 100:.1f}%)")
print(f"Clase 1: {np.sum(y_desb == 1)} ({np.sum(y_desb == 1) / len(y_desb) * 100:.1f}%)")

# Entrenar modelo
X_train, X_test, y_train, y_test = train_test_split(X_desb, y_desb, test_size=0.2, random_state=42)
modelo = LogisticRegression(max_iter=1000)
modelo.fit(X_train, y_train)
y_pred = modelo.predict(X_test)

# Evaluar
reporte = MetricasClasificacion.reporte_clasificacion_binaria(y_test, y_pred)
print(f"\nAccuracy:  {reporte['accuracy']:.3f}")
print(f"Precision: {reporte['precision']:.3f}")
print(f"Recall:    {reporte['recall']:.3f}")
print(f"F1-Score:  {reporte['f1_score']:.3f}")

# Matriz de confusión
matriz = MatrizConfusion(y_test, y_pred, labels=['Clase 0', 'Clase 1'])
matriz.visualizar()

## Resumen

Hemos aprendido:
- La matriz de confusión es fundamental para entender errores
- Accuracy puede ser engañoso en datasets desbalanceados
- F1-Score balancea Precision y Recall
- Elegir métricas según el costo de los errores