# 📊 Evaluación de métricas de desempeño en clasificación

Este notebook muestra cómo evaluar un modelo de clasificación utilizando métricas clave como **precisión (accuracy)**, **sensibilidad (recall)**, **especificidad** y **valor predictivo positivo (precision)**.

Usaremos un ejemplo simulado basado en un sistema de diagnóstico médico aplicado a un conjunto de 100 pacientes.


## 🧬 Simulación del dataset de pacientes

Creamos un pequeño conjunto de datos con 100 pacientes, que incluye el diagnóstico real y la predicción del modelo.


In [None]:
import pandas as pd

# Crear datos simulados
data = []

# 20 pacientes realmente enfermos
data += [{'diagnóstico_real': 'enfermo', 'predicción_modelo': 'enfermo'} for _ in range(16)]  # VP
data += [{'diagnóstico_real': 'enfermo', 'predicción_modelo': 'sano'} for _ in range(4)]      # FN

# 80 pacientes realmente sanos
data += [{'diagnóstico_real': 'sano', 'predicción_modelo': 'sano'} for _ in range(70)]        # VN
data += [{'diagnóstico_real': 'sano', 'predicción_modelo': 'enfermo'} for _ in range(10)]     # FP

# Crear DataFrame
df = pd.DataFrame(data)
df.head()


## 🧪 Matriz de confusión del modelo

A partir del dataset, reconstruimos la matriz de confusión manualmente.


In [None]:
# Contar los elementos de la matriz de confusión
VP = len(df[(df['diagnóstico_real'] == 'enfermo') & (df['predicción_modelo'] == 'enfermo')])
FN = len(df[(df['diagnóstico_real'] == 'enfermo') & (df['predicción_modelo'] == 'sano')])
FP = len(df[(df['diagnóstico_real'] == 'sano') & (df['predicción_modelo'] == 'enfermo')])
VN = len(df[(df['diagnóstico_real'] == 'sano') & (df['predicción_modelo'] == 'sano')])

print(f"VP = {VP}, FN = {FN}, FP = {FP}, VN = {VN}")


## 🧮 Cálculo de métricas

Aplicamos las fórmulas para obtener las métricas más relevantes en clasificación binaria.


In [None]:
# Cálculo de métricas
accuracy = (VP + VN) / (VP + VN + FP + FN)
recall = VP / (VP + FN)
specificity = VN / (VN + FP)
precision_ppv = VP / (VP + FP)

# Mostrar resultados
print(f"✔ Precisión (Accuracy): {accuracy:.2%}")
print(f"📈 Sensibilidad (Recall): {recall:.2%}")
print(f"🛡️ Especificidad: {specificity:.2%}")
print(f"🔍 Valor Predictivo Positivo (Precision): {precision_ppv:.2%}")


## 📊 Visualización de la matriz de confusión

Representamos gráficamente los resultados para visualizar los aciertos y errores del modelo.


In [None]:
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np

# Crear matriz de confusión
conf_matrix = np.array([[VP, FN], [FP, VN]])
etiquetas = ['Enfermo', 'Sano']
df_cm = pd.DataFrame(conf_matrix, index=etiquetas, columns=etiquetas)

# Visualizar con heatmap
plt.figure(figsize=(6, 4))
sns.heatmap(df_cm, annot=True, fmt='d', cmap='Blues')
plt.title("🔍 Matriz de Confusión")
plt.xlabel("Predicción del modelo")
plt.ylabel("Clase real")
plt.show()


## 🧠 Conclusiones

- El modelo tiene una **precisión general del 86%**, lo que indica un buen rendimiento global.
- La **sensibilidad del 80%** muestra que detecta correctamente a la mayoría de los pacientes enfermos.
- La **especificidad del 87.5%** indica que evita la mayoría de los falsos positivos (alarma innecesaria).
- La **precisión del 61.5%** revela que no todos los pacientes etiquetados como enfermos realmente lo están.

Este análisis permite reflexionar sobre el equilibrio entre **detectar correctamente (recall)** y **no alarmar en exceso (specificity)**.
