# üìä Evaluaci√≥n de m√©tricas de desempe√±o en clasificaci√≥n

Este notebook muestra c√≥mo evaluar un modelo de clasificaci√≥n utilizando m√©tricas clave como **precisi√≥n (accuracy)**, **sensibilidad (recall)**, **especificidad** y **valor predictivo positivo (precision)**.

Usaremos un ejemplo simulado basado en un sistema de diagn√≥stico m√©dico aplicado a un conjunto de 100 pacientes.


## üß¨ Simulaci√≥n del dataset de pacientes

Creamos un peque√±o conjunto de datos con 100 pacientes, que incluye el diagn√≥stico real y la predicci√≥n del modelo.


In [None]:
import pandas as pd

# Crear datos simulados
data = []

# 20 pacientes realmente enfermos
data += [{'diagn√≥stico_real': 'enfermo', 'predicci√≥n_modelo': 'enfermo'} for _ in range(16)]  # VP
data += [{'diagn√≥stico_real': 'enfermo', 'predicci√≥n_modelo': 'sano'} for _ in range(4)]      # FN

# 80 pacientes realmente sanos
data += [{'diagn√≥stico_real': 'sano', 'predicci√≥n_modelo': 'sano'} for _ in range(70)]        # VN
data += [{'diagn√≥stico_real': 'sano', 'predicci√≥n_modelo': 'enfermo'} for _ in range(10)]     # FP

# Crear DataFrame
df = pd.DataFrame(data)
df.head()


## üß™ Matriz de confusi√≥n del modelo

A partir del dataset, reconstruimos la matriz de confusi√≥n manualmente.


In [None]:
# Contar los elementos de la matriz de confusi√≥n
VP = len(df[(df['diagn√≥stico_real'] == 'enfermo') & (df['predicci√≥n_modelo'] == 'enfermo')])
FN = len(df[(df['diagn√≥stico_real'] == 'enfermo') & (df['predicci√≥n_modelo'] == 'sano')])
FP = len(df[(df['diagn√≥stico_real'] == 'sano') & (df['predicci√≥n_modelo'] == 'enfermo')])
VN = len(df[(df['diagn√≥stico_real'] == 'sano') & (df['predicci√≥n_modelo'] == 'sano')])

print(f"VP = {VP}, FN = {FN}, FP = {FP}, VN = {VN}")


## üßÆ C√°lculo de m√©tricas

Aplicamos las f√≥rmulas para obtener las m√©tricas m√°s relevantes en clasificaci√≥n binaria.


In [None]:
# C√°lculo de m√©tricas
accuracy = (VP + VN) / (VP + VN + FP + FN)
recall = VP / (VP + FN)
specificity = VN / (VN + FP)
precision_ppv = VP / (VP + FP)

# Mostrar resultados
print(f"‚úî Precisi√≥n (Accuracy): {accuracy:.2%}")
print(f"üìà Sensibilidad (Recall): {recall:.2%}")
print(f"üõ°Ô∏è Especificidad: {specificity:.2%}")
print(f"üîç Valor Predictivo Positivo (Precision): {precision_ppv:.2%}")


## üìä Visualizaci√≥n de la matriz de confusi√≥n

Representamos gr√°ficamente los resultados para visualizar los aciertos y errores del modelo.


In [None]:
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np

# Crear matriz de confusi√≥n
conf_matrix = np.array([[VP, FN], [FP, VN]])
etiquetas = ['Enfermo', 'Sano']
df_cm = pd.DataFrame(conf_matrix, index=etiquetas, columns=etiquetas)

# Visualizar con heatmap
plt.figure(figsize=(6, 4))
sns.heatmap(df_cm, annot=True, fmt='d', cmap='Blues')
plt.title("üîç Matriz de Confusi√≥n")
plt.xlabel("Predicci√≥n del modelo")
plt.ylabel("Clase real")
plt.show()


## üß† Conclusiones

- El modelo tiene una **precisi√≥n general del 86%**, lo que indica un buen rendimiento global.
- La **sensibilidad del 80%** muestra que detecta correctamente a la mayor√≠a de los pacientes enfermos.
- La **especificidad del 87.5%** indica que evita la mayor√≠a de los falsos positivos (alarma innecesaria).
- La **precisi√≥n del 61.5%** revela que no todos los pacientes etiquetados como enfermos realmente lo est√°n.

Este an√°lisis permite reflexionar sobre el equilibrio entre **detectar correctamente (recall)** y **no alarmar en exceso (specificity)**.
