### Evaluación de Modelos: Parte Teórica de la Métrica Precisión

La **precisión** es una métrica clave para evaluar el rendimiento de un modelo de clasificación. 
Su objetivo principal es medir qué tan confiables son las predicciones positivas realizadas por el modelo. 
Es especialmente útil en escenarios donde los **falsos positivos** tienen un impacto significativo, como en detección de fraudes o clasificación de correos como spam.

---

#### Definición Formal

La precisión se calcula como:

$$
\text{Precisión} = \frac{\text{True Positives (TP)}}{\text{True Positives (TP)} + \text{False Positives (FP)}}
$$

---

#### Componentes del Cálculo

- **True Positives (TP):** Instancias correctamente clasificadas como positivas.
- **False Positives (FP):** Instancias clasificadas como positivas de manera incorrecta.

---

#### Intuición

- Una alta precisión indica que cuando el modelo predice una clase positiva, lo hace con mucha certeza.
- Una baja precisión sugiere que el modelo clasifica erróneamente muchas instancias negativas como positivas.

---

#### Ejemplo Práctico

Imagina que un modelo clasifica correos como **Spam** (positivo) o **No Spam** (negativo). Si el modelo identifica 50 correos como Spam, pero 10 de ellos son correos normales, la precisión sería:

$$
\text{Precisión} = \frac{40}{40 + 10} = 0.8 \, (80\%)
$$

---

#### Precisión en Clasificación Multiclase

En problemas multiclase, se calcula la precisión para cada clase individualmente usando el enfoque **uno contra todos (One-vs-All)**. Luego, se puede:

1. **Reportar la precisión de cada clase.**
2. **Calcular un promedio** (ponderado o macro) para obtener una visión general del modelo.

---

#### Fórmulas de Promedio:

- **Promedio Macro:** Promedio simple de las precisiones de todas las clases.
- **Promedio Ponderado:** Promedio de las precisiones, ponderado por el soporte (número de instancias) de cada clase.

---

#### Usos y Limitaciones

- **Usos:** Escenarios donde los falsos positivos son costosos (e.g., diagnóstico médico, sistemas de recomendación).
- **Limitación:** La precisión no considera los falsos negativos. Si el modelo omite muchas instancias positivas, podría tener una alta precisión pero un bajo desempeño general.

---

### Detalle de True Positives, False Positives, False Negatives y True Negatives

#### Definiciones

- **True Positives (TP):** Predicciones correctas de la clase positiva.
- **False Positives (FP):** Predicciones incorrectas donde se clasificó como positivo algo que no lo es.
- **False Negatives (FN):** Casos donde la etiqueta real es positiva, pero el modelo predijo negativo.
- **True Negatives (TN):** Predicciones correctas de la clase negativa.

---

#### Ejemplo: Clasificación Binaria

Supongamos un modelo que clasifica correos como **Spam** o **No Spam** con los siguientes resultados:

| Índice | Etiqueta Real | Predicción |
|--------|---------------|------------|
| 1      | Spam          | Spam       |
| 2      | No Spam       | Spam       |
| 3      | Spam          | No Spam    |
| 4      | No Spam       | No Spam    |
| 5      | Spam          | Spam       |

Cálculo de métricas:
- TP = 2 (índices 1 y 5)
- FP = 1 (índice 2)
- FN = 1 (índice 3)
- TN = 1 (índice 4)

---

#### Cálculo Manual en Python
---

In [11]:
# Datos simulados
y_test_bin = [1, 0, 1, 0, 1]  # Etiquetas reales (1: Spam, 0: No Spam)
y_pred_bin = [1, 1, 0, 0, 1]  # Predicciones del modelo

# Cálculo manual
TP = sum((yt == 1) and (yp == 1) for yt, yp in zip(y_test_bin, y_pred_bin))
FP = sum((yt == 0) and (yp == 1) for yt, yp in zip(y_test_bin, y_pred_bin))
FN = sum((yt == 1) and (yp == 0) for yt, yp in zip(y_test_bin, y_pred_bin))
TN = sum((yt == 0) and (yp == 0) for yt, yp in zip(y_test_bin, y_pred_bin))

# Cálculo manual de precisión
precision_manual = TP / (TP + FP) if (TP + FP) > 0 else 0

# Mostrar resultados manuales
print(f"TP: {TP}, FP: {FP}, FN: {FN}, TN: {TN}")
print(f"Precisión (manual): {precision_manual:.2f}")

# Cálculo usando sklearn
from sklearn.metrics import precision_score
precision_bin = precision_score(y_test_bin, y_pred_bin)
print(f"Precisión (sklearn): {precision_bin:.2f}")


TP: 2, FP: 1, FN: 1, TN: 1
Precisión (manual): 0.67
Precisión (sklearn): 0.67


#### Clasificación Multiclase

Con las clases **Gato**, **Perro** y **Conejo**, consideramos 10 registros:

| Índice | Etiqueta Real | Predicción |
|--------|---------------|------------|
| 1      | Gato          | Gato       |
| 2      | Perro         | Conejo     |
| 3      | Conejo        | Perro      |
| 4      | Gato          | Gato       |
| 5      | Perro         | Perro      |
| 6      | Conejo        | Conejo     |
| 7      | Gato          | Perro      |
| 8      | Perro         | Gato       |
| 9      | Conejo        | Conejo     |
| 10     | Perro         | Perro      |

---

#### Cálculo Manual y con `sklearn` en Python
---


In [15]:
from sklearn.metrics import precision_score

# Datos simulados
y_test_multi = ['Gato', 'Perro', 'Conejo', 'Gato', 'Perro', 'Conejo', 'Gato', 'Perro', 'Conejo', 'Perro']
y_pred_multi = ['Gato', 'Conejo', 'Perro', 'Gato', 'Perro', 'Conejo', 'Perro', 'Gato', 'Conejo', 'Perro']

# Cálculo manual por clase
clases = ['Gato', 'Perro', 'Conejo']
resultados = {}
precision_macro_manual = 0
precision_weighted_manual = 0
total_soporte = 0

for clase in clases:
    TP = sum((yt == clase) and (yp == clase) for yt, yp in zip(y_test_multi, y_pred_multi))
    FP = sum((yt != clase) and (yp == clase) for yt, yp in zip(y_test_multi, y_pred_multi))
    FN = sum((yt == clase) and (yp != clase) for yt, yp in zip(y_test_multi, y_pred_multi))
    soporte = sum((yt == clase) for yt in y_test_multi)  # Total de instancias reales de la clase
    
    precision_manual = TP / (TP + FP) if (TP + FP) > 0 else 0
    precision_macro_manual += precision_manual
    precision_weighted_manual += precision_manual * soporte
    total_soporte += soporte
    
    resultados[clase] = {'TP': TP, 'FP': FP, 'FN': FN, 'Soporte': soporte, 'Precisión (manual)': precision_manual}

# Calcular precisiones macro y ponderada manualmente
precision_macro_manual /= len(clases)
precision_weighted_manual /= total_soporte

# Mostrar resultados manuales
for clase, metricas in resultados.items():
    print(f"Clase: {clase}, Métricas: {metricas}")

print(f"\nPrecisión Macro (manual): {precision_macro_manual:.2f}")
print(f"Precisión Ponderada (manual): {precision_weighted_manual:.2f}")

# Usando sklearn
precision_macro = precision_score(y_test_multi, y_pred_multi, average='macro', labels=clases)
precision_weighted = precision_score(y_test_multi, y_pred_multi, average='weighted', labels=clases)

print(f"\nPrecisión Macro (sklearn): {precision_macro:.2f}")
print(f"Precisión Ponderada (sklearn): {precision_weighted:.2f}")


Clase: Gato, Métricas: {'TP': 2, 'FP': 1, 'FN': 1, 'Soporte': 3, 'Precisión (manual)': 0.6666666666666666}
Clase: Perro, Métricas: {'TP': 2, 'FP': 2, 'FN': 2, 'Soporte': 4, 'Precisión (manual)': 0.5}
Clase: Conejo, Métricas: {'TP': 2, 'FP': 1, 'FN': 1, 'Soporte': 3, 'Precisión (manual)': 0.6666666666666666}

Precisión Macro (manual): 0.61
Precisión Ponderada (manual): 0.60

Precisión Macro (sklearn): 0.61
Precisión Ponderada (sklearn): 0.60
