### Métricas de clasificación

Para el caso de los modelos de clasificación, no siempre la **precisión** es un modelo útil.

### Ejemplo:

#### Desequilibrio de clases

Clasificación para predecir transacciones bancarias fraudulentas
El 99 % de las transacciones son legítimas; el 1 % son fraudulentas
Se podría construir un clasificador que prediga que ninguna transacción es fraudulenta

¡99 % de precisión!

- Pero es pésimo para predecir transacciones fraudulentas.
- Falla en su propósito original.
- Desequilibrio de clases: Frecuencia desigual de clases
- Se necesita una forma diferente de evaluar el rendimiento.

#### Matriz de confusión para evaluar el rendimiento de clasificación

- **Matriz de confusión:**

|                         | **Predicción: Legítimo** | **Predicción: Fraudulento** |
|-------------------------|--------------------------|------------------------------|
| **Real: Legítimo**      | Verdadero Negativo       | Falso Positivo               |
| **Real: Fraudulento**   | Falso Negativo           | Verdadero Positivo           |

**Definiciones:**

- **Verdadero Negativo (VN):** Se predice correctamente que es legítimo.
- **Falso Positivo (FP):** Se predice que es fraudulento pero en realidad es legítimo.
- **Falso Negativo (FN):** Se predice que es legítimo pero en realidad es fraudulento.
- **Verdadero Positivo (VP):** Se predice correctamente que es fraudulento.

### Métricas de Evaluación Basadas en la Matriz de Confusión

La matriz de confusión tiene los siguientes componentes:

- **VP**: Verdaderos Positivos  
- **VN**: Verdaderos Negativos  
- **FP**: Falsos Positivos  
- **FN**: Falsos Negativos  

---

#### 1. **Precisión (Accuracy)**

> Mide el porcentaje de predicciones correctas sobre el total.

**Fórmula:**

`Accuracy = (VP + VN) / (VP + VN + FP + FN)`

---

#### 2. **Precisión Positiva (Precision)**

> Mide la proporción de verdaderos positivos sobre todos los que fueron clasificados como positivos.

**Fórmula:**

`Precision = VP / (VP + FP)`

---

#### 3. **Exhaustividad o Sensibilidad (Recall / Sensitivity / TPR)**

> Mide la proporción de verdaderos positivos detectados entre todos los positivos reales.

**Fórmula:**

`Recall = VP / (VP + FN)`

---

#### 4. **Especificidad (Specificity / TNR)**

> Mide la proporción de verdaderos negativos entre todos los negativos reales.

**Fórmula:**

`Specificity = VN / (VN + FP)`

---

#### 5. **Tasa de Falsos Positivos (FPR)**

> Mide el porcentaje de negativos reales que fueron mal clasificados como positivos.

**Fórmula:**

`FPR = FP / (FP + VN)`

---

#### 6. **Tasa de Falsos Negativos (FNR)**

> Mide el porcentaje de positivos reales que fueron mal clasificados como negativos.

**Fórmula:**

`FNR = FN / (FN + VP)`

---

#### 7. **F1-Score**

> Es la media armónica entre precisión y recall. Es útil cuando hay desequilibrio entre clases.

**Fórmula:**

`F1 = 2 * (Precision * Recall) / (Precision + Recall)`

---

#### 8. **Valor Predictivo Negativo (NPV)**

> Mide la proporción de verdaderos negativos sobre todos los clasificados como negativos.

**Fórmula:**

`NPV = VN / (VN + FN)`

---

#### 9. **Tasa de Clasificación Correcta (CCR)**

> Similar a accuracy pero a veces se usa en contextos más técnicos.

**Fórmula:**

`CCR = (VP + VN) / (VP + VN + FP + FN)`

---

#### 10. **Balanced Accuracy**

> Media de sensibilidad y especificidad. Útil con clases desbalanceadas.

**Fórmula:**

`Balanced Accuracy = (Recall + Specificity) / 2`

```python
from sklearn.metrics import classification_report, confusion_matrix
from sklearn.model_selection import train_test_split

knn = KNeignborsClassifier(n_neighbors = 7)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.4, random_state = 42)
knn.fit(X_train, y_train)
y_pred = knn.predict(X_test)

print(confussion_matrix(y_test, y_pred))
print(classification_report(y_test, y_pred))
```

### Ejemplo:


#### Informe de Clasificación

              precision    recall  f1-score   support

           0       0.86      0.99      0.92      1117
           1       0.76      0.16      0.26       217

    accuracy                           0.81      1334
   macro avg       0.81      0.57      0.59      1334
weighted avg       0.84      0.85      0.81      1334


#### Interpretación

Columnas:
- **Precisión**

Proporción de predicciones positivas que fueron correctas.
- Ej.: clase 0 → 0.86: el 86% de las veces que el modelo predijo clase 0, acertó.

- **Recall (sensibilidad)**

Proporción de verdaderos positivos detectados.
- Ej.: clase 1 → 0.16: solo el 16% de los verdaderos positivos clase 1 fueron detectados.

- **F1-score**

Media armónica entre precision y recall. Penaliza los extremos.
- Ej.: clase 1 → 0.26: baja calidad de predicción para esa clase.

- **Support**
  
Número de muestras reales de cada clase.
- Ej.: clase 0 tiene 1117 instancias reales; clase 1, 217.

#### Conclusión

- El modelo predice muy bien la clase 0 (alta precisión y recall).
- Tiene graves dificultades con la clase 1 (recall = 0.16).
- Aunque el accuracy general es 81%, el modelo no es fiable para identificar correctamente la clase 1.