### Métricas de Evaluación

Una vez que has entrenado un modelo, es crucial evaluar su rendimiento para saber si es "bueno" para tu problema. Para ello, utilizamos un conjunto de métricas que nos dan una imagen clara de cómo está funcionando.

#### Matriz de Confusión

La **Matriz de Confusión** es la base para entender las métricas de clasificación. Es una tabla que resume los resultados de las predicciones del modelo comparándolas con los valores reales. Se compone de cuatro celdas clave:

* **Verdaderos Positivos (VP):** El modelo predijo `Positivo` y el valor real era `Positivo`.
* **Verdaderos Negativos (VN):** El modelo predijo `Negativo` y el valor real era `Negativo`.
* **Falsos Positivos (FP):** El modelo predijo `Positivo`, pero el valor real era `Negativo`. (Error de Tipo I)
* **Falsos Negativos (FN):** El modelo predijo `Negativo`, pero el valor real era `Positivo`. (Error de Tipo II)



|                 | Predicción: Positiva| Predicción: Negativa |
|-----------------|---------------------|----------------------|
| Real: Positiva  | Verdaderos Positivos| Falsos Negativos     |
| Real: Negativa  | Falsos Positivos    | Verdaderos Negativos |


#### Precisión (Accuracy)

La **Precisión (Accuracy)** es la métrica más simple. Mide la proporción de predicciones correctas sobre el total de predicciones. Es intuitiva, pero puede ser engañosa si el dataset está desequilibrado.

$$Accuracy = \frac{VP + VN}{VP + VN + FP + FN}$$

#### Sensibilidad (Recall) y Precisión (Precision)

Estas dos métricas son más informativas que la Precisión, ya que se enfocan en los errores de una manera más específica:

* **Sensibilidad (Recall):** Mide la capacidad del modelo para encontrar todos los positivos reales. Responde a la pregunta: "De todos los casos positivos reales, ¿cuántos identificó correctamente mi modelo?".

$$Recall = \frac{VP}{VP + FN}$$

* **Precisión (Precision):** Mide la proporción de las predicciones positivas que fueron realmente correctas. Responde a la pregunta: "De todas las veces que mi modelo predijo `Positivo`, ¿cuántas veces acertó?".

$$Precision = \frac{VP}{VP + FP}$$

El equilibrio entre `Recall` y `Precision` es fundamental. A menudo, mejorar una métrica puede ir en detrimento de la otra.

#### F1-Score

El **F1-Score** es una medida que combina la **Sensibilidad** y la **Precisión** en un solo valor. Es la media armónica de ambas y es especialmente útil cuando el dataset está desequilibrado, ya que penaliza los modelos que tienen una de las dos métricas muy bajas. Un F1-Score de 1.0 es perfecto.

$$F1-Score = 2 \cdot \frac{Precision \cdot Recall}{Precision + Recall}$$

#### Curva ROC y AUC

La **Curva ROC (Receiver Operating Characteristic)** y el **Área bajo la Curva (AUC)** son métricas importantes para evaluar el rendimiento de un clasificador.

* La **Curva ROC** grafica la tasa de verdaderos positivos (Sensibilidad) versus la tasa de falsos positivos (1 - Tasa de Verdaderos Negativos) para diferentes umbrales de clasificación.
* El **AUC** es el área total debajo de la curva ROC. Un modelo con un AUC de 1.0 es perfecto, mientras que un modelo con un AUC de 0.5 es tan bueno como un clasificador aleatorio. Un AUC alto indica que el modelo es capaz de distinguir bien entre las clases positivas y negativas.

Estas métricas, especialmente en conjunto, te dan una visión completa de la efectividad de tu modelo más allá de la simple precisión, lo que es vital para la toma de decisiones en problemas del mundo real.