# Métricas para modelos de clasificación

### Ejemplo
- Supongamos que tenemos un conjunto de datos de 100 personas que han sido sometidas a pruebas para determinar si tienen cáncer o no. 
- El modelo de clasificación utilizado genera las siguientes predicciones:

- 60 personas realmente tienen cáncer (positivos reales).
- 40 personas no tienen cáncer (negativos reales).

El modelo hace las siguientes predicciones:

- Predice correctamente que 50 personas tienen cáncer.
- Predice incorrectamente que 10 personas tienen cáncer (falsos positivos).
- Predice incorrectamente que 5 personas no tienen cáncer (falsos negativos).
- Predice correctamente que 35 personas no tienen cáncer.

**¿Cómo representar de manera resumida estos resultados?**


| ID | Real: Cáncer | Predicción: Cáncer |
|----|--------------|--------------------|
| 1  | Sí           | Sí                 |
| 2  | No           | No                 |
| 3  | Sí           | Sí                 |
| 4  | No           | Sí                 |
| 5  | Sí           | No                 |
| 6  | No           | No                 |
| 7  | Sí           | Sí                 |
| 8  | Sí           | Sí                 |
| ...  | ...         | ...           |
| 100 | No           | Sí                 |

### Descripción de los Datos
- **ID**: Identificador único para cada persona.
- **Real: Cáncer**: Etiqueta real indicando si la persona tiene cáncer (Sí) o no (No).
- **Predicción: Cáncer**: Predicción del modelo indicando si la persona tiene cáncer (Sí) o no (No).

### Explicación de los Datos
- **ID 1**: La persona realmente tiene cáncer y el modelo predice correctamente (VP).
- **ID 2**: La persona no tiene cáncer y el modelo predice correctamente (VN).
- ** etc **


### Matriz de Confusión

La matriz de confusión basada en este escenario se vería así:

$
\begin{array}{c|cc}
& \text{Predicción: Cáncer} & \text{Predicción: No Cáncer} \\
\hline
\text{Real: Cáncer} & \text{VP = 50} & \text{FN = 10} \\
\text{Real: No Cáncer} & \text{FP = 5} & \text{VN = 35} \\
\end{array}
$



### Métricas de la Matriz de Confusión
Ahora, calculemos las métricas clave utilizando los valores de la matriz de confusión.

1. **Precisión (Accuracy)**:
   La precisión mide la proporción de predicciones correctas entre el total de predicciones.
   
   $
   \text{Precisión} = \frac{\text{VP} + \text{VN}}{\text{Total}} = \frac{50 + 35}{100} = 0.85
   $

2. **Precisión Positiva (Precision)**:
   La precisión positiva mide la proporción de verdaderos positivos entre todas las predicciones positivas.
   
   $
   \text{Precisión Positiva} = \frac{\text{VP}}{\text{VP} + \text{FP}} = \frac{50}{50 + 5} = 0.91
   $

3. **Sensibilidad (Recall) o Tasa de Verdaderos Positivos (TPR)**:
   La sensibilidad mide la proporción de verdaderos positivos entre todos los positivos reales.
  
   $
   \text{Sensibilidad} = \frac{\text{VP}}{\text{VP} + \text{FN}} = \frac{50}{50 + 10} = 0.83
   $

4. **Especificidad (Specificity) o Tasa de Verdaderos Negativos (TNR)**:
   La especificidad mide la proporción de verdaderos negativos entre todos los negativos reales.
   
   $
   \text{Especificidad} = \frac{\text{VN}}{\text{VN} + \text{FP}} = \frac{35}{35 + 5} = 0.88
   $

5. **Puntuación F1 (F1 Score)**:
   La puntuación F1 es la media armónica de la precisión positiva y la sensibilidad.
   
   $
   \text{F1 Score} = \frac{2 \cdot \text{Precisión Positiva} \cdot \text{Sensibilidad}}{\text{Precisión Positiva} + \text{Sensibilidad}} = \frac{2 \cdot 0.91 \cdot 0.83}{0.91 + 0.83} = 0.87
   $



### ¿Qué significan estas métricas?

### 1. Precisión (Accuracy)
**Definición**: La precisión es la proporción de predicciones correctas (verdaderos positivos y verdaderos negativos) entre el total de predicciones realizadas.

**Fórmula**:

$
\text{Precisión} = \frac{\text{VP} + \text{VN}}{\text{Total}}
$

**Explicación Conceptual**: 
La precisión es una métrica general que indica qué tan a menudo el clasificador es correcto en sus predicciones. Si un modelo tiene alta precisión, significa que la mayoría de las veces predice correctamente tanto los casos positivos como los negativos. Sin embargo, puede no ser suficiente en casos de clases desbalanceadas, ya que puede ser alta simplemente porque la clase mayoritaria está siendo predicha correctamente.

### 2. Precisión Positiva (Precision)
**Definición**: La precisión positiva mide la proporción de verdaderos positivos entre todas las predicciones positivas.

**Fórmula**:

$
\text{Precisión Positiva} = \frac{\text{VP}}{\text{VP} + \text{FP}}
$

**Explicación Conceptual**: 

- La precisión positiva nos dice cuán precisa es la predicción positiva del modelo. 
- Es especialmente importante cuando las consecuencias de un falso positivo son severas. 
- En otras palabras, un modelo con alta precisión positiva produce pocos falsos positivos. 
- Esta métrica es crucial en contextos donde una predicción positiva incorrecta puede tener graves consecuencias.

### 3. Sensibilidad (Recall) o Tasa de Verdaderos Positivos (TPR)
**Definición**: La sensibilidad, también conocida como recall o tasa de verdaderos positivos, mide la proporción de verdaderos positivos entre todos los casos positivos reales.

**Fórmula**:

$
\text{Sensibilidad} = \frac{\text{VP}}{\text{VP} + \text{FN}}
$

**Explicación Conceptual**: 

- La sensibilidad nos dice cuán bien el modelo es capaz de identificar los casos positivos. 
- Es crucial en situaciones donde es importante no pasar por alto ningún caso positivo (minimizar falsos negativos). 
- Un modelo con alta sensibilidad identifica la mayoría de los casos positivos, aunque puede tener un mayor número de falsos positivos.

### 4. Especificidad (Specificity) o Tasa de Verdaderos Negativos (TNR)
**Definición**: La especificidad mide la proporción de verdaderos negativos entre todos los casos negativos reales.

**Fórmula**:

$
\text{Especificidad} = \frac{\text{VN}}{\text{VN} + \text{FP}}
$

**Explicación Conceptual**: 

- La especificidad nos dice cuán bien el modelo es capaz de identificar los casos negativos. 
- Es importante en contextos donde es crucial minimizar los falsos positivos. 
- Un modelo con alta especificidad predice correctamente la mayoría de los casos negativos, aunque podría fallar en identificar algunos casos positivos.

### 5. Puntuación F1 (F1 Score)
**Definición**: La puntuación F1 es la media armónica de la precisión positiva y la sensibilidad.

**Fórmula**:

$
\text{F1 Score} = \frac{2 \cdot \text{Precisión Positiva} \cdot \text{Sensibilidad}}{\text{Precisión Positiva} + \text{Sensibilidad}}
$

**Explicación Conceptual**: 

- La puntuación F1 proporciona un balance entre la precisión positiva y la sensibilidad, y es útil cuando hay un desbalance entre las clases. 
- La media armónica penaliza los valores extremos más que la media aritmética, asegurando que ambos valores (precisión y sensibilidad) sean razonablemente altos. 
- Es especialmente útil en situaciones donde tanto los falsos positivos como los falsos negativos tienen un costo significativo y es necesario un balance entre ambos.

### Interpretación de las resultados del ejemplo


- **Precisión (Accuracy)**: 0.85 indica que el 85% de las predicciones del modelo fueron correctas.
- **Precisión Positiva (Precision)**: 0.91 indica que cuando el modelo predice que alguien tiene cáncer, es correcto el 91% de las veces.
- **Sensibilidad (Recall)**: 0.83 indica que el 83% de las personas que realmente tienen cáncer fueron correctamente identificadas por el modelo.
- **Especificidad (Specificity)**: 0.88 indica que el 88% de las personas que no tienen cáncer fueron correctamente identificadas por el modelo.
- **Puntuación F1 (F1 Score)**: 0.87 es una medida equilibrada que considera tanto la precisión como la sensibilidad, útil cuando hay un desequilibrio entre clases.

Estas métricas ayudan a evaluar el rendimiento del modelo de clasificación desde diferentes perspectivas, proporcionando una comprensión más completa de su efectividad.

##¢ Es importante comprender:

1. **Pregunta**: ¿Qué métrica sería más importante si queremos minimizar el número de personas con cáncer que no son diagnosticadas correctamente (falsos negativos)?
   - **Explicación**: En el contexto del diagnóstico de cáncer, es crítico identificar correctamente a los pacientes con cáncer para que puedan recibir tratamiento. 
   - La **sensibilidad (recall)** mide la proporción de verdaderos positivos (personas con cáncer correctamente diagnosticadas) entre todos los casos reales de cáncer, por lo que es una métrica clave para este objetivo.

2. **Pregunta**: ¿Por qué la precisión positiva (precision) podría ser importante cuando se considera el diagnóstico de cáncer, y cómo se relaciona con los falsos positivos?
   - **Explicación**: La **precisión positiva (precision)** mide la proporción de verdaderos positivos entre todas las predicciones positivas. 
   - Es importante porque un alto número de falsos positivos (personas sin cáncer diagnosticadas incorrectamente como si tuvieran cáncer) podría causar ansiedad innecesaria y llevar a pruebas adicionales costosas e invasivas. 
   - La precisión positiva nos ayuda a entender cuán confiables son nuestras predicciones positivas.

3. **Pregunta**: ¿Qué consecuencias podría tener un modelo con alta especificidad pero baja sensibilidad en el diagnóstico de cáncer?
   - **Explicación**: La **especificidad** mide la proporción de verdaderos negativos (personas sin cáncer correctamente diagnosticadas) entre todos los casos reales sin cáncer. 
   - Un modelo con alta especificidad pero baja sensibilidad identificaría correctamente a la mayoría de las personas sin cáncer, pero fallaría en diagnosticar a muchas personas con cáncer. 
   - Esto podría resultar en una falta de tratamiento para pacientes con cáncer, lo cual es muy peligroso.

4. **Pregunta**: En el contexto del diagnóstico de cáncer, ¿por qué podría ser preferible una puntuación F1 alta en comparación con solo una alta precisión o sensibilidad?
   - **Explicación**: La **puntuación F1** es la media armónica de la precisión y la sensibilidad, proporcionando un balance entre ambas. 
   - En el diagnóstico de cáncer, tanto identificar correctamente a los pacientes con cáncer (alta sensibilidad) como evitar diagnósticos incorrectos de cáncer (alta precisión) son importantes. Una puntuación F1 alta indica un buen balance entre ambas métricas, lo cual es crucial para un diagnóstico confiable y efectivo.

5. **Pregunta**: ¿Cómo podría afectar la prevalencia del cáncer en la población (proporción de casos positivos) la elección de la métrica más relevante?
   - **Explicación**: Si el cáncer es relativamente raro en la población, 
   - la **precisión** (accuracy) podría ser alta simplemente porque la mayoría de las personas no tienen cáncer. 
   - Sin embargo, en tal caso, métricas como la **sensibilidad** y la **precisión positiva** se vuelven más críticas, ya que queremos asegurar que no estamos pasando por alto casos de cáncer ni generando muchos falsos positivos.

6. **Pregunta**: Si el objetivo del modelo es garantizar que casi todas las personas con cáncer sean identificadas, incluso si eso significa que algunas personas sin cáncer sean diagnosticadas incorrectamente, ¿qué métrica sería la más relevante?
   - **Explicación**: En este caso, la **sensibilidad (recall)** sería la métrica más relevante, ya que mide la capacidad del modelo para identificar correctamente todos los casos de cáncer, minimizando los falsos negativos. 
   - Este enfoque puede ser crucial en situaciones donde es mejor realizar más pruebas adicionales a costa de tener algunos falsos positivos.