**Conceptos de Clasificación binaria**

En clasificación binaria, tenemos el concepto de casos negativos (clase 0, en el caso del dataset de cancer de mama serian los casos donde el cancer es benigno) y casos positivos (clase 1, en el caso del dataset de cancer de mama serían los casos donde el cancer es maligno). Positivo y negativo no significa que el resultado sea bueno o malo, simplemente que la detección de un cancer maligno se active o no.

- Casos positivos: Casos donde la clase es 1 (cánceres malignos)
- Casos negativos: Casos donde la clase es 0 (cánceres benignos)

Esto nos lleva a computar 4 tipos de observaciones, explicados como ejemplos del dataset del cancer de mama.

- Verdaderos Positivos(True positives), serían las imágenes con un cancer maligno que se detectan como cancer maligno.
- Falsos Positivos (False positives), serían los cánceres benignos que se detectan como un cancer maligno.
- Verdaderos Negativos(True Negatives), serían los canceres benignos que se clasifican como cánceres benignos.
- Falsos Negativos(False Negatives), serían los canceres malignos que se clasifican como cánceres benignos.

![image.png](attachment:image.png)

### Ratios de clasificación

**Exactitud (Accuracy)**

La exactitud es una medida general de como se comporta el modelo, mide simplemente el porcentaje de casos que se han clasificado correctamente.

$$Exactitud=\frac{Número~de~observaciones~correctamente~clasificadas}{Número~de~observaciones~totales}= \frac{VP+VN}{VP+VN+FP+FN}$$

1. **Exactitud (Accuracy):**
   - **Definición:** Mide la proporción de predicciones correctas en relación con el total de predicciones.
   - **Ejemplo:** Si el modelo predice correctamente 90 casos de cáncer de mama (VP) y 5 casos sanos (VN), y comete errores en 4 casos de cáncer (FP) y 1 caso sano (FN), entonces la exactitud sería  ****.



In [None]:
metrics.accuracy_score(objetivos_reales, predicciones)

**Precisión (Precission)**

La precisión indica la habilidad del modelo para clasificar como positivos los casos que son positivos.

$$Precisión=\frac{Número~de~observaciones~positivas~correctamente~clasificadas}{Número~de~observaciones~clasificadas~como~positivas}= \frac{VP}{VP+FP}$$

2. **Precisión (Precision):**
   - **Definición:** Mide la proporción de casos positivos predichos correctamente con respecto al total de casos positivos predichos.
   - **Ejemplo:** Si el modelo predice correctamente 90 casos de cáncer de mama (VP) pero también clasifica erróneamente 4 casos sanos como positivos (FP), entonces la precisión sería ***%.


In [None]:
def precision(clases_reales, predicciones):
    vp = VP(clases_reales, predicciones)
    fp = FP(clases_reales, predicciones)
    return vp / (vp+fp)

precision(objetivos_reales, predicciones)

**Exhaustividad o sensibilidad(Recall o True Positive Rate)**

La sensibilidad nos da una medida de la habilidad del modelo para encontrar todos los casos positivos. La sensibilidad se mide en función de una clase.

$$Sensibilidad=\frac{Número~de~observaciones~positivas~clasificadas~como~positivas}{Número~de~observaciones~positivas~totales}= \frac{VP}{VP+FN}$$

3. **Exhaustividad o Sensibilidad (Recall o True Positive Rate):**
   - **Definición:** Mide la proporción de casos positivos reales que son predichos correctamente.
   - **Ejemplo:** Si el modelo predice correctamente 90 casos de cáncer de mama (VP) pero omite 1 caso de cáncer (FN), entonces la sensibilidad sería de 98.9%.


In [None]:
metrics.recall_score(objetivos_reales, predicciones)

**Puntuación F1 (F1 score)**

La puntuación F1 es una media ponderada entre la sensibilidad (que intenta obtener cuantos mas verdaderos positivos independientemente de los falsos positivos) y la precisión (que intenta obtener solo verdaderos positivos que sean casos claros para limitar los falsos positivos).

La puntuación F1 se define como la media harmónica de la precisión y la sensibilidad:

$$F1=2*\frac{1}{\frac{1}{precisión}+\frac{1}{sensibilidad}}=2*\frac{precisión*sensibilidad}{precisión+sensibilidad}$$

4. **Puntuación F1 (F1 Score):**
   - **Definición:** Combina precisión y sensibilidad en una sola métrica que busca un equilibrio entre ambas.
   - **Ejemplo:** Usando los valores anteriores, la puntuación F1 sería de *****.


In [None]:
metrics.f1_score(objetivos_reales, predicciones)

**Ratio de Falsos Positivos (Ratio de Falsa Alarma o FPR)**

El ratio de falsos positivos nos da una medida de las probabilidades de nuestro modelo de asignar una clase positiva a un caso negativo.

Se define como:

$$FPR=\frac{Número~de~observaciones~negativas~clasificadas~como~positivas}{Número~de~observaciones~negativas}= \frac{FP}{FP+TN}$$

5. **Ratio de Falsos Positivos (FPR - False Positive Rate):**
   - **Definición:** Mide la proporción de casos negativos reales que son incorrectamente clasificados como positivos.
   - **Ejemplo:** Si el modelo clasifica erróneamente 4 casos sanos como positivos (FP) y acierta en 95 casos sanos (VN), entonces el FPR sería de 4%.


In [None]:
def fpr(clases_reales, predicciones):
    return (FP(clases_reales, predicciones) / (
             FP(clases_reales, predicciones) + VN(clases_reales, predicciones)
             )
           )
fpr(objetivos_reales, predicciones)