Balanced Accuracy Score
===

* Esta métrica permite corregir cómputos erroneos sobre la precisión de un clasificador cuando las clases están imbalanceadas.

* Cuando la muestra está balanceada equivale a la métrica `accuracy`.

* Esta medida es facilmente interpretada a partir de la matriz de confusión en el **caso binario** y es igual a:

    * La media aritmética de la sensibilidad (True Positive Rate) y la especificidad (True Negative Rate).

    * El area bajo la curva ROC con predicciones binarias en vez de scores.

             | Pronóstico
             |  PP    PN
    ---------|------------
          P  |  TP    FN 
    Real     |
          N  |  FP    TN 

$$
\text{balanced_accuracy} = 
\frac{1}{2} 
\left(
\frac{\text{TP}}{\text{P}} 
+
\frac{\text{TN}}{\text{N}}
\right)
=
\frac{1}{2}
\left(
\frac{\text{TP}}{\text{TP}+\text{FN}}
+
\frac{\text{TN}}{\text{TN}+\text{FP}}
\right)
=
\frac{1}{2}
\left(
\text{TPR} + \text{TNR}
\right)
$$

In [1]:
from sklearn.metrics import accuracy_score, balanced_accuracy_score

y_true = [1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
y_pred = [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

accuracy_score(
    y_true,
    y_pred,
)

0.8

In [2]:
balanced_accuracy_score(
    # -------------------------------------------------------------------------
    # Ground truth (correct) labels.
    y_true=y_true,
    # -------------------------------------------------------------------------
    # Predicted labels, as returned by a classifier.
    y_pred=y_pred,
    # -------------------------------------------------------------------------
    # Sample weights.
    sample_weight=None,
    # -------------------------------------------------------------------------
    # When true, the result is adjusted for chance, so that random performance 
    # would score 0, while keeping perfect performance at a score of 1.
    adjusted=False,
)

0.5

* La versión implementada equivale a `accuracy_score` con pesos balanceados por clase.

* Si la precisión convencional está por encima del azar solo porque el clasificador aprovecha un conjunto de prueba desequilibrado, entonces la precisión equilibrada, según corresponda, se reducirá a:

$$
\frac{1}{N_{\text{clases}}}
$$

In [3]:
y_true = [1, 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
y_pred = [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

balanced_accuracy_score(
    y_true=y_true,
    y_pred=y_pred,
)

0.3333333333333333

* Los scores van de 0 a 1 para `adjusted=False`.

In [4]:
y_true = [1, 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
y_pred = [0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]

balanced_accuracy_score(
    y_true=y_true,
    y_pred=y_pred,
)

0.0

* Los scores se reescalan al rango
$$
\frac{1}{1-N_\text{clases}}
$$
y 1.0, con desempeño 0 para el scoring aleatorio 

In [5]:
y_true = [1, 1, 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
y_pred = [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

balanced_accuracy_score(
    y_true=y_true,
    y_pred=y_pred,
    adjusted=False,
)

0.3333333333333333

In [6]:
balanced_accuracy_score(
    y_true=y_true,
    y_pred=y_pred,
    adjusted=True,
)

0.0

In [7]:
y_true = [1, 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
y_pred = [0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]

balanced_accuracy_score(
    y_true=y_true,
    y_pred=y_pred,
    adjusted=True,
)

-0.49999999999999994

* Si $y_i$ es el valor verdadero de la $i$-ésima muestra, y $w_i$ es su peso, entonces el peso de la $i$-ésima muestra se ajusta como:

$$
\hat{w}_i = 
\frac{w_i}
{\sum_j 1(y_j=y_i)w_j}
$$

* Si $\hat{y}_i$ es el valor pronósticado para la $i$-ésima muestra, entonces la función de scoring es definida como:

$$
\text{balanced_accuracy} = 
\frac{1}{\sum \hat{w}_i}
\sum_i 1(\hat{y}_i=y_i)\hat{w}_i
$$