# 6. Métricas

In [None]:
import numpy as np
import matplotlib.pyplot as plt

## Etiquetas de Ejemplo

Clasificación binaria probabilística:

In [None]:
y_true = np.array([1, 1, 0, 1, 1, 0, 0, 1, 0, 0])
y_pred_proba = np.array([.99, .98, .72, .70, .65, .51, .39, .24, .11, .01])

Clasificación binaria determinista:

In [None]:
threshold = 0.5
y_pred = (y_pred_proba >= threshold).astype(int)
y_pred

Clasificación multiclase determinista:

In [None]:
y_true2 = ["cat", "ant", "cat", "cat", "ant", "bird"]
y_pred2 = ["ant", "ant", "cat", "cat", "ant", "cat"]

## Precision, Recall y F1

La precision es la cantidad de positivos propuestos por el modelo que fueron correctos:

$$Precision = \frac{|Train \cap Test|}{|Train|} = \frac{TP}{TP + FP}$$

La recall es la cantidad de positivos correctos que fueron encontrados por el modelo:

$$Recall = \frac{|Train \cap Test|}{|Test|} = \frac{TP}{TP + FN}$$

$$F_1 = \frac{2 * Precision * Recall}{Precision + Recall}$$

Para clasificación multiclase, se puede calcular una métrica por clase. Luego, las métricas se pueden promediar para obtener resultados "macro".
Para obtener resultados "micro", se hacen primero cálculos globales para TP, FP, TN, FN y luego se calcula como un problema binario.

Podemos usar sklearn para calcularlas:

In [None]:
y_true, y_pred

In [None]:
from sklearn.metrics import precision_score
precision_score(y_true, y_pred)

In [None]:
from sklearn.metrics import recall_score
recall_score(y_true, y_pred)

In [None]:
from sklearn.metrics import f1_score
f1_score(y_true, y_pred)

## Reporte de Clasificación

- [classification_report](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.classification_report.html)

En clasificación binaria:

In [None]:
from sklearn.metrics import classification_report

print(classification_report(y_true, y_pred))

En clasificación multiclase:

In [None]:
print(classification_report(y_true2, y_pred2))

## Matrices de Confusión

Usamos [confusion_matrix](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.confusion_matrix.html):


In [None]:
from sklearn.metrics import confusion_matrix

In [None]:
confusion_matrix(y_true, y_pred)

In [None]:
tn, fp, fn, tp = confusion_matrix(y_true, y_pred).ravel()

En multiclase:

In [None]:
cm = confusion_matrix(y_true2, y_pred2)
cm

Podemos usar [plot_confusion_matrix](https://scikit-learn.org/stable/auto_examples/model_selection/plot_confusion_matrix.html) pero requiere el clasificador. Definimos nuestra propia versión:

In [None]:
from utils import plot_confusion_matrix

plot_confusion_matrix(cm, ['ant', 'cat', 'bird'])

## Curvas ROC

Usamos [roc_curve](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.roc_curve.html) para obtener los puntos y graficamos:

In [None]:
from sklearn.metrics import roc_curve
fpr, tpr, threshold = roc_curve(y_true, y_pred_proba, drop_intermediate=True)

In [None]:
plt.plot(fpr, tpr, color="red")
plt.scatter(fpr, tpr, color="red")
plt.xlabel("false positive rate")
plt.ylabel("true positive rate")
plt.show()

In [None]:
tpr[4], fpr[4], threshold[4]

Calculamos el área bajo la curva con [roc_auc_score](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.roc_auc_score.html):

In [None]:
from sklearn.metrics import roc_auc_score

roc_auc_score(y_true, y_pred_proba)

## Curvas PR (Precision/Recall)

Usamos [precision_recall_curve](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.precision_recall_curve.html) para obtener los puntos y graficamos:

In [None]:
from sklearn.metrics import precision_recall_curve
precision, recall, threshold = precision_recall_curve(y_true, y_pred_proba)

In [None]:
plt.xlim(0, 1)
plt.ylim(0, 1.1)
plt.plot(recall, precision, color="red")
plt.scatter(recall, precision, color="red")
plt.xlabel("recall")
plt.ylabel("precision")
plt.show()

In [None]:
precision[-6], recall[-6], threshold[-6]

In [None]:
precision[-5], recall[-5], threshold[-5]

In [None]:
threshold