<p style="align: center;">
    <img align=center src="../img/dls_logo.jpg" width=500 height=500>
</p>

<h1 style="text-align: center;">
    Физтех-Школа Прикладной математики и информатики (ФПМИ) МФТИ
</h1>

---

<h1 style="text-align: center;">
    Метрики в задаче классификации
</h1>

Две основные задачи машинного обучения - классификация и регрессия. C метрикой для задачи регрессии всё ясно: квадратичная функция потерь

$$
f(y_{true}, y_{pred}) = (y_{true} - y_{pred})^2
$$

Метрик в задаче классификации можно придумать великое множество.

## Метрики, связанные с бинарными лейблами

Предположим, что мы решаем задачу кредитного скоринга (решаем, кому выдавать кредит, кому нет). Мы получили следующие ответы алгоритма: 

<img src="../img/linear_models_metrics_1.png">

Самое логичное решение для измерения качества - посчитать процент совпадающих ответов. Такая метрика называется `accuracy`. В данном случае `accuracy` равна $60\%$. Плохо это или хорошо?

Тут приходит к нам новый сотрудник и заявляет, что повысит `accuracy` на $10\%$. Он предъявляет такой результат на тесте:

<img src="../img/linear_models_metrics_2.png">

Значение `accuracy` повысилось! Но теперь банк выдаёт кредит всем заёмщикам. Вывод: для многих задач нужны другие метрики. Их разработкой мы и займёмся.

<img src="../img/linear_models_metrics_3.png">

<img src="../img/linear_models_metrics_4.png">

<img src="../img/linear_models_metrics_5.png">

### Precision

Пример для `precision`: кредитный скоринг. Нам не выгодно выдавать кредит ($y_{pred} = 1$) неблагонадёжным заёмщикам ($y_{true} = 0$). За такие ошибки (ошибки первого рода) нас штрафует метрика.

### Recall

Пример для `recall`: поиск скрытых военных баз противника. Опасна ситуация, когда опасный объект ($y_{true} = 1$) не был идентифицирован как военная база ($y_{pred} = 0$).

<img src="../img/linear_models_metrics_6.png">

### F-мера

Комбинация `precision` и `recall`:

$$
F_{\beta} = (1 + {\beta}^2) \cdot \frac{precision \cdot recall}{({\beta}^2 \cdot precision) + recall}
$$

## Метрики, связанные с вероятностными ответами

Мы уже сталкивались с алгоритмами, которые предсказывают не класс, а вероятность принадлежности к классу (например, линейная регрессия). Хотим ввести метрику, которая бы отражала качество такой "вероятностной классификации".

<h3 style="text-align: center;">
    ROC-кривая
</h3>

<img src="../img/linear_models_metrics_7.png">

### ROC-AUC

Метрика `ROC-AUC` определяется как площадь под **ROC-кривой**.

In [None]:
import numpy as np
from sklearn.metrics import roc_curve, roc_auc_score
import matplotlib.pyplot as plt

%matplotlib inline

In [None]:
y_true = [1, 1, 0, 1, 1, 1, 1, 0, 1, 0, 1, 0, 0, 0, 1, 0, 0, 0]
y_pred = np.linspace(1, 0, len(y_true))

In [None]:
auc = roc_auc_score(y_true, y_pred)

plt.figure(figsize=(10, 7))
plt.plot(*roc_curve(y_true, y_pred)[:-1], label=f'roc_auc = {auc:.4f}')
plt.plot([0, 1], [0, 1], '--', color='black')

plt.grid()
plt.legend()
plt.show()

Порог для классификации определяется так, как вам нужно. Например, зная прибыль с надёжного заемщика и убыток с ненадёжного, можно определить порог выдачи кредита, максимизируя ожидаемую прибыль.