# Метрики качества бинарной классификации

## Теоретическая часть

__Вспомнить из лекций:__
* Как вычисляются следующие метрики качества: **точность, полнота, F-мера, LogLoss, AUC-ROC, AUC-RPC**?

Большинство алгоритмов бинарной классификации работают следующим образом: они предсказывают для объекта  $x$ вещественное число $b(x)$, а затем сравнивают его с порогом $T$: 
- если $b(x) < T$, то предсказывается класс -1, 
- иначе предсказывается класс +1. 

Это можно записать в терминах функции **sign** (знак):
$$a(x) = sign(b(x)-T)$$

Метрики качества бинарной классификации можно разделить на две группы: 

оценивают 
- бинарные предсказания $a(x)$ (класс -1 и +1), 
- вещественные предсказания $b(x)$. 

Некоторые метрики последней группы варьируют порог, и оценивают качество бинарных предсказаний при различных порогах. Это полезно, чтобы "отделить" качество работы алгоритма от качества выбора конкретного порога. 

### Вопрос: 
какие из рассмотренных в лекциях метрик относятся к каждой группе?


### Ответ:

### Задача 1
Вычислить (вручную) **accuracy, точность, полноту** и  **F-меру** для следующих векторов предсказаний и правильных ответов:

|                               |    |    |    |    |    |    |    |
|-------------------------------|----|----|----|----|----|----|----|
| Правильный ответ (из данных) | +1 | -1 | +1 | +1 | -1 | +1 | -1 |
| Предсказание                  | -1 | +1 | +1 | +1 | -1 | -1 | -1 |



### Решение:

### Задача 2
Рассмотрим алгоритм вида $$a(x) = sign(b(x)-T).$$ Пусть для любого объекта $x$ выполнено $-10 < b(x) < 10$. Какова будет точность и полнота алгоритма, если положить $T=-15$? $T=15$? 


### Решение:

### Задача 3

Найти (вручную) точки, необходимые для пострения ROC-кривой для следующих векторов предсказаний и правильных ответов:

|                              |    |    |    |    |    |    |    |
|------------------------------|----|----|----|----|----|----|----|
| Правильный ответ (из данных) | -1 | +1 | +1 | -1 | +1 | -1 | -1 |
| Предсказание $b(x)$       | 1  | 15 | -1 | 7  | 3  | -8 | -5 |

__Указание:__

Следует сначала отсортировать объекты по возрастанию вещественных предсказаний $b(x)$. 

### Решение:

### Задача 4

Какое значение AUC-ROC будет у алгоритма $b(x)$, который на каждом объекте возвращает случайное вещественное число из отрезка [-2, 2] (равномерное распределение)? 

У алгоритма, который для всех объектов класса -1 возвращает отрицательное число, а для всех объектов класса +1 - положительное число?


### Решение:

### Задача 5

Пусть для алгоритма $b(x)$ значение AUC-ROC равно 0.2. Каким будет AUC-ROC алгоритма $-b(x)$?


### Решение:

## Практическая часть

Функции для вычисления метрик в **sklearn** 

In [1]:
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, roc_auc_score

Сгенерируем два бинарных вектора длины 100 (число объектов):

In [2]:
import numpy as np

In [3]:
n = 100
y_true = np.random.randint(2, size=n)
y_pred = np.random.randint(2, size=n)

Вычислим метрики качества бинарных предсказаний для случайных ответов (соответствует алгоритму, не выделяющему никаких закономерностей в данных):

In [4]:
precision_score(y_true, y_pred), recall_score(y_true, y_pred), f1_score(y_true, y_pred)

(0.4807692307692308, 0.5102040816326531, 0.4950495049504951)

In [5]:
accuracy_score(y_true, y_pred)

0.49

Все метрики около 0.5 (примерная доля объектов положительного класса в выборке).

Вычислим метрики для случая, когда все ответы правильные:

In [6]:
precision_score(y_true, y_true), recall_score(y_true, y_true), f1_score(y_true, y_true)

(1.0, 1.0, 1.0)

In [7]:
accuracy_score(y_true, y_true)

1.0

Как и ожидается, все метрики равны 1.

Сгенерируем вектор случайных вещественных предсказаний:

In [8]:
b_pred = np.random.rand(n)

Вычислим roc_auc:

In [9]:
roc_auc_score(y_true, b_pred)

0.5214085634253701

Как и ожидается, значение ROC-AUC около 0.5.

### Задание
Реализовать построение ROC-кривой, используя данные задачи 3.

Сопоставить с результатами, полученными при решении задачи 3.