## Базовые метрики классификации

Классифицировать будем вручную. Цель - посмотреть как считаются и что показывают метрики. Так же, попробуем написать свои функции для рассчета метрик.

У нас будет 2 списка из 10 значений: "истинный" и "предстказанный":

In [1]:
import numpy as np
import pandas as pd

In [2]:
np.random.seed(10)
true = np.random.randint(0, 2, 10)
pred = np.random.randint(0, 2, 10)

print('true:', true)
print('pred:', pred)

true: [1 1 0 1 0 1 1 0 1 1]
pred: [0 1 1 0 0 1 0 0 0 0]


### Confusion matrix

In [3]:
from sklearn.metrics import confusion_matrix

Это, наверное, основная концепция, которую стоит понять, чтобы хорошо разбираться в метриках, построенных на отношении количества ответов. В примере у нас есть два класса и алгоритм (random 😀), предсказывающий принадлежность каждого объекта одному из классов. Как должна выглядеть матрица ошибок правильно, я не знаю до сих пор 😅, но, чтобы понимать, что стоит за матрицей, которая строится силами sklearn, буду показывать на примере расположения ее осей:

![title](./images/01.png)

Строки соответствуют предсказанным значениям (1 - Positive, 0 - Negative), столбцы - фактическим. В самих же клетках считается количество значений:

- **TP** (TruePositive) - значения, по-факту являющиеся - **1**, предсказанные как **1**.
- **FN** (FalseNegative) - значения, по-факту являющиеся - **1**, предсказанные как **0**.
- **TN** (TrueNegative) - значения, по-факту являющиеся - **0**, предсказанные как **0**.
- **FP** (FalsePositive) - значения, по-факту являющиеся - **0**, предсказанные как **1**.

Таким образом, сумма по каждому столбцу отражает предсказанное количество классов, а сумма по каждой строке - фактическое.

Если мы сейчас соберем наши значения, то получим такую картину:

![title](./images/02.png)

Логика - простая:

In [4]:
print('true:', true)
print('pred:', pred)

true: [1 1 0 1 0 1 1 0 1 1]
pred: [0 1 1 0 0 1 0 0 0 0]


- Первая пара: по факту - 1, предсказание - 0. **FN**
- Вторая пара: по факту - 1, предсказание - 1. **TP**
- Третья пара: по факту - 0, предсказание - 1. **FP**<br>
...<br>
- Пятая_ пара: по-факту - 0, предсказание - 0. **TN**

Остальное можно разложить в клетки самостоятельно.

Ну и, естественно, нет необходимости, каждый раз это все делать вручную. В бибилиотеке sklearn, как я писал выше, есть готовый метод: **confusion matrix**

In [5]:
confusion_matrix(true, pred)

array([[2, 1],
       [5, 2]])

Как видим, наша матрица и sklearn'овская - совпали. Теперь мы видим, что 5 единичек были приняты нашим алгоритмом за нули, и 1 ноль был принят за единичку. На этой базе и будем считать дальнейшие метрики.

### Accuracy (доля верных ответов)

In [6]:
from sklearn.metrics import accuracy_score

Наверное, наиболее интуитивно понятная метрика:

$\displaystyle Accuracy = \frac{TP + TN}{TN + FN + TP + FP}$

(отношение количества верных ответов, по всем классам, к общему количеству объектов)

Чуть усложним картинку, чтобы понять верно:

![title](./images/03.png)

К сожалению - бесполезна при дисбалансе классов. Например, в нашем случае:

In [7]:
print('Фактическое текущее значение:', accuracy_score(true, pred))
print('Если предсказать только единицы:', accuracy_score(true, np.ones(10)))

Фактическое текущее значение: 0.4
Если предсказать только единицы: 0.7


Т.е., если будем сравнивать модели только по этой метрике, та, что предсказала только превалирующий класс - выглядит лучше. Чтобы такого не происходило, стоит смотреть на более продвинутые метрики.

### Precision (точность)

**Precision** можно определить, как соотношение объектов, которые модель посчитала положительными, действительно, оказавшиеся положительными

Precision можно интерпретировать как долю объектов, названных классификатором положительными и при этом действительно являющимися положительными, а recall показывает, какую долю объектов положительного класса из всех объектов положительного класса нашел алгоритм.


https://towardsdatascience.com/understanding-the-confusion-matrix-from-scikit-learn-c51d88929c79

https://habr.com/ru/company/ods/blog/544208/