# Метрики качества классификации

Рассмотрим, как можно оценить качество алгоритма классификации.

С частью метрик вы познакомились в предыдущих модулях, проговорим их снова, добавив важные нюансы, и обсудим новые.

Для того, чтобы понимать формульные записи метрик, необходимо вспомнить матрицу:

![Screenshot_145.png](attachment:Screenshot_145.png)

Будем обозначать True Positive (верные положительные ответы) как TP, False Positive (ошибочные положительные ответы) как FP, False Negative (ошибочные отрицательные) как FN и True Negative (верные отрицательные ответы) как TN.

Теперь рассмотрим, как вычисляются основные метрики для классификации.

## Доля правильных ответов (Accuracy)

![Screenshot_146.png](attachment:Screenshot_146.png)

Проблема данной метрики в том, что она дает нерелевантные результаты на несбалансированных классах. Для того, чтобы нивелировать данную проблему, были созданы усовершенствованные метрики. Например, функционал качества Каппа Коэна. Его идея состоит в том, чтобы перенормировать значение точности (accuracy) с помощью точности, которую можно было получить случайно. Случайная точность  Accuracy(chance) получается в случае случайной перестановки ответов:

![Screenshot_147.png](attachment:Screenshot_147.png)

Также для случая дисбаланса классов существует аналог точности — сбалансированная точность:

![Screenshot_148.png](attachment:Screenshot_148.png)

## Precision и Recall

Precision — метрика, измеряющая, насколько много из принятых моделью положительных объектов в действительности являются положительными. 

Recall — метрика, измеряющая, насколько много положительных объектов из всех положительных объектов модель выбрала.

![Screenshot_149.png](attachment:Screenshot_149.png)

## F1-score

F1-score — метрика, объединяющая precision и recall, принимающая во внимание, что обе важны для задачи. Частный случай F-beta score:

![Screenshot_150.png](attachment:Screenshot_150.png)

Разумеется, все рассмотренные метрики реализованы в Python:

In [21]:
from sklearn.metrics import accuracy_score
from sklearn.metrics import recall_score 
from sklearn.metrics import precision_score
from sklearn.metrics import f1_score
from sklearn.metrics import balanced_accuracy_score 
from sklearn.metrics import cohen_kappa_score

### Задание 7.6.2

In [12]:
import numpy as np

a = [x for x in range(100)] 

b = [x for x in range(100)] 


a = [4 if x==10 else x for x in a]

from sklearn.metrics import accuracy_score

accuracy_score(a, b)

0.99

### Задание 7.6.7

In [13]:
precision = 0.75
recall = 0.6

f1_score = (2 * precision * recall) / (precision + recall)

f1_score

0.6666666666666665

### Задание 7.6.8

In [22]:
y_true = np.array([0, 0, 1, 1, 1, 1, 0, 1])
y_pred = np.array([0, 1, 0, 0, 1, 1, 0, 1])

y_true, y_pred


c = f1_score(y_true, y_pred)
c

0.6666666666666665

### Задание 7.6.9

In [24]:
y_true = np.array([0, 0, 1, 0, 0, 1, 0])
y_pred = np.array([1, 1, 1, 0, 1, 1, 0])

y_true, y_pred


d = precision_score(y_true, y_pred)
d

f = recall_score(y_true, y_pred)
f

1.0