# Метрики

## Classification metrics

**Accuracy** - метрика показывающая долю правильных ответов, относительно всех объектов.
$$Accuracy(a, x) = \frac{1}{l} \sum_{i=1}^{l}[a(x_i) = y_i]$$
Диапазон:[0, 1]. В идеале 1
- Необъективна на выборке с **дисбалансом** классов.
- Нет возможности давать **вес** для разных ошибок.

### Precision&Recall


Будем считать, что модель **сработала**, если она предсказала *первый класс*, соответственно, модель **не сработала**, если она предсказала *второй класс*.
- False Positive(FL - ложное срабатывание) Модель сработала, когда **не** должна.
- False Negative(FN - Ложный пропуск) Модель **не** сработала, когда должна. То есть модель пропускает объекты, не срабатывая на них.
- True Positive(TP - Истинное срабатывание) Модель сработала, когда должна.
- True Negative(TN - Истинный пропуск) Модель **не** сработала, когда **не** должна.

Матрица ошибок(confusion matrix):

|          | y = 1           | y = 0          |
|----------|-----------------|----------------|
| a(x) = 1 | True Positive   | False Positive |
| a(x) = 0 | False Negative  | True Negative  |

```
from sklearn.metrics import confusion_matrix

confusion_matrix(df['clients'],df['first_model'])
```

На матрице ошибки основываются некоторые метрики:
$$precision(a, X) = \frac{TP}{TP + FP}$$
$$recall(a, X) = \frac{TP}{TP + FN}$$

Диапазон[0, 1]. В идеале 1

**Precision**(точность) - показывает долю истинных срабатываний, от общего количества срабатываний. Насколько можно доверять алгоритмы в случае срабатывания. То есть: "Какой процент предсказанных положительных примеров действительно положительные?"

**Recall**(полнота) - показывает, какая доля реальных данных была правильно предсказана моделью. Насколько модель "полна" в обнаружении всех положительных примеров. То есть: "Какой процент реальных положительных примеров был предсказан правильно?"

 Что выбрать? Если важнее **минимизировать ложные срабатывания** - **Precision**; если важнее **не пропускать положительные примеры** - **Recall**.



### F1-score

Часто Precision и Recall объединяют в одну метрику — F1-меру, которая является гармоническим средним Precision и Recall:
$$F_1 = 2\cdot \frac{Precision \cdot Recall}{Precision + Recall}$$

### ROC AUC

xОпределим такие метрики:
$$TPR = \frac{TP}{TP + FN} ~~FPR = \frac{FP}{FP + TN}$$

False Positive Rate - отложим на оси абсцисс, по x. А True Positive Rate - на оси ординат, по y.
Диапазон[0, 1]. В идеале TPR -> 1. А FPR -> 0.

Сама метрика ROC AUC - показывает, насколько хорошо модель разделяет два класса. Каждая точка на ROC-кривой соответствует определенному **порогу классификации**(threshold).

AUC(Area Under Curve) - площадь под ROC-кривой.

```
from sklearn.metrics import roc_auc_score, roc_curve

roc_auc = roc_auc_score(y_test, y_pred_proba)

# Построение ROC-кривой
fpr, tpr, thresholds = roc_curve(y_test, y_pred_proba)
plt.plot(fpr, tpr, label=f"ROC AUC = {roc_auc:.4f}")
plt.plot([0, 1], [0, 1], linestyle="--", color="gray")  # Случайный классификатор
plt.xlabel("False Positive Rate")
plt.ylabel("True Positive Rate")
plt.title("ROC Curve")
plt.legend()
plt.show()
```

In [10]:
from sklearn.datasets import load_breast_cancer
import pandas as pd

data = load_breast_cancer()

AttributeError: partially initialized module 'pandas' has no attribute '_pandas_parser_CAPI' (most likely due to a circular import)

In [3]:
import pandas as pd

file = pd.read_csv("sample_submission.csv")

file.min()

user_id    1.000000
item_id    1.000000
predict   -1.449885
dtype: float64