# Метрики машинного обучения

Ермаков Петр

https://ermakovpetr.ru

## Метрики регресси

<img src="metrics_data/regrassion_error.png" alt="Drawing" style="height: 300px;"/>
https://alexanderdyakonov.files.wordpress.com/2018/10/book_08_metrics_12_blog1.pdf

- [Mean Absolute Error](http://scikit-learn.org/stable/modules/model_evaluation.html#mean-absolute-error), интерпретируемая метрика, измеряется в тех же единицах, что и исходный ряд, $[0, +\infty)$

$MAE = \frac{\sum\limits_{i=1}^{n} |y_i - \hat{y}_i|}{n}$ 

```python
sklearn.metrics.mean_absolute_error```

In [1]:
from sklearn.metrics import mean_absolute_error

y_true = [10, 20, 30, 40]
y_pred = [11, 19, 28, 42]

mean_absolute_error(y_true, y_pred)

1.5

In [2]:
y_true = [10, 20, 30, 40]
y_pred = [11, 19, 29, 42]

mean_absolute_error(y_true, y_pred)

1.25

- [Median Absolute Error](http://scikit-learn.org/stable/modules/model_evaluation.html#median-absolute-error), также интерпретируемая метрика, однако её преимущество - нечувствительность (робастность) к выбросам в данных, $[0, +\infty)$

$MedAE = median(|y_1 - \hat{y}_1|, ... , |y_n - \hat{y}_n|)$

```python
sklearn.metrics.median_absolute_error
```

In [5]:
from sklearn.metrics import median_absolute_error

y_true = [10, 20, 30, 40]
y_pred = [11, 19, 28, 42]

median_absolute_error(y_true, y_pred)

1.5

In [6]:
y_true = [10, 20, 30, 40]
y_pred = [11, 19, 29, 42]

median_absolute_error(y_true, y_pred)

1.0

- [Mean Squared Error](http://scikit-learn.org/stable/modules/model_evaluation.html#mean-squared-error), используется в большинстве случаев, сильнее наказывает модель за большие ошибки и меньше - за маленькие (парабола), $[0, +\infty)$

$MSE = \frac{1}{n}\sum\limits_{i=1}^{n} (y_i - \hat{y}_i)^2$

```python
sklearn.metrics.mean_squared_error
```

In [7]:
from sklearn.metrics import mean_squared_error

y_true = [10, 20, 30, 40]
y_pred = [11, 19, 28, 42]

mean_squared_error(y_true, y_pred)

2.5

In [8]:
y_true = [10, 20, 30, 40]
y_pred = [11, 19, 29, 42]

mean_squared_error(y_true, y_pred)

1.75

## RMSE vs MAE

    Сходства: 

    Среднюю ошибка прогнозирования модели в единицах

    Метрики могут варьироваться от 0 до ∞ и безразличны к знаку ошибок

    Это отрицательно ориентированные оценки, что означает, что чем ниже значения, тем лучше.

    RMSE не обязательно увеличивается с дисперсией ошибок

    RMSE увеличивается с дисперсией частотного распределения величин ошибок


    Используя MAE, мы можем установить нижнюю и верхнюю границу RMSE:

    [MAE] ≤ [RMSE]

    [RMSE] ≤ [MAE * sqrt(n)]

    RMSE имеет тенденцию быть больше, чем MAE, с увеличением размера тестовой выборки

    Это может вызвать проблемы при сравнении результатов RMSE, рассчитанных на тестовых выборках разных размеров

    https://medium.com/human-in-a-machine-world/mae-and-rmse-which-metric-is-better-e60ac3bde13d

<img src="https://miro.medium.com/max/1542/1*YTxb8K2XZIisC944v6rERw.png" alt="Drawing" style="height: 300px;"/>
<img src="https://miro.medium.com/max/1036/1*8oHdjFnYjFoC2B4mcxHSSw.png" alt="Drawing" style="height: 300px;"/>

- [R squared](http://scikit-learn.org/stable/modules/model_evaluation.html#r2-score-the-coefficient-of-determination), коэффициент детерминации (в эконометрике - доля объясненной моделью дисперсии), $(-\infty, 1]$

$R^2 = 1 - \frac{SS_{res}}{SS_{tot}}$ 

```python
sklearn.metrics.r2_score
```
https://math.stackexchange.com/questions/1976747/prove-that-r2-cannot-decrease-when-adding-a-variable

In [10]:
from sklearn.metrics import r2_score

y_true = [10, 20, 30, 40]
y_pred = [11, 19, 29, 42]

mean_squared_error(y_true, y_pred)

1.75

- [Mean Squared Logarithmic Error](http://scikit-learn.org/stable/modules/model_evaluation.html#mean-squared-logarithmic-error), практически тоже самое, но значения предварительно логарифмируются, таким образом маленьким ошибкам также уделяется значительное внимание, обычно используется, если данным присущ экспоненциальный рост, $[0, +\infty)$

$MSLE = \frac{1}{n}\sum\limits_{i=1}^{n} (log(1+y_i) - log(1+\hat{y}_i))^2$

```python
sklearn.metrics.mean_squared_log_error```



- Mean Absolute Percentage Error, как MAE, только в процентах, - удобно для объяснения заказчику качества прогноза, $[0, +\infty)$

$MAPE = \frac{100}{n}\sum\limits_{i=1}^{n} \frac{|y_i - \hat{y}_i|}{y_i}$ 

```python
def mean_absolute_percentage_error(y_true, y_pred): 
    return np.mean(np.abs((y_true - y_pred) / y_true)) * 100
```