# 回帰タスクにおける評価指標


## RMSE(Root Mean Squared Error)

$$
\large RMSE = \sqrt{ \displaystyle\frac{1}{N} \sum_{i=1}^{N} (y_i - \hat{y_i})^{2}}
$$

$N:$ レコード数

$i:$ 各レコードのインデックス

$yi:$ i番目のレコードの真の値

$\hat{y_i}:$ i番目のレコードの予測値

・回帰タスクで最も代表的な指標。

・各レコードの目的変数の真の値と予測値の差を二乗し（二乗誤差）、それらの平均の平方根をとる。

・後述のMAEと比較すると、外れ値の影響を受けやすく、外れ値に過剰適合しないよう、処理を予めしておく必要がある。

In [1]:
import numpy as np
from sklearn.metrics import mean_squared_error

y_true = [1.0, 1.5, 2.0, 1.2, 1.8] # 真の値
y_pred = [0.8, 1.5, 1.8, 1.3, 3.0] # 予測値

rmse = np.sqrt(mean_squared_error(y_true, y_pred))
print(rmse)

0.5531726674375732


## RMSLE(Root Mean Squared Logarithmic Error)

$$
\large RMSLE = \sqrt{ \displaystyle\frac{1}{N} \sum_{i=1}^{N} (log(1+y_i)-log(1+\hat{y_i}))^{2}}
$$

・値が負に発散をするのを防ぐため、1を足す。

・各レコードの目的変数の真の値と予測値の対数をそれぞれ取り、その差を二乗し、それらの平均の平方根をとる。

・目的変数が袖の重い分布（緩やかに減衰する分布の総称）を持ち、変換しないと大きな値の影響が懸念される場合や、
真の値と予測値の比率に着目したい場合に用いる。

In [2]:
from sklearn.metrics import mean_squared_log_error

rmsle = np.sqrt(mean_squared_log_error(y_true, y_pred))
print(rmsle)

0.17032547044118185


## MAE(Mean Absolute Error)

$$
\large MAE = \displaystyle\frac{1}{N} \sum_{i=1}^{N} |{y}_i-\hat{y}_i|
$$

・真の値と予測値の差の絶対値の平均。

・外れ値の影響を低減した形の評価に適している。（ロバスト性が高いとも言える。）

MAEを最小化する予測値は中央値。

[1 ,2, 3, 4, 10]と予測値があった場合、仮に1つの代表値で予測した場合、最も小さくなるのは3。

In [3]:
from sklearn.metrics import mean_absolute_error

mae = mean_absolute_error(y_true, y_pred)
print(mae)

0.33999999999999997


## 決定係数(R^2)

$$ 
\large {R^{2}} = 1 - \frac{ \sum_{i=1}^{N} { ( {y}_i - \hat{y}_{i} ) }^{2} }{ \sum_{i=1}^{N} { ( {y}_i - \bar{y}) }^{2} }
$$

$$
\large \bar y = \displaystyle\frac{1}{N} \sum_{i=1}^{N} {y}_i
$$

・回帰分析の当てはまりの良さを評価。

・最大は１で、１に近づくほど精度の高い予測が出来ていることになる。

・分母に予測値はなく、分子は真の値と予測値の二重誤差になっているため、この指標を最大化することは、
RMSEを最小化することと同じ。

In [4]:
from sklearn.metrics import r2_score

r2 = r2_score(y_true, y_pred)
print(r2)

-1.2499999999999996
