# RMSE（平均平方二乗誤差）

In [2]:
#真の値と予測値の差の二乗の平均の平方根
#MAEより外れ値の影響を受けやすいため、あらかじめ外れ値のを除く処理をしたほうが良い
from sklearn.metrics import mean_squared_error
import numpy as np

#y_trueが真の値、y_predが予測値
y_true = [1.0, 1.5, 2.0, 1.2, 1.8]
y_pred = [0.8, 1.5, 1.8, 1.3, 3.0]

rmse = np.sqrt(mean_squared_error(y_true, y_pred))
print(rmse)

0.5531726674375732


# RMSLE

In [3]:
#真の値と予測値の対数をそれぞれとった後の差の事情の平方根
#目的変数が裾の重い分布を持ち、変換しないままだと大きな値の影響が強い場合や、真の値と予測値の比率に着目したい場合に用いられる。この指標は比率に着目している。
from sklearn.metrics import mean_squared_log_error
import numpy as np

#y_trueが真の値、y_predが予測値
y_true = [1.0, 1.5, 2.0, 1.2, 1.8]
y_pred = [0.8, 1.5, 1.8, 1.3, 3.0]

rmsle = np.sqrt(mean_squared_log_error(y_true, y_pred))
print(rmsle)

0.17032547044118188


# MAE

In [4]:
#真の値と予測値の差の絶対値の平均
#MAEは外れ値の影響を低減した形での評価に適した関数
from sklearn.metrics import mean_absolute_error

#y_trueが真の値、y_predが予測値
y_true = [1.0, 1.5, 2.0, 1.2, 1.8]
y_pred = [0.8, 1.5, 1.8, 1.3, 3.0]

mae = mean_absolute_error(y_true, y_pred)
print(mae)

0.33999999999999997


# 決定係数（$ R^2 $）

In [5]:
#回帰分析の当てはまりの良さを表す
#この指標を最大化することはRMSEを最小化することと同意
from sklearn.metrics import r2_score

#y_trueが真の値、y_predが予測値
y_true = [1.0, 1.5, 2.0, 1.2, 1.8]
y_pred = [0.8, 1.5, 1.8, 1.3, 3.0]

r2 = r2_score(y_true, y_pred)
print(r2)

-1.2499999999999996


# 二値分類における評価指標〜正例か負例かを予測値とする場合

# 混同行列 (confusion matrix)

In [2]:
import numpy as np
from sklearn.metrics import confusion_matrix

#0,1で表される二値分類の真の値と予測値
y_true = [1, 0, 1, 1, 0, 1, 1, 0]
y_pred = [0, 0, 1, 1, 0, 0, 1, 1]

tp = np.sum((np.array(y_true) == 1) & (np.array(y_pred) == 1))
tn = np.sum((np.array(y_true) == 0) & (np.array(y_pred) == 0))
fp = np.sum((np.array(y_true) == 0) & (np.array(y_pred) == 1))
fn = np.sum((np.array(y_true) == 1) & (np.array(y_pred) == 0))

confusion_matrix1 = np.array([[tp, fp],[fn, tn]])

print(confusion_matrix1)

#sckit-learnのmetricsモジュールのconfusion_matrixでも作成できるが、混同行列の要素の配置が違うので注意が必要
confusion_matrix2 = confusion_matrix(y_true, y_pred)
print(confusion_matrix2)

[[3 1]
 [2 2]]
[[2 1]
 [2 3]]


# accuracy（正答率）とerror rate（誤答率）

In [3]:
#accuracyは予測が正しい割合、error rateは誤っている割合
#不均衡のデータの場合は特にモデルの性能を評価しづらい
from sklearn.metrics import accuracy_score

#0,1で表される二値分類の真の値と予測値
y_true = [1, 0, 1, 1, 0, 1, 1, 0]
y_pred = [0, 0, 1, 1, 0, 0, 1, 1]
accuracy = accuracy_score(y_true, y_pred)
print(accuracy)

0.625


# precision（適合率）とrecall（再現率）

In [4]:
#precisionは正例と予測したもののうち真の値も正例の割合、recallは真の値が正例のもののうちどの程度を正例の予測として含めることができているかの割合
#それぞれ0から1の値を取り、1に近づくほど良いスコア
#precisionとrecallはどちらかの値を高くしようとするともう一方の値は低くなる
#誤検知を少なくしたい場合はprecisionを重視し、正例の見逃しを避けたい場合はrecallを重視する
from sklearn.metrics import precision_score
from sklearn.metrics import recall_score

#0,1で表される二値分類の真の値と予測値
y_true = [1, 0, 1, 1, 0, 1, 1, 0]
y_pred = [0, 0, 1, 1, 0, 0, 1, 1]
precision = precision_score(y_true, y_pred)
print(precision)
recall = recall_score(y_true, y_pred)
print(recall)

0.75
0.6


# F1-scoreとFβ-score

In [6]:
#F1-scoreはprecisionとrecallの調和平均で計算される指標
#Fβ-scoreはF1-scoreからrecallとprecisionのバランスをrecallをどれだけ重視するかを表す係数βによって調整した指標
from sklearn.metrics import f1_score
from sklearn.metrics import fbeta_score

#0,1で表される二値分類の真の値と予測値
y_true = [1, 0, 1, 1, 0, 1, 1, 0]
y_pred = [0, 0, 1, 1, 0, 0, 1, 1]
f1 = f1_score(y_true, y_pred)
print(f1)
fbeta = fbeta_score(y_true, y_pred, 0.8)
print(fbeta)

0.6666666666666665
0.6833333333333332


# MCC（Matthews Correlation Coefficient）

In [8]:
#不均衡なデータに対してモデルの性能を適切に評価しやすい指標
#-1から+1の範囲をとり、+1の時に完璧な予測、0の時にランダムな予測、-1の時に完全に反対の予測を行なっている
from sklearn.metrics import matthews_corrcoef

#0,1で表される二値分類の真の値と予測値
y_true = [1, 0, 1, 1, 0, 1, 1, 0]
y_pred = [0, 0, 1, 1, 0, 0, 1, 1]
mcc = matthews_corrcoef(y_true, y_pred)
print(mcc)

0.2581988897471611


# 二値分類における評価指標〜正例である確率を予測値とする場合

# logloss

In [10]:
#真の値を予測している確率の対数を取り、符号を反転させている
#低いほうが良い指標
#そのレコードが正例である確率を低く予測したにも関わらず負例である場合や、正例である確率を高く予測したにも関わらず負例である場合にペナルティが大きく与えられる
from sklearn.metrics import log_loss

#0,1で表される二値分類の真の値と予測値
y_true = [1, 0, 1, 1, 0, 1]
y_prob = [0.1, 0.2, 0.8, 0.8, 0.1, 0.3]

logloss = log_loss(y_true, y_prob)
print(logloss)

0.7135581778200728


# AUC（Area Under the ROC Curve）

In [11]:
#ROC曲線が描く曲線をもとに計算される
#完全な予測を行なった場合AUCは1.0, ランダムな予測の場合AUCは0.5程度となる
from sklearn.metrics import roc_auc_score

#0,1で表される二値分類の真の値と予測値
y_true = [1, 0, 1, 1, 0, 1]
y_prob = [0.1, 0.2, 0.8, 0.8, 0.1, 0.3]

auc = roc_auc_score(y_true, y_prob)
print(auc)

0.8125


# 他クラス分類における評価指標

# multi-class accuracy