In [2]:
import pandas as pd
import numpy as np
from sklearn.metrics import mean_squared_error

In [3]:
# 回帰
y_true = [1.0, 1.5, 2.0, 1.2, 1.8]
y_pred = [0.8, 1.5, 1.8, 1.3, 3.0]

rmse = np.sqrt(
    mean_squared_error(y_true=y_true, y_pred=y_pred)
)
rmse

0.5531726674375732

## Root Mean Squad Error
- 平均平方二乗誤差
- 対応する真の値との差を二乗して平均を求め、平方を取ったもの
- `誤差が正規分布に従うと仮定して最尤推定したときの最尤解と等しくなる`
- 一つの代表値で誤差を最小化することを考えたとき、平均値が最小となる 

In [4]:
## 2値分類

In [14]:
## 混同行列
from sklearn.metrics import confusion_matrix

y_true = np.array([1,0,1,1,0,1,1,0])
y_pred = np.array([0,0,1,1,0,0,1,1])

#tp...予測値を正例として、その予測が正しい場合 真陽性
tp = np.sum((y_pred == 1) & (y_true == 1))
#tn...予測値を負例として、予測が正しい場合 真陰性
tn = np.sum((y_pred == 0) & (y_true == 0))

#fp...予測値を正例として、予測が誤っている 偽陽性
fp = np.sum((y_pred == 1) & (y_true == 0))
#fm...予測値を負例として、予測が誤っている 偽陰性
fn = np.sum((y_pred == 0) & (y_true == 1))

cm1 = np.array(
    [[tp, fp],
    [tn, fn]
    ]
)

cm2 = confusion_matrix(y_true, y_pred)
cm1, cm2

(array([[3, 1],
        [2, 2]]),
 array([[2, 1],
        [2, 3]]))

In [15]:
# accuracy
from sklearn.metrics import accuracy_score
y_true = [1,0,1,1,0,1,1,0]
y_pred = [0,0,1,1,0,0,1,1]

accuracy = accuracy_score(y_true, y_pred)
accuracy

0.625

# Accurcy, Error rate
- 正答率
    - 予測が正しい割合
    - (tp + tn) / (tp + tn + fp + fn)
- 誤答率
    - 1 - accuracy
- 不均衡データに弱いのであまり使われないらしい
    - 2値分類の場合は正例である予測確率を求めたあと閾値以上か以下かで分類する
    - accuracyは50%
    - `評価しているのはあるレコードが正例である確率を50%以上か以下かで振り分ける能力のみ`
    - 10%以下、90%を正確に振り分ける能力を評価しているわけではない
- 不均衡データの例
    - 正例の割合が0.1%
    - 正例である確率が5%の比較的高いレコードを予測したい
        - 比較的は元のデータの正例の割合と比較しての意味っぽい
    - accuが評価指標の場合、50%以下なのですべて負例
        - 全レコードを負例とするモデルと変化なし
    - 正しいモデルの評価が不可能になってしまう

In [16]:
## precision, recall(適合率、再現率)
from sklearn.metrics import precision_score ,recall_score

precision = precision_score(y_true, y_pred)
recall = recall_score(y_true, y_pred)

precision, recall

(0.75, 0.6)

## RrecisionとRecall
- Precision...適合率
    - TP / (TP + FP)
    - 正例としたものの内どれだけの値が正しいか
- Recall...再現率、感度
    - TP / (TP + FN)
    - 真の値が正例の内どれだけ正例と予測できるか
- トレードオフの関係になっている
    - Precisionを上げたい...
    - FPを減らすために負例の閾値を下げよう！
    - FNの増加 -> Recallが低下
- 二つセットで使用する
    - 誤検知を減らしたい -> presicionを重視
    - 正例の見逃しを避けたい -> Recallを重視

In [17]:
# F1-score, Fβ-score
from sklearn.metrics import f1_score, fbeta_score

f1 = f1_score(y_true, y_pred)
fbeta = fbeta_score(y_true=y_true, y_pred=y_pred, beta=2)

f1, fbeta

(0.6666666666666665, 0.625)

## f1とf score
- F値ってやつ
- PresicionとRecallの調和平均
    - aとbの調和平均 n = 2の時
    - n / (1/a + 1/b)
    - 全体として着目している数量が同じものに対して適切な平均
    - 今回ではTPが分子で等しいため使用している
    - https://www.cresco.co.jp/blog/entry/10325/
    - 通常の平均と変わらないそんなには変わらない
        - 平均を取る値の全体の内着目してる部分の違い
        - 食塩の量が同じ(cグラム)で水の量が違う(a,b)食塩水を混ぜたときの食塩水はc/((a + b)/2)
- f1
    - 2 / {(1 / recall) + (1 / precision)}
    - 2TP / {2TP + FP + FN}
- fbeteはRecallの重要度をbetaで重みづけできる指標
    - beteが大きいほどRecallが重視される
    - f2などの形で用いられる