# 分類問題における評価指標
分類問題では、通常評価には混同行列を使うのが一般的である。
一方で、混同行列はそのままでは解釈が複雑であるため、混同行列の要素から着目した観点に最適な評価指標を選択する事もある。

## データの用意

In [17]:
from sklearn.datasets import load_wine

data = load_wine()
# 2値分類問題にしたいので、100個のデータのみ使用
X = data.data[:100]
y = data.target[:100]

## 回帰
簡単のために今回はロジスティック回帰を使って、分類問題を解く事にする。

In [24]:
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split

train_X, test_X, train_y, test_y = train_test_split(X, y, test_size=0.2)
lr = LogisticRegression()
lr.fit(train_X, train_y)

pred_y = lr.predict(test_X)

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(


In [25]:
print(test_y)
print(pred_y)

[0 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0]
[1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0]


## 混同行列
得られた予測結果に対して、混同行列を表示する。

In [26]:
from sklearn.metrics import confusion_matrix

cm = confusion_matrix(test_y, pred_y)
print(cm)

[[15  1]
 [ 0  4]]


## 各指標の計算
混同行列の各値から、指標を計算する。

In [31]:
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score

print(f"accuracy is {accuracy_score(test_y, pred_y)}")
print(f"precision is {precision_score(test_y, pred_y)}")
print(f"recall is {recall_score(test_y, pred_y)}")
print(f"f1 is {f1_score(test_y, pred_y):.2f}")

accuracy is 0.95
precision is 0.8
recall is 1.0
f1 is 0.89


このそれぞれの指標の意味は下記

- accuracy(正解率): 予測結果全体に対して、正しく予測できたものの割合
- precision(適合率): Positive(1)であると予想したもののうち、実際にPositive(1)である割合
- recall(再現率): 実データでPositive(1)であるもののうち、Positive(1)であると予測できた割合