# 混同行列（2クラス分類の場合）

In [2]:
# 必要なライブラリを読込
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
% matplotlib inline

In [3]:
# versicolorとversinicaの二値分類をする
from sklearn.datasets import load_iris
iris = load_iris()
X_1 = iris.data[50:, [0, 2]]
y_1 = iris.target[50:]

# データセットの分割
from sklearn.model_selection import train_test_split
X_1_train, X_1_test, y_1_train, y_1_test = train_test_split(X_1, y_1, test_size=0.3, random_state=0)

# 線形SVCの学習
from sklearn.svm import SVC
svc_1 = SVC(kernel='linear', C=1.0)
svc_1.fit(X_1_train, y_1_train)

SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,
  decision_function_shape='ovr', degree=3, gamma='auto', kernel='linear',
  max_iter=-1, probability=False, random_state=None, shrinking=True,
  tol=0.001, verbose=False)

## 正答率
｢全体のうち､どれだけの割合で正解できたか｣を表す指標<br>
予測で当てられたサンプル数/全体のサンプル数<br>

-> サンプル数の少ないクラスを軽視してしまっても､ある程度の高い数値が得られてしまいます

In [4]:
# 正答率を出力
from sklearn import metrics
metrics.accuracy_score(y_1_test, svc_1.predict(X_1_test))

0.9

## 再現率
｢陽性であるサンプルを､いかに見抜けたか｣を表す指標<br>
見抜けた陽性のサンプル数 / すべての陽性のサンプル数<br>

-> ｢少しでも陽性の可能性があるものは､念のため陽性にしておこう｣という考え方をすると､再現率は高くなることになります｡

In [5]:
# 再現率を出力
metrics.recall_score(y_1_test, svc_1.predict(X_1_test))

0.8666666666666667

## 適合率
｢モデルによる陽性判定が､どの程度信頼できるか｣を表す指標<br>
本当に陽性であったサンプル数 / 陽性と判断したサンプル数<br>


→　｢確実に陽性だと思えるものしか､陽性と判定しない｣という考え方をすると､適合率は高くなることになります

In [6]:
# 適合率を出力
metrics.precision_score(y_1_test, svc_1.predict(X_1_test))

0.9285714285714286

## F値
再現率と適合率の平均

In [7]:
# F値を出力
metrics.f1_score(y_1_test, svc_1.predict(X_1_test))

0.896551724137931

# 混同行列（多クラス分類の場合）

In [8]:
# 3クラス分類を実行する
iris = load_iris()
X_2 = iris.data[:, [0, 2]]
y_2 = iris.target

# データセットの分割
X_2_train, X_2_test, y_2_train, y_2_test = train_test_split(X_2, y_2, test_size=0.3, random_state=0)

# 線形SVCの学習
from sklearn.svm import SVC
svc_2 = SVC(kernel='linear', C=1.0)
svc_2.fit(X_2_train, y_2_train)

SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,
  decision_function_shape='ovr', degree=3, gamma='auto', kernel='linear',
  max_iter=-1, probability=False, random_state=None, shrinking=True,
  tol=0.001, verbose=False)

## ミクロ平均
クラスごとのサンプル数の偏りを調整しない場合の平均の取り方

In [14]:
# 適合率のミクロ平均
metrics.precision_score(y_2_test, svc_2.predict(X_2_test), average='micro')

0.9555555555555556

In [15]:
# 再現率のミクロ平均
metrics.recall_score(y_2_test, svc_2.predict(X_2_test), average='micro')

0.9555555555555556

In [16]:
# F値のミクロ平均を出力
# averageの指定必須
metrics.f1_score(y_2_test, svc_2.predict(X_2_test), average='micro')

0.9555555555555556

## マクロ平均
サンプル数の偏りを調整する場合の平均の取り方<br>
(各クラスのごとに個別に評価指標を求めてしまい､その後で性能指標の平均を取ります)

In [11]:
# 適合率のマクロ平均
metrics.precision_score(y_2_test, svc_2.predict(X_2_test), average='macro')

0.9511784511784511

In [12]:
# 再現率のマクロ平均
metrics.recall_score(y_2_test, svc_2.predict(X_2_test), average='macro')

0.9511784511784511

In [13]:
# F値のマクロ平均を出力
# averageの指定必須
metrics.f1_score(y_2_test, svc_2.predict(X_2_test), average='macro')

0.9511784511784511