In [1]:
import warnings

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sns

warnings.filterwarnings('ignore')

%matplotlib inline

# 2クラス分類での評価指標
1. 混同行列(Confusion Matrix)
2. 正答率(Accuracy)
3. 適合率(Precision)
4. 再現率(Recall)
5. 交差エントロピー誤差(Cross Entropy Loss; LogLoss)
   
---
## 混合行列
二値分類の正解・不正解の種類には以下の4つがある。
  - TP (True Positive) → 正の予測 - 正解
  - FP (False Positive) →正の予測 - 不正解(実際には負)
  - FN (False Negative) →負の予測 - 不正解(実際には正)
  - TN (True Negative) →負の予測 - 正解

1文字目：予測の正誤。T(True)は予測正解、F(False)は予測不正解。  
2文字目：予測の内容。Pは予測が正(Positive)、Nは予測が負(Negative)  

→ これらのマトリックスを混合行列という。


## 正答率(Accuracy)
全予測に対する正答率。
### ・導出方法
$$\frac{TP+TN}{TP+FP+FN+TN}$$


## 適合率(Precision)
正と予測したデータのうち，実際に正であるものの割合。「精度」と呼ぶこともある。
### ・導出方法
$$\frac{TP}{TP+FP}$$


## 再現率(Recall)
実際に正であるもののうち，正であると予測されたものの割合。
### ・導出方法
$$\frac{TP}{TP+FN}$$



## 交差エントロピー誤差
２つの確立分布がどれくらい離れているかを表す指標
### ・導出方法
正解データを $t(k)$、
モデルによって出力される判定を $y(k)$
とするとき、交差エントロピー誤差 $E$は以下のように定義される。
$$E=-\sum_{k} t(k)\log{y(k)}$$


## sklearnで実装
breast_cancer

In [4]:
from sklearn.datasets import load_breast_cancer

breast_cancer=load_breast_cancer()

In [57]:
X=breast_cancer.data[:,:4]
y=breast_cancer.target

X.shape

(569, 4)

In [58]:
df=pd.DataFrame(X,columns=breast_cancer.feature_names[:4])
df['y']=y


df.head()

Unnamed: 0,mean radius,mean texture,mean perimeter,mean area,y
0,17.99,10.38,122.8,1001.0,0
1,20.57,17.77,132.9,1326.0,0
2,19.69,21.25,130.0,1203.0,0
3,11.42,20.38,77.58,386.1,0
4,20.29,14.34,135.1,1297.0,0


In [59]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 569 entries, 0 to 568
Data columns (total 5 columns):
mean radius       569 non-null float64
mean texture      569 non-null float64
mean perimeter    569 non-null float64
mean area         569 non-null float64
y                 569 non-null int32
dtypes: float64(4), int32(1)
memory usage: 20.1 KB


## データの分割(ホールドアウト)

In [60]:
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(df.drop(columns=['y']), df['y'], train_size=0.7, random_state=0)

print(X.shape, X_test.shape)
print(y.shape, y_test.shape)

(569, 4) (171, 4)
(569,) (171,)


In [61]:
# 分割後のクラスバランスを確認
np.bincount(y_train), np.bincount(y_test)

(array([149, 249], dtype=int64), array([ 63, 108], dtype=int64))

## 予測モデル構築(ロジスティック回帰)

In [62]:
from sklearn.linear_model import LogisticRegression
logistic_regression=LogisticRegression()

logistic_regression.fit(X_train, y_train)

LogisticRegression(C=1.0, class_weight=None, dual=False, fit_intercept=True,
                   intercept_scaling=1, l1_ratio=None, max_iter=100,
                   multi_class='warn', n_jobs=None, penalty='l2',
                   random_state=None, solver='warn', tol=0.0001, verbose=0,
                   warm_start=False)

## 予測してみる

In [85]:
X_new = np.array([[33, 53, 200, 1300],
                  [20, 30, 80, 1700]])

logistic_regression.predict(X_new)

array([1, 1])

In [86]:
# 各要素の確率
logistic_regression.predict_proba(X_new)

array([[3.23612812e-05, 9.99967639e-01],
       [3.02130382e-04, 9.99697870e-01]])

## 評価
正答率を算出

In [87]:
from sklearn.metrics import confusion_matrix, accuracy_score, precision_score, recall_score

### 混合行列

In [89]:
cm_train=confusion_matrix(y_true=y_train, y_pred=logistic_regression.predict(X_train))
cm_test=confusion_matrix(y_true=y_test, y_pred=logistic_regression.predict(X_test))

print(f'Train confusion matrics\n{cm_train}')
print(f'Test confusion matrics\n{cm_test}')

Train confusion matrics
[[121  28]
 [ 10 239]]
Test confusion matrics
[[ 55   8]
 [  7 101]]


### 正答率

In [92]:
acc_train=accuracy_score(y_true=y_train, y_pred=logistic_regression.predict(X_train))
acc_test=accuracy_score(y_true=y_test, y_pred=logistic_regression.predict(X_test))

print(f'Train accuracy:{acc_train:.3f}')
print(f'Test accuracy:{acc_test:.3f}')

Train accuracy:0.905
Test accuracy:0.912


### 適合率

In [93]:
prec_train=precision_score(y_true=y_train, y_pred=logistic_regression.predict(X_train))
prec_test=precision_score(y_true=y_test, y_pred=logistic_regression.predict(X_test))

print(f'Train precision:{prec_train:.3f}')
print(f'Test precision:{prec_test:.3f}')

Train precision:0.895
Test precision:0.927


### 再現率

In [94]:
recall_train=recall_score(y_true=y_train, y_pred=logistic_regression.predict(X_train))
recall_test=recall_score(y_true=y_test, y_pred=logistic_regression.predict(X_test))

print(f'Train recall:{recall_train:.3f}')
print(f'Test recall:{recall_test:.3f}')

Train recall:0.960
Test recall:0.935
