## [教學目標]
學習 sklearn 中，各種評估指標的使用與意義  

## [範例重點]
注意觀察各指標的數值範圍，以及輸入函數中的資料格式

In [1]:
# 引入函式庫
from sklearn import metrics, datasets
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split

import matplotlib.pyplot as plt
from matplotlib.pylab import rcParams
import numpy as np
%matplotlib inline

## 回歸問題
常見的評估指標有
- MAE
- MSE
- R-square  


我們隨機生成(X, y)資料，然後使用線性回歸模型做預測，再使用 MAE, MSE, R-square 評估

In [3]:
# 生成資料
x, y = datasets.make_regression(n_features=1, random_state=42, noise=4)

# 建立迴歸模型
model = LinearRegression()

# 將資料放進模型訓練
model.fit(x, y)

# 進行預測
prediction = model.predict(x)

# 使用 MAE 與 MSE 評估
mae = metrics.mean_absolute_error(prediction, y)
mse = metrics.mean_squared_error(prediction, y)

# 使用 r-square 評估
r2 = metrics.r2_score(prediction, y)

print('MAE：', mae)
print('MSE：', mse)
print('R-square：', r2)

MAE： 2.841797252565566
MSE： 12.48868006739824
R-square： 0.9916581036260311


## 分類問題
常見的評估指標有
- AUC
- F1-Score (Precision, Recall)

In [4]:
# 使用 sklearn 內涵的乳癌資料集
cancer = datasets.load_breast_cancer()

x_train, x_test, y_train, y_test = train_test_split(cancer.data, cancer.target, test_size=50, random_state=0)

In [5]:
# 測試集中的 label
print(y_test)

[0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 0 0 0 0 0 1 1 0 1 1 0 1 0 1 0 1 0 1 0 1
 0 1 0 0 1 0 1 1 0 1 1 1 0]


In [6]:
# 先隨機生成 50 筆預測值，範圍都在 0~1 之間，代表機率值
y_pred = np.random.random( (50,) )

In [7]:
print(y_pred)

[0.5818829  0.40355964 0.10098341 0.69086033 0.79583333 0.60427576
 0.21481332 0.55237186 0.94780632 0.45993416 0.42335961 0.57958649
 0.51489769 0.95073919 0.76154901 0.7149507  0.45482677 0.76603868
 0.38927831 0.93705245 0.15973299 0.04819042 0.44627021 0.95445459
 0.89247762 0.60018311 0.68161384 0.93959681 0.82612764 0.34147117
 0.17860603 0.50489725 0.80660031 0.59026097 0.69337507 0.70967075
 0.99588124 0.47517224 0.3160728  0.82769152 0.82660009 0.35958336
 0.02082487 0.0675471  0.27241479 0.05500784 0.85890034 0.9174447
 0.34151263 0.38332085]


## **AUC**

In [9]:
# 使用 roc_auc_score 來評估
# 注意 y_pred 必須要放機率值進去!
auc = metrics.roc_auc_score(y_test, y_pred)
print('AUC：', auc) # 得到結果約 0.5，與亂猜的結果相近，因為我們的預測值是用隨機生成的

AUC： 0.5314091680814941


## **F1-Score**

In [10]:
# 設定閾值
threshold = 0.5

# 使用 np.where 函數, 將 y_pred > 0.5 的值變為 1，小於 0.5 的為 0
y_pred_binarized = np.where(y_pred>threshold, 1, 0)

# 使用 F1-score 評估
f1 = metrics.f1_score(y_test, y_pred_binarized)

# 使用 Precision、recall 評估
precision = metrics.precision_score(y_test, y_pred_binarized)
recall = metrics.recall_score(y_test, y_pred_binarized)

print('F1-Score：', f1)
print('Precision：', precision)
print('Recall：', recall)

F1-Score： 0.6000000000000001
Precision： 0.6206896551724138
Recall： 0.5806451612903226
