# 回歸問題
    * 常見的評估指標有
        觀察「預測值」 (Prediction) 與「實際值」 (Ground truth) 的差距
        -MAE: 範圍 [-∞,∞]
        -MSE: 範圍 [-∞,∞]
        -R-square: 範圍 [0, 1]

In [1]:
from sklearn import metrics, datasets
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split

import matplotlib.pyplot as plt
from matplotlib.pylab import rcParams
import numpy as np
%matplotlib inline

In [5]:
# 資料
X, y = datasets.make_regression(n_features=1, random_state=42, noise=4) # 生成資料
model = LinearRegression() # 建立回歸模型
model.fit(X, y) # 將資料放進模型訓練
prediction = model.predict(X) # 進行預測

In [4]:
# 評估
mae = metrics.mean_absolute_error(prediction, y) # 使用 MAE 評估
mse = metrics.mean_squared_error(prediction, y) # 使用 MSE 評估
r2 = metrics.r2_score(prediction, y) # 使用 r-square 評估
print("MAE: ", mae)
print("MSE: ", mse)
print("R-square: ", r2)

MAE:  2.8417972525655673
MSE:  12.488680067398239
R-square:  0.9916581036260311


# 分類問題
    * 常見的評估指標有
        觀察「預測值」 (prediction) 與「實際值」 (Ground truth) 的正確程度
        -AUC: 範圍 [0, 1]
        -F1-Score (Precision, Recall): 範圍 [0, 1]

### 1.評估指標 - 分類 - AUC, Area Under Curve

    - AUC 指摽是分類問題常⽤的指標，通常分類問題都需要定⼀個閾值(threshold) 
        來決定分類的類別 (通常為機率 > 0.5 判定為 1, 機率 < 0.5 判定為 0)
    - AUC 是衡量曲線下的⾯積，因此可考量所有閾值下的準確性，因此 AUC也廣泛地在分類問題的比賽中使⽤
    
    
### 2.評估指標 - 分類 - F1-Score
    - 分類問題中，我們有時會對某⼀類別的準確率特別有興趣
    - Precision，Recall 則是針對某類別進⾏評估
        • Precision: 模型判定True，樣本確實為True的比例
        • Recall: 模型判定的False，佔樣本所有False的比例
    - F1-Score 則是 Precision, Recall 的調和平均數

In [6]:
# 資料
cancer = datasets.load_breast_cancer() # 我們使用 sklearn 內含的乳癌資料集
X_train, X_test, y_train, y_test = train_test_split(cancer.data, cancer.target, test_size=50, random_state=0)
y_pred = np.random.random((50,)) # 我們先隨機生成 50 筆預測值，範圍都在 0~1 之間，代表機率值

In [7]:
# AUC評估
auc = metrics.roc_auc_score(y_test, y_pred) # 使用 roc_auc_score 來評估。 **這邊特別注意 y_pred 必須要放機率值進去!**
print("AUC: ", auc) # 得到結果約 0.5，與亂猜的結果相近，因為我們的預測值是用隨機生成的

AUC:  0.5466893039049237


In [8]:
# F1評估
threshold = 0.5 
y_pred_binarized = np.where(y_pred>threshold, 1, 0) # 使用 np.where 函數, 將 y_pred > 0.5 的值變為 1，小於 0.5 的為 0
f1 = metrics.f1_score(y_test, y_pred_binarized) # 使用 F1-Score 評估
precision = metrics.precision_score(y_test, y_pred_binarized) # 使用 Precision 評估
recall  = metrics.recall_score(y_test, y_pred_binarized) # 使用 recall 評估
print("F1-Score: ", f1) 
print("Precision: ", precision)
print("Recall: ", recall)


F1-Score:  0.5964912280701755
Precision:  0.6538461538461539
Recall:  0.5483870967741935


In [11]:
# F2評估
beta = 2
scoreF2 = (1 + beta**2) * (precision * recall) / (beta**2 * precision + recall)
print("F2-Score: ", scoreF2) 

F2-Score:  0.5666666666666667
