In [3]:
from sklearn import metrics, datasets
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split

import matplotlib as plt 
from matplotlib.pylab import rcParams #主要作用为指定图片像素
import numpy as np
%matplotlib inline

# 回歸問題
## 常見的評估指標有
[
    
    
MAE
    
    
MSE
    
    
R-square
    
    
]


我們隨機生成(X, y)資料，然後使用線性回歸模型做預測，再使用 MAE, MSE, R-square 評估

In [7]:
#生成資料
x,y = datasets.make_regression(n_features = 1, random_state = 42, noise = 4)
#建立模型
model = LinearRegression()
model.fit(x,y)
prediction = model.predict(x)

#分數衡量
mae = metrics.mean_absolute_error(prediction,y) # 使用 MAE 評估
mse = metrics.mean_squared_error(prediction,y) # 使用 MSE 評估
r2 = metrics.r2_score(prediction,y) # 使用 r-square 評估
print("MAE: ", mae)
print("MSE: ", mse)
print("R-square: ", r2)

MAE:  2.841797252565566
MSE:  12.48868006739824
R-square:  0.9916581036260311


# 分類問題
常見的評估指標有

AUC
F1-Score (Precision, Recall)

In [8]:
# 我們使用 sklearn 內含的乳癌資料集
cancer = datasets.load_breast_cancer()
X_train, X_test, y_train, y_test = train_test_split(cancer.data, cancer.target,test_size = 50, random_state = 0)

In [9]:
print(y_test) # 測試集中的 label

[0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 0 0 0 0 0 1 1 0 1 1 0 1 0 1 0 1 0 1 0 1
 0 1 0 0 1 0 1 1 0 1 1 1 0]


In [10]:
y_pred = np.random.random((50,)) # 我們先隨機生成 50 筆預測值，範圍都在 0~1 之間，代表機率值

In [11]:
print(y_pred)

[0.5880025  0.48860553 0.56759145 0.30485135 0.94313733 0.81329894
 0.37997101 0.12324029 0.38284734 0.45484232 0.56493799 0.21017244
 0.52609333 0.36341143 0.01590238 0.04694656 0.34821803 0.70620199
 0.20236366 0.63801455 0.91778978 0.73785752 0.92756671 0.34136844
 0.26619033 0.07185341 0.2758851  0.13629695 0.7487705  0.70137163
 0.26969933 0.49509568 0.31490121 0.37185576 0.03095422 0.51159489
 0.62294848 0.83987852 0.84377792 0.02219743 0.24101127 0.25399664
 0.91725884 0.0508385  0.61653381 0.29065041 0.92760784 0.58508022
 0.17032694 0.61624063]


# AUC

In [12]:
auc = metrics.roc_auc_score(y_test, y_pred)
# 使用 roc_auc_score 來評估。 **這邊特別注意 y_pred 必須要放機率值進去!**
print("AUC : ",auc) # 得到結果約 0.5，與亂猜的結果相近，因為我們的預測值是用隨機生成的

AUC :  0.45500848896434637


# F1-Score

In [13]:
threshold = 0.5
y_pred_binarized = np.where(y_pred>threshold, 1, 0) # 使用 np.where 函數, 將 y_pred > 0.5 的值變為 1，小於 0.5 的為 0
f1 = metrics.f1_score(y_test, y_pred_binarized) # 使用 F1-Score 評估
precision = metrics.precision_score(y_test, y_pred_binarized) # 使用 Precision 評估
recall = metrics.recall_score(y_test, y_pred_binarized) # 使用 recall 評估
print("F1-Score: ", f1) 
print("Precision: ", precision)
print("Recall: ", recall)


F1-Score:  0.45283018867924524
Precision:  0.5454545454545454
Recall:  0.3870967741935484


# [作業重點]
了解 F1-score 的公式意義，並試著理解程式碼

# 作業
請參考 F1-score 的公式與原始碼，試著寫出 F2-Score 的計算函數

F1-Score 其實是 F-Score 中的 β 值為 1 的特例，代表 Precision 與 Recall 的權重相同


The general formula for non-negative real $\beta$ is :

$$F_\beta = \frac{(1+\beta^2)\cdot(precision\cdot recall)}{(\beta^2 \cdot precision+recall)}$$

In [14]:
import numpy as np
y_pred = np.random.randint(2, size=100)  # 生成 100 個隨機的 0 / 1 prediction
y_true = np.random.randint(2, size=100)  # 生成 100 個隨機的 0 / 1 ground truth

In [15]:
y_pred

array([1, 0, 0, 1, 1, 0, 1, 0, 1, 0, 1, 1, 0, 0, 0, 1, 1, 0, 1, 0, 1, 0,
       1, 0, 1, 0, 0, 1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1,
       0, 1, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 1, 0, 1, 1, 1, 1, 0,
       0, 0, 0, 1, 0, 0, 1, 1, 0, 1, 0, 0, 1, 0, 0, 0, 1, 1, 0, 0, 1, 1,
       1, 1, 0, 1, 0, 1, 1, 0, 1, 0, 0, 1])

In [20]:
precision = metrics.precision_score(y_true, y_pred)
recall = metrics.recall_score(y_true, y_pred)
F2_score = ((1+2**2)*precision*recall)/(2**2*precision+recall)
print('Precision : ',precision)
print('Recall : ',recall)
print('F2_score : ',F2_score)

Precision :  0.5294117647058824
Recall :  0.627906976744186
F2_score :  0.6053811659192825
