<a href="https://colab.research.google.com/github/roberthsu2003/machine_learning/blob/main/%E8%A9%95%E4%BC%B0%E6%8C%87%E6%A8%99/accuracy.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
# 導入必要的庫
from sklearn.metrics import accuracy_score

# 假設數據：垃圾郵件檢測的情境
# 真實標籤 (1 表示垃圾郵件，0 表示非垃圾郵件)
y_true = [1, 0, 1, 1, 0, 0, 1, 0, 1, 0]  # 10 個樣本的真實標籤
# 模型預測標籤
y_pred = [1, 0, 1, 0, 0, 0, 1, 1, 1, 0]  # 模型對這 10 個樣本的預測

# 計算 TP, TN, FP, FN
TP = sum((t == 1 and p == 1) for t, p in zip(y_true, y_pred))  # 正確預測為正類
TN = sum((t == 0 and p == 0) for t, p in zip(y_true, y_pred))  # 正確預測為負類
FP = sum((t == 0 and p == 1) for t, p in zip(y_true, y_pred))  # 錯誤預測為正類
FN = sum((t == 1 and p == 0) for t, p in zip(y_true, y_pred))  # 錯誤預測為負類

# 輸出各項結果
print(f"真陽性 (TP): {TP}")  # 正確識別的垃圾郵件數
print(f"真陰性 (TN): {TN}")  # 正確識別的非垃圾郵件數
print(f"假陽性 (FP): {FP}")  # 錯誤標記為垃圾郵件的非垃圾郵件數
print(f"假陰性 (FN): {FN}")  # 錯誤標記為非垃圾郵件的垃圾郵件數

# 計算準確率
accuracy = (TP + TN) / (TP + TN + FP + FN)
print(f"手動計算準確率: {accuracy:.2f}")

# 使用 sklearn 的 accuracy_score 驗證
sklearn_accuracy = accuracy_score(y_true, y_pred)
print(f"使用 sklearn 計算準確率: {sklearn_accuracy:.2f}")

真陽性 (TP): 4
真陰性 (TN): 4
假陽性 (FP): 1
假陰性 (FN): 1
手動計算準確率: 0.80
使用 sklearn 計算準確率: 0.80


### 程式碼說明
1. 假數據：模擬垃圾郵件檢測，10 個樣本的真實標籤 (y_true) 和模型預測標籤 (y_pred)，其中 1 表示垃圾郵件，0 表示非垃圾郵件。

2. **計算混淆矩陣元素**：
    - **TP（真陽性）**：正確預測為垃圾郵件的樣本數。
    - **TN（真陰性）**：正確預測為非垃圾郵件的樣本數。
    - **FP（假陽性）**：錯誤預測為垃圾郵件的非垃圾郵件數。
    - **FN（假陰性）**：錯誤預測為非垃圾郵件的垃圾郵件數。

3. **準確率計算**：根據公式 Accuracy = (TP + TN) / (TP + TN + FP + FN) 計算，並與 sklearn 的 accuracy_score 結果進行驗證。

4. **輸出結果**：顯示 TP、TN、FP、FN 和準確率

### 預期輸出
假設運行上述程式碼，輸出可能如下：  

```
真陽性 (TP): 4
真陰性 (TN): 4
假陽性 (FP): 1
假陰性 (FN): 1
手動計算準確率: 0.80
使用 sklearn 計算準確率: 0.80
```

### 學習建議

- **數據均衡性**：可提醒學生此範例中的正負類樣本數接近（5 個正類，5 個負類），因此準確率是合適的評估指標。  
- **不均衡數據的限制**：可進一步提供不均衡數據的範例（例如 9 個負類，1 個正類），讓學生觀察準確率的誤導性。  
- **視覺化**：使用 seaborn 或 matplotlib 繪製混淆矩陣，增強對 TP、TN、FP、FN 的理解。