<a href="https://colab.research.google.com/github/roberthsu2003/machine_learning/blob/main/%E8%A9%95%E4%BC%B0%E6%8C%87%E6%A8%99/precision.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 精確率(precision)

In [1]:
# 導入必要的庫
from sklearn.metrics import precision_score

# 假設數據：詐欺檢測的情境
# 真實標籤 (1 表示詐欺交易，0 表示正常交易)
y_true = [1, 0, 0, 1, 0, 1, 0, 0, 1, 0]  # 10 個樣本的真實標籤
# 模型預測標籤
y_pred = [1, 0, 1, 1, 0, 0, 0, 0, 1, 0]  # 模型對這 10 個樣本的預測

# 計算 TP 和 FP
TP = sum((t == 1 and p == 1) for t, p in zip(y_true, y_pred))  # 正確預測為詐欺交易
FP = sum((t == 0 and p == 1) for t, p in zip(y_true, y_pred))  # 錯誤預測為詐欺交易的正常交易

# 輸出各項結果
print(f"真陽性 (TP): {TP}")  # 正確識別的詐欺交易數
print(f"假陽性 (FP): {FP}")  # 錯誤標記為詐欺交易的正常交易數

# 計算精確率
precision = TP / (TP + FP) if (TP + FP) > 0 else 0  # 避免除以零的情況
print(f"手動計算精確率: {precision:.2f}")

# 使用 sklearn 的 precision_score 驗證
sklearn_precision = precision_score(y_true, y_pred)
print(f"使用 sklearn 計算精確率: {sklearn_precision:.2f}")

真陽性 (TP): 3
假陽性 (FP): 1
手動計算精確率: 0.75
使用 sklearn 計算精確率: 0.75


### 程式碼說明
1. **假數據**：模擬詐欺檢測情境，10 個樣本的真實標籤 (y_true) 和模型預測標籤 (y_pred)，其中 1 表示詐欺交易，0 表示正常交易。
2. **計算混淆矩陣元素**：
    - TP（真陽性）：正確預測為詐欺交易的樣本數。
    - FP（假陽性）：錯誤預測為詐欺交易的正常交易數。
3. **精確率計算**：根據公式 Precision = TP / (TP + FP) 計算，並與 sklearn 的 precision_score 結果進行驗證。程式碼包含除以零的防範措施。  
4. **輸出結果**：顯示 TP、FP 和精確率，幫助學生理解精確率的含義及其在詐欺檢測中的重要性。

### 預期輸出
假設運行上述程式碼，輸出可能如下：

```
真陽性 (TP): 3
假陽性 (FP): 1
手動計算精確率: 0.75
使用 sklearn 計算精確率: 0.75
```

### 學習建議
- **精確率的重要性**：可強調在詐欺檢測中，高精確率意味著模型標記為詐欺的交易有很高比例是正確的，減少誤報（FP）帶來的調查成本。

- **限制的討論**：可提醒學生精確率不考慮漏報（FN，例如遺漏的詐欺交易），並建議結合召回率（Recall）進行全面評估。

- **不均衡數據**：可說明詐欺檢測通常是不均衡數據（詐欺交易遠少於正常交易），精確率特別適合這種場景。

- **擴展練習**：可建議學生修改 y_pred（例如增加 FP），觀察精確率的變化，或使用 seaborn 繪製混淆矩陣以視覺化 TP 和 FP。