<a href="https://colab.research.google.com/github/roberthsu2003/machine_learning/blob/main/%E8%A9%95%E4%BC%B0%E6%8C%87%E6%A8%99/recall.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

### recall

In [1]:
# 導入必要的庫
from sklearn.metrics import recall_score

# 假設數據：癌症篩查的情境
# 真實標籤 (1 表示癌症患者，0 表示非癌症患者)
y_true = [1, 0, 1, 0, 1, 0, 0, 1, 0, 1]  # 10 個樣本的真實標籤
# 模型預測標籤
y_pred = [1, 0, 1, 1, 1, 0, 0, 0, 0, 1]  # 模型對這 10 個樣本的預測

# 計算 TP 和 FN
TP = sum((t == 1 and p == 1) for t, p in zip(y_true, y_pred))  # 正確預測為癌症患者
FN = sum((t == 1 and p == 0) for t, p in zip(y_true, y_pred))  # 錯誤預測為非癌症患者的癌症患者

# 輸出各項結果
print(f"真陽性 (TP): {TP}")  # 正確識別的癌症患者數
print(f"假陰性 (FN): {FN}")  # 錯誤標記為非癌症患者的癌症患者數

# 計算召回率
recall = TP / (TP + FN) if (TP + FN) > 0 else 0  # 避免除以零的情況
print(f"手動計算召回率: {recall:.2f}")

# 使用 sklearn 的 recall_score 驗證
sklearn_recall = recall_score(y_true, y_pred)
print(f"使用 sklearn 計算召回率: {sklearn_recall:.2f}")

真陽性 (TP): 4
假陰性 (FN): 1
手動計算召回率: 0.80
使用 sklearn 計算召回率: 0.80


### 程式碼說明
1. **假數據**：模擬癌症篩查情境，10 個樣本的真實標籤 (y_true) 和模型預測標籤 (y_pred)，其中 1 表示癌症患者，0 表示非癌症患者。
2. **計算混淆矩陣元素**：
    - TP（真陽性）：正確預測為癌症患者的樣本數。
    - FN（假陰性）：錯誤預測為非癌症患者的癌症患者數。
3. **召回率計算**：根據公式 Recall = TP / (TP + FN) 計算，並與 sklearn 的 recall_score 結果進行驗證。程式碼包含除以零的防範措施。
4. **輸出結果**：顯示 TP、FN 和召回率，幫助學生理解召回率的含義及其在癌症篩查中的重要性。

### 預期輸出
假設運行上述程式碼，輸出可能如下：

```
真陽性 (TP): 4
假陰性 (FN): 1
手動計算召回率: 0.80
使用 sklearn 計算召回率: 0.80
```

### 學習建議
- **召回率的重要性**：可強調在癌症篩查中，高召回率確保盡可能多的癌症患者被識別出來，減少漏診（FN）帶來的嚴重後果。
- **限制的討論**：可嘗試召回率不考慮假正例（FP，例如將健康人誤診為患者），並建議結合精確率（Precision）進行全面評估。
- **不均衡數據**：可說明癌症篩查通常是不均衡數據（癌症患者遠少於健康人），召回率特別適合這種場景。
- **擴展練習**：可建議學生修改 y_pred（例如增加 FN），觀察召回率的變化，或使用 seaborn 繪製混淆矩陣以視覺化 TP 和 FN。