在第六天的學習中，我們將重點學習 **模型評估與指標**，特別是如何使用精確度、召回率、F1 分數以及 ROC 曲線來評估分類模型的性能。

這些指標有助於衡量模型在不同情況下的表現，並幫助你做出更好的模型選擇。

---

### 1. **精確度（Precision）**

**精確度** 是指模型在所有被分類為正類的樣本中，實際為正類的比例。精確度的公式為：
$$
\text{Precision} = \frac{\text{TP}}{\text{TP} + \text{FP}}
$$
其中：
- **TP（True Positive）：** 模型正確預測為正類的樣本數。
- **FP（False Positive）：** 模型錯誤預測為正類的樣本數。

#### **應用場景：**
精確度適合用在錯誤分類正類的代價較高的情況下。例如，在垃圾郵件檢測中，將正常郵件錯誤分類為垃圾郵件的代價較大，因此我們關注精確度。

---

### 2. **召回率（Recall）**

**召回率** 是指模型在所有實際為正類的樣本中，被正確分類為正類的比例。召回率的公式為：
$$
\text{Recall} = \frac{\text{TP}}{\text{TP} + \text{FN}}
$$
其中：
- **FN（False Negative）：** 模型錯誤預測為負類的樣本數。

#### **應用場景：**
召回率適合用在錯誤分類為負類的代價較高的情況下。例如，在醫學診斷中，錯過一個患病患者的代價較大，因此我們更關注召回率。

---

### 3. **F1 分數（F1 Score）**

**F1 分數** 是精確度和召回率的調和平均值，用來在兩者之間取得平衡。F1 分數的公式為：
$$
F1 = 2 \cdot \frac{\text{Precision} \cdot \text{Recall}}{\text{Precision} + \text{Recall}}
$$

#### **應用場景：**
F1 分數在精確度和召回率同樣重要時使用，適合處理不平衡數據集的情況。

---

### 4. **ROC 曲線（Receiver Operating Characteristic Curve）**

**ROC 曲線** 是通過繪製 **真正率（TPR）** 與 **假正率（FPR）** 之間的關係來評估模型的分類性能。真正率與召回率相同，而假正率的公式為：
$$
\text{FPR} = \frac{\text{FP}}{\text{FP} + \text{TN}}
$$
其中：
- **TN（True Negative）：** 模型正確預測為負類的樣本數。

#### **AUC 指標（Area Under the Curve）**
**AUC** 是 ROC 曲線下方的面積，值越接近 1 表示模型越好。AUC 值的範圍為 0.5 到 1，0.5 表示隨機猜測，1 表示完美分類。

---

### 5. **混淆矩陣（Confusion Matrix）**

混淆矩陣是一個具體的表格，用來表示模型的預測結果。它由四部分組成：
- **TP（True Positive）：** 正確預測為正類。
- **FP（False Positive）：** 錯誤預測為正類。
- **TN（True Negative）：** 正確預測為負類。
- **FN（False Negative）：** 錯誤預測為負類。

#### **示例：**
|   | 實際正類 | 實際負類 |
|---|---------|---------|
| **預測正類** | TP      | FP      |
| **預測負類** | FN      | TN      |

混淆矩陣可以幫助我們直觀地理解模型的預測性能。

---

### 6. **實際應用與選擇合適的指標**

- **精確度高而召回率低：** 適合錯誤分類正類代價高的場景（如垃圾郵件檢測）。
- **召回率高而精確度低：** 適合錯誤分類負類代價高的場景（如醫學診斷）。
- **F1 分數：** 適合當你需要在精確度與召回率之間取得平衡時，特別是數據不平衡的情況下。
- **ROC 曲線與 AUC：** 適合比較不同模型的整體性能。

透過使用這些指標，你可以更深入地了解模型的優劣，從而進行更合理的模型選擇和調整。