## 📘 I. Logistic Regression là gì?

Logistic Regression là mô hình học có giám sát dùng để **phân loại** đầu vào thành các lớp. Khác với Linear Regression (cho ra giá trị liên tục), Logistic Regression cho ra **xác suất** điểm dữ liệu thuộc về lớp **dương (positive)**.


## 🧮 II. Ý tưởng chính

Ta vẫn tính tổng tuyến tính như Linear Regression:

$$
z = \mathbf{w}^\top \mathbf{x} + b
$$

Sau đó, thay vì dùng trực tiếp $z$, ta đưa nó qua **hàm sigmoid** để thu được xác suất:

$$
\hat{y} = \sigma(z) = \frac{1}{1 + e^{-z}}
$$

* $\hat{y} \in (0, 1)$: xác suất mẫu thuộc lớp 1
* Nếu $\hat{y} \geq 0.5$, dự đoán là **lớp 1**, ngược lại là **lớp 0**


## 📉 III. Hàm mất mát: **Binary Cross Entropy**

Do output là xác suất, ta dùng **log loss**:

$$
\mathcal{L}(\mathbf{w}, b) = -\frac{1}{m} \sum_{i=1}^{m} \left[ y_i \log(\hat{y}_i) + (1 - y_i) \log(1 - \hat{y}_i) \right]
$$

Loss này đảm bảo mô hình **phạt mạnh** nếu dự đoán sai với xác suất cao.


## ⚙️ IV. Tối ưu hoá: Gradient Descent

Không có công thức đóng như Linear Regression. Ta dùng **gradient descent**:

Gradient của hàm mất mát:

$$
\nabla_\mathbf{w} = \frac{1}{m} \sum_{i=1}^{m} (\hat{y}_i - y_i) \cdot \mathbf{x}_i
$$


## 💡 V. Tổng kết pipeline mô hình

```mermaid
flowchart LR
A[Đầu vào: x] --> B[Tính z = w^T x + b]
B --> C[Áp sigmoid: σ(z)]
C --> D[So sánh với y thật]
D --> E[Tính Cross Entropy Loss]
E --> F[Cập nhật w, b bằng GD]
```


## 📊 VI. Đánh giá mô hình phân loại

| Metric        | Ý nghĩa                                     | Dùng khi                         |
| ------------- | ------------------------------------------- | -------------------------------- |
| **Accuracy**  | Tỷ lệ dự đoán đúng                          | Dữ liệu cân bằng                 |
| **Precision** | % đúng trong các dự đoán dương              | Quan trọng khi muốn ít dương giả |
| **Recall**    | % đúng trong tất cả mẫu dương               | Quan trọng khi muốn ít âm giả    |
| **F1-score**  | Trung bình điều hòa của Precision và Recall | Dữ liệu không cân bằng           |
| **ROC-AUC**   | Đánh giá khả năng phân biệt giữa hai lớp    | So sánh mô hình                  |


## 🛡️ VII. Regularization

Logistic Regression rất nhạy với **overfitting** khi có nhiều đặc trưng. Do đó thường dùng thêm:

* **L1 regularization (Lasso)** → loại bỏ đặc trưng không quan trọng
* **L2 regularization (Ridge)** → làm mượt mô hình

Tổng loss sẽ thành:

$$
\mathcal{L}_{\text{reg}} = \mathcal{L}_{\text{BCE}} + \lambda \cdot \text{Penalty}
$$


## 🧪 VIII. Code thực hành với Scikit-learn

```python
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import classification_report

model = LogisticRegression()
model.fit(X_train, y_train)

y_pred = model.predict(X_test)
print(classification_report(y_test, y_pred))
```

**Note:** LogisticRegression trong sklearn mặc định đã có regularization (L2).


## ✅ Ưu - Nhược điểm

| Ưu điểm                    | Nhược điểm                                    |
| -------------------------- | --------------------------------------------- |
| Dễ hiểu, diễn giải rõ ràng | Không tốt với quan hệ phi tuyến               |
| Chạy nhanh, hiệu quả cao   | Nhạy cảm với outlier                          |
| Có thể thêm regularization | Dễ bị ảnh hưởng nếu đặc trưng không chuẩn hóa |


## 🔍 So sánh nhanh: Linear vs Logistic Regression

| Tiêu chí      | Linear Regression        | Logistic Regression  |
| ------------- | ------------------------ | -------------------- |
| Bài toán      | Dự đoán số thực          | Phân loại nhị phân   |
| Output        | $\hat{y} \in \mathbb{R}$ | $\hat{y} \in (0,1)$  |
| Hàm mất mát   | MSE                      | Binary Cross Entropy |
| Hàm kích hoạt | Không có                 | Sigmoid              |
