## 🧠 I. GBM là gì?

**Gradient Boosting Machine (GBM)** là một **thuật toán boosting** tạo ra mô hình mạnh từ **nhiều mô hình yếu (thường là decision trees)** bằng cách **học từ lỗi của mô hình trước đó**.

> GBM = Tập hợp các cây nhỏ → Mỗi cây học để sửa lỗi của tổ hợp trước đó
> → Học dần dần, theo hướng **giảm loss** thông qua **gradient descent**.


## 🔁 II. Ý tưởng tổng quát

Giả sử bài toán hồi quy (phân loại cũng áp dụng tương tự):

1. Khởi tạo mô hình với 1 giá trị đơn giản, ví dụ:

   $$
   F_0(x) = \arg\min_c \sum_{i=1}^n L(y_i, c)
   $$

2. Với mỗi vòng lặp $m = 1, 2, ..., M$:

   * Tính **residual**: đạo hàm âm của loss

     $$
     r_i^{(m)} = - \left[ \frac{\partial L(y_i, F(x_i))}{\partial F(x_i)} \right]_{F(x) = F_{m-1}(x)}
     $$
   * Fit 1 **tree** $h_m(x)$ vào residual $r_i^{(m)}$
   * Cập nhật mô hình:

     $$
     F_m(x) = F_{m-1}(x) + \eta \cdot h_m(x)
     $$

     Với $\eta$: learning rate


## ⚙️ III. Các thành phần quan trọng

| Thành phần               | Mô tả                                 |
| ------------------------ | ------------------------------------- |
| **Base Learner**         | Thường là cây quyết định nhỏ (stump)  |
| **Loss function**        | Hồi quy: MSE; Phân loại: log-loss     |
| **Gradient**             | Dẫn hướng việc học từng bước          |
| **Learning rate (η)**    | Điều chỉnh mức học từng vòng          |
| **Number of estimators** | Số lượng cây (vòng boosting)          |
| **Subsampling**          | Tăng randomization, chống overfitting |
| **Max depth**            | Độ sâu mỗi cây con                    |


## 📊 IV. Ưu & Nhược điểm

| Ưu điểm                                      | Nhược điểm                                    |
| -------------------------------------------- | --------------------------------------------- |
| Mạnh, thường đứng top trong các bài toán ML  | Huấn luyện chậm (sequential)                  |
| Xử lý dữ liệu dạng bảng rất tốt              | Nhạy cảm với overfitting nếu không regularize |
| Linh hoạt – hỗ trợ nhiều loss function       | Cần tinh chỉnh nhiều tham số                  |
| Có thể mở rộng (XGBoost, LightGBM, CatBoost) | Khó giải thích hơn random forest              |


## 🧪 V. Code ví dụ với `sklearn.ensemble.GradientBoostingClassifier`

```python
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.datasets import load_iris
from sklearn.metrics import classification_report

X, y = load_iris(return_X_y=True)
model = GradientBoostingClassifier(n_estimators=100, learning_rate=0.1, max_depth=3)
model.fit(X, y)

y_pred = model.predict(X)
print(classification_report(y, y_pred))
```


## 🔥 VI. Các biến thể hiện đại hơn của GBM

| Tên          | Ưu điểm                       | Đặc trưng                   |
| ------------ | ----------------------------- | --------------------------- |
| **XGBoost**  | Nhanh, regularization tốt     | Hỗ trợ pruning & parallel   |
| **LightGBM** | Rất nhanh, scale tốt          | Leaf-wise growth, histogram |
| **CatBoost** | Xử lý tốt categorical feature | Không cần encode thủ công   |


## 🔍 VII. So sánh GBM với các mô hình khác

| Mô hình            | So sánh                                             |
| ------------------ | --------------------------------------------------- |
| **Random Forest**  | Bagging song song vs Boosting tuần tự               |
| **SVM**            | GBM tốt hơn với feature nhiều, SVM tốt với ít chiều |
| **Neural Network** | GBM tốt với tabular, NN tốt với ảnh, âm thanh       |
| **Naive Bayes**    | GBM mạnh hơn nhiều, NB chỉ mạnh ở text đặc trưng rõ |


## 🎓 Tổng kết

| Mục        | Nội dung                                     |
| ---------- | -------------------------------------------- |
| Loại       | Ensemble – Boosting                          |
| Thành phần | Nhiều cây con học tuần tự                    |
| Ưu điểm    | Mạnh, linh hoạt, phù hợp dữ liệu dạng bảng   |
| Nhược điểm | Huấn luyện chậm, dễ overfit nếu không tuning |
| Biến thể   | XGBoost, LightGBM, CatBoost                  |
