<a href="https://colab.research.google.com/github/hamdansyaif/DeepLearning/blob/main/Hands-On-ML2/Chapter-07/Analisis_Chapter_7.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


---

# 📘 **Analisis Teori & Kode: Chapter 7 – Ensemble Learning**

---

## 1. 🗳️ **Voting Classifier**

### 🔹 *Teori:*

* Voting adalah teknik sederhana untuk menggabungkan beberapa prediksi model.
* **Hard voting** → berdasarkan mayoritas kelas.
* **Soft voting** → berdasarkan probabilitas prediksi rata-rata.

### 🔹 *Implementasi:*

```python
VotingClassifier(estimators=[...], voting="hard"/"soft")
```

### 🔹 *Analisis:*

* Cocok untuk model yang saling **komplementer**.
* **VotingClassifier** efektif jika tiap model punya kinerja stabil dan tidak terlalu bias.
* Dalam Exercise 8, **menghapus SVM** (karena performa buruk) bisa **meningkatkan akurasi ensemble**.

---

## 2. 🌲 **Bagging & Pasting**

### 🔹 *Teori:*

* **Bagging (Bootstrap Aggregating):** Model dilatih pada subset data yang di-*sampling* dengan replacement.
* **Pasting:** Sama dengan Bagging, tapi tanpa replacement.
* Tujuan: menurunkan variance.

### 🔹 *Implementasi:*

```python
BaggingClassifier(estimator=DecisionTreeClassifier(...), n_estimators=500, bootstrap=True)
```

### 🔹 *Analisis:*

* Membuat model lebih stabil dibanding satu Decision Tree.
* Hasil decision boundary **lebih smooth** dan generalisasi lebih baik.
* **OOB Score** (Out-of-Bag) dapat digunakan sebagai validasi otomatis → sangat efisien untuk evaluasi tanpa split tambahan.

---

## 3. 🌳 **Random Forest**

### 🔹 *Teori:*

* Random Forest = Bagging + Random Subset of Features saat split.
* Ini memperkuat keanekaragaman model dan mengurangi korelasi antar pohon.

### 🔹 *Implementasi:*

```python
RandomForestClassifier(max_leaf_nodes=16, n_estimators=500)
```

### 🔹 *Analisis:*

* Random Forest sangat powerful dan sering menjadi baseline default.
* Prediksinya sangat mirip dengan **BaggingClassifier** jika parameternya disesuaikan.
* Kita juga gunakan `.feature_importances_` untuk menganalisis **kontribusi fitur**.

---

## 4. 🧠 **Feature Importance**

### 🔹 *Teori:*

* Random Forest dapat memberikan skor pentingnya fitur berdasarkan kontribusi terhadap pengurangan impurity.
* Ini sangat berguna untuk interpretasi dan seleksi fitur.

### 🔹 *Visualisasi:*

* Digunakan pada dataset **Iris** dan **MNIST** (untuk melihat pentingnya piksel).

### 🔹 *Analisis:*

* Fitur-fitur seperti **panjang dan lebar petal** di dataset Iris paling berkontribusi.
* Untuk MNIST, piksel-piksel di tengah digit paling penting dalam prediksi angka.

---

## 5. ⚡ **AdaBoost**

### 🔹 *Teori:*

* **Boosting** adalah teknik sequential, tiap model belajar dari kesalahan model sebelumnya.
* **AdaBoost:** Mengubah *weight* pada data; kesalahan besar jadi lebih penting di iterasi berikutnya.

### 🔹 *Implementasi:*

```python
AdaBoostClassifier(estimator=DecisionTreeClassifier(max_depth=1), n_estimators=200)
```

### 🔹 *Analisis:*

* Cocok untuk model sederhana (mis. stump)
* Model akhir jadi **lebih fokus pada kasus sulit**
* Decision boundary tampak **lebih tajam** daripada Bagging

---

## 6. 🪜 **Gradient Boosting (Manual & Sklearn)**

### 🔹 *Teori:*

* Tiap model baru belajar dari **residu** (error dari model sebelumnya).
* GBM = Optimisasi fungsi loss secara bertahap.
* Learning rate + jumlah pohon → kendali atas over/underfitting.

### 🔹 *Manual Implementation:*

```python
residual = y - tree1.predict(X)
tree2.fit(X, residual)
```

### 🔹 *Sklearn:*

```python
GradientBoostingRegressor(n_estimators=200, learning_rate=0.1)
```

### 🔹 *Analisis:*

* Gradient boosting **lebih fleksibel dan akurat** daripada AdaBoost.
* Risiko overfitting tinggi jika `n_estimators` terlalu besar.
* **Early stopping** efektif untuk membatasi jumlah pohon optimal.

---

## 7. 🚀 **XGBoost**

### 🔹 *Teori:*

* **Extreme Gradient Boosting**
* Implementasi C++ yang cepat, scalable, dan mendukung regularisasi (L1/L2)
* Populer di kompetisi Kaggle

### 🔹 *Implementasi:*

```python
xgboost.XGBRegressor(...).fit(...)
```

### 🔹 *Analisis:*

* Performanya sangat baik, bahkan di dataset kecil seperti parabola regression.
* Fitur `early_stopping_rounds` sangat membantu, dengan penyesuaian versi XGBoost (v1.7.6 aman).
* Learning curve dan MSE rendah menunjukkan kemampuan adaptasi terhadap noise dan pola non-linear.

---

## 8. 🧱 **Stacking (Manual Blender)**

### 🔹 *Teori:*

* Gabungkan prediksi beberapa model ke **meta-model (blender)**
* Blender belajar **kombinasi optimal** dari output model-model base

### 🔹 *Implementasi:*

```python
X_stack = np.c_[model1.predict(X), model2.predict(X), ...]
blender.fit(X_stack, y)
```

### 🔹 *Analisis:*

* Sering outperform voting karena belajar bagaimana menggabungkan prediksi.
* Risiko: overfitting jika base model terlalu mirip.
* Dalam Exercise 9, menggunakan Random Forest sebagai blender menunjukkan hasil OOB dan test akurasi sangat baik.

---

# ✅ **Kesimpulan Umum**

| Teknik            | Kelebihan                              | Kekurangan                               |
| ----------------- | -------------------------------------- | ---------------------------------------- |
| Voting            | Simple, cepat                          | Tidak adaptif, semua model dianggap sama |
| Bagging           | Stabil, bisa pakai OOB                 | Butuh banyak model                       |
| Random Forest     | Powerful, punya feature importance     | Tidak selalu optimal                     |
| AdaBoost          | Fokus pada error                       | Rentan noise                             |
| Gradient Boosting | Lebih presisi, bisa di-tune            | Overfit jika tak dikontrol               |
| XGBoost           | Cepat, scalable, regularisasi built-in | Lebih kompleks konfigurasi               |
| Stacking          | Potensi terbaik, sangat fleksibel      | Rentan overfit jika tak diatur baik      |

---
