<a href="https://colab.research.google.com/github/KrituneX/Hands-on-Machine-Learning-with-Scikit-Learn-Keras-TensorFlow/blob/main/Chapter_7.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Ringkasan Chapter 7: Ensemble Learning
## Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow (2nd Ed.)

### 1. Definisi Ensemble Learning
- Ensemble Learning adalah teknik yang menggabungkan beberapa model pembelajaran mesin untuk meningkatkan akurasi dan stabilitas prediksi.
- Dengan menggabungkan beberapa model, kita dapat mengurangi risiko overfitting dan meningkatkan generalisasi model.
- Metode ini sangat berguna dalam situasi di mana model tunggal mungkin tidak memberikan hasil yang memuaskan.

### 2. Tipe Ensemble Learning
- **Bagging (Bootstrap Aggregating)**:
  - Menggunakan beberapa subset dari data pelatihan untuk melatih model yang sama secara independen.
  - Setiap model dilatih pada subset yang berbeda, dan hasilnya digabungkan untuk menghasilkan prediksi akhir.
  - Contoh: Random Forest.

- **Boosting**:
  - Menggunakan model yang lemah secara berurutan, di mana setiap model baru berfokus pada kesalahan yang dibuat oleh model sebelumnya.
  - Model-model ini digabungkan untuk menghasilkan prediksi akhir.
  - Contoh: AdaBoost, Gradient Boosting.

- **Stacking**:
  - Menggabungkan beberapa model dengan menggunakan model lain (meta-learner) untuk membuat prediksi akhir.
  - Model-model dasar dilatih secara bersamaan, dan hasilnya digunakan sebagai input untuk model meta.

### 3. Keuntungan Ensemble Learning
- Meningkatkan akurasi model dengan mengurangi varians dan bias.
- Meningkatkan stabilitas model terhadap data noise dan outlier.
- Dapat menangani berbagai jenis data dan masalah, termasuk data yang tidak seimbang.
- Mengurangi risiko overfitting dengan menggabungkan prediksi dari beberapa model yang berbeda.

### 4. Rumus untuk Prediksi Ensemble
- Untuk metode voting (klasifikasi):
  $$ \hat{y} = \text{argmax} \sum_{i=1}^{N} h_i(x) $$
  Di mana \( h_i(x) \) adalah prediksi dari model ke-i dan \( N \) adalah jumlah model.

- Untuk regresi:
  $$ \hat{y} = \frac{1}{N} \sum_{i=1}^{N} h_i(x) $$
  Di mana \( h_i(x) \) adalah prediksi dari model ke-i.

### 5. Contoh Penggunaan Ensemble Learning
- Dalam kompetisi data science, seperti Kaggle, banyak peserta menggunakan teknik ensemble untuk meningkatkan akurasi model mereka.
- Metode ini sering kali menghasilkan model yang lebih kuat dan lebih andal dibandingkan dengan model tunggal.

In [None]:
# Contoh Kode untuk Random Forest
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Memuat dataset
iris = load_iris()
X = iris.data
y = iris.target

# Membagi data menjadi data latih dan data uji
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Membuat model Random Forest
rf_clf = RandomForestClassifier(n_estimators=100, random_state=42)
rf_clf.fit(X_train, y_train)

# Melakukan prediksi
y_pred = rf_clf.predict(X_test)

# Menghitung akurasi
accuracy = accuracy_score(y_test, y_pred)
print(f"Akurasi Random Forest: {accuracy:.2f}")

In [None]:
# Contoh Kode untuk AdaBoost
from sklearn.ensemble import AdaBoostClassifier
from sklearn.tree import DecisionTreeClassifier

# Membuat model AdaBoost
ada_clf = AdaBoostClassifier(
    base_estimator=DecisionTreeClassifier(max_depth=1),
    n_estimators=50,
    random_state=42
)
ada_clf.fit(X_train, y_train)

# Melakukan prediksi
y_pred_ada = ada_clf.predict(X_test)

# Menghitung akurasi
accuracy_ada = accuracy_score(y_test, y_pred_ada)
print(f"Akurasi AdaBoost: {accuracy_ada:.2f}")

### 6. Catatan Penting
- **Keunggulan**: Ensemble Learning dapat meningkatkan akurasi model secara signifikan dan mengurangi risiko overfitting. Dengan menggabungkan beberapa model, kita dapat memanfaatkan kekuatan masing-masing model untuk menghasilkan prediksi yang lebih baik.
- **Kelemahan**: Model ensemble bisa lebih kompleks dan memerlukan lebih banyak waktu untuk pelatihan dibandingkan model tunggal. Selain itu, interpretasi model ensemble bisa lebih sulit dibandingkan dengan model tunggal.
- **Penggunaan**: Sangat berguna dalam kompetisi data science dan aplikasi dunia nyata di mana akurasi tinggi sangat penting. Banyak algoritma ensemble yang telah terbukti efektif dalam berbagai jenis masalah, termasuk klasifikasi gambar, analisis teks, dan prediksi waktu.
- **Tips**: Saat menggunakan ensemble learning, penting untuk memilih model dasar yang beragam untuk mendapatkan hasil yang optimal. Kombinasi model yang berbeda dapat memberikan hasil yang lebih baik dibandingkan dengan menggunakan model yang sama.