
# **Chapter 7: Ensemble Learning and Random Forests**

## **1. Pendahuluan**

Bab ini membahas Ensemble Learning untuk menggabungkan beberapa model sederhana menjadi satu model yang lebih kuat. Random Forest adalah contoh Ensemble Learning populer.



## **2. Konsep Ensemble Learning**

Gabungan banyak model independen untuk hasil rata-rata yang lebih stabil dan akurat.



## **3. Voting Classifier**

Gabungkan beberapa prediktor berbeda.

**Contoh Kode:**


In [None]:

from sklearn.ensemble import VotingClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
from sklearn.tree import DecisionTreeClassifier

log_clf = LogisticRegression()
svm_clf = SVC(probability=True)
dt_clf = DecisionTreeClassifier()

voting_clf = VotingClassifier(
    estimators=[('lr', log_clf), ('svc', svm_clf), ('dt', dt_clf)],
    voting='soft'
)

voting_clf.fit(X_train, y_train)



## **4. Bagging and Pasting**

**Bagging:** Bootstrap sampling dengan replacement.  
**Pasting:** Subset tanpa replacement.

Mengurangi variance model.



## **5. Random Forests**

Random Forest = kumpulan Decision Trees dengan teknik Bagging + subset fitur.

**Contoh Kode:**


In [None]:

from sklearn.ensemble import RandomForestClassifier

rnd_clf = RandomForestClassifier(n_estimators=500, max_leaf_nodes=16, n_jobs=-1)
rnd_clf.fit(X_train, y_train)



## **6. Feature Importance**

Random Forest dapat mengukur pentingnya fitur.

**Contoh Kode:**


In [None]:

for name, score in zip(iris.feature_names, rnd_clf.feature_importances_):
    print(name, ":", score)



## **7. AdaBoost**

Model secara berurutan memperbaiki error model sebelumnya.

**Contoh Kode:**


In [None]:

from sklearn.ensemble import AdaBoostClassifier
from sklearn.tree import DecisionTreeClassifier

ada_clf = AdaBoostClassifier(
    DecisionTreeClassifier(max_depth=1),
    n_estimators=200,
    algorithm="SAMME.R",
    learning_rate=0.5
)
ada_clf.fit(X_train, y_train)



## **8. Gradient Boosting**

Model baru mempelajari residual dari model sebelumnya.

**Contoh Kode:**


In [None]:

from sklearn.ensemble import GradientBoostingRegressor

gbrt = GradientBoostingRegressor(max_depth=2, n_estimators=3, learning_rate=1.0)
gbrt.fit(X, y)
