
# **Chapter 6: Decision Trees**

## **1. Pendahuluan**

Bab ini membahas Decision Trees untuk klasifikasi dan regresi. Pohon keputusan mudah diinterpretasikan dan menjadi dasar algoritma Random Forest.



## **2. Konsep Decision Tree**

- Memecah data secara berulang untuk memaksimalkan pemisahan antar kelas.
- Struktur: root, internal node, leaf.



## **3. Kriteria Pemecahan**

- **Gini Impurity:**  
  $$
  G_i = 1 - \sum_{k=1}^{n} p_{i,k}^2
  $$

- **Entropy:**  
  $$
  H_i = - \sum_{k=1}^{n} p_{i,k} \log_2 p_{i,k}
  $$



## **4. Membuat Decision Tree**

**Contoh Kode:**


In [None]:

from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier

iris = load_iris()
X = iris.data[:, 2:]  # petal length and width
y = iris.target

tree_clf = DecisionTreeClassifier(max_depth=2)
tree_clf.fit(X, y)



## **5. Visualisasi Decision Tree**

**Contoh Kode:**


In [None]:

from sklearn.tree import export_graphviz

export_graphviz(
    tree_clf,
    out_file="iris_tree.dot",
    feature_names=iris.feature_names[2:],
    class_names=iris.target_names,
    rounded=True,
    filled=True
)



## **6. Membuat Prediksi**

Prediksi dilakukan dengan mengikuti cabang pohon sesuai fitur input.



## **7. Kelebihan dan Kekurangan**

**Kelebihan:** interpretasi mudah, tidak perlu feature scaling.  
**Kekurangan:** rentan overfitting. Solusi: pruning, batasi `max_depth`.



## **8. Decision Tree untuk Regresi**

**Contoh Kode:**


In [None]:

from sklearn.tree import DecisionTreeRegressor

tree_reg = DecisionTreeRegressor(max_depth=2)
tree_reg.fit(X, y)
