# Chapter 6: Decision Trees

Decision Tree merupakan salah satu algoritma Machine Learning yang paling mudah dipahami secara konseptual. Model ini meniru proses pengambilan keputusan manusia dengan membagi data ke dalam serangkaian aturan berbasis kondisi.

Decision Tree dapat digunakan untuk berbagai jenis tugas, antara lain:
- classification,
- regression,
- serta permasalahan multi-output.

Meskipun sederhana secara konsep, Decision Tree mampu memodelkan hubungan yang kompleks pada data. Selain itu, algoritma ini menjadi fondasi bagi metode ensemble populer seperti Random Forest dan Gradient Boosting, sehingga pemahaman terhadap Decision Tree sangat penting.


## 1. Training and Visualizing a Decision Tree

Untuk mempelajari prinsip kerja **Decision Tree**, kita akan melatih sebuah model menggunakan **dataset Iris**, yang dikenal sederhana dan sering dijadikan dataset contoh dalam Machine Learning.

Agar struktur pohon lebih mudah dianalisis, hanya dua fitur yang digunakan dalam eksperimen ini, yaitu:
- panjang kelopak bunga (petal length)
- lebar kelopak bunga (petal width)

Pembatasan jumlah fitur ini membantu kita melihat dengan jelas bagaimana Decision Tree membentuk aturan keputusan berdasarkan batas nilai tertentu pada setiap fitur.



In [None]:
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier

iris = load_iris()
X = iris.data[:, 2:]  # petal length and petal width
y = iris.target

tree_clf = DecisionTreeClassifier(max_depth=2)
tree_clf.fit(X, y)


Model Decision Tree di atas dibatasi dengan parameter `max_depth=2`. Pembatasan ini bertujuan agar struktur pohon tetap dangkal dan mudah diinterpretasikan.

Tanpa pembatasan kedalaman, Decision Tree cenderung tumbuh sangat kompleks dan berisiko tinggi mengalami overfitting terhadap data training.



### 1.2 Visualizing the Decision Tree

Salah satu keunggulan utama Decision Tree adalah kemampuannya untuk divisualisasikan. Visualisasi ini memungkinkan kita melihat aturan keputusan yang dipelajari oleh model secara eksplisit.


In [None]:
from sklearn.tree import export_graphviz

export_graphviz(
    tree_clf,
    out_file="iris_tree.dot",
    feature_names=iris.feature_names[2:],
    class_names=iris.target_names,
    rounded=True,
    filled=True
)

File `.dot` yang dihasilkan dapat dikonversi menjadi gambar menggunakan Graphviz.

Visualisasi pohon menunjukkan bagaimana Decision Tree membagi ruang fitur berdasarkan nilai threshold tertentu, mulai dari root node hingga leaf node, sebagaimana ditunjukkan pada ilustrasi di buku.


## 2. How Decision Trees Make Predictions

Decision Tree menghasilkan prediksi dengan menelusuri struktur pohon dari root node menuju leaf node. Setiap node internal berisi aturan keputusan berbentuk kondisi logis.


### 2.1 Traversing the Tree

Setiap node internal pada Decision Tree berisi pertanyaan sederhana, misalnya:

- Apakah petal length â‰¤ 2.45?

Jika kondisi bernilai benar, instance diarahkan ke cabang kiri; jika salah, ke cabang kanan. Proses ini berulang hingga mencapai leaf node.


### 2.2 Node Information Explained

Setiap node pada visualisasi Decision Tree biasanya menampilkan informasi berikut:
- **gini**: tingkat ketidakmurnian kelas pada node
- **samples**: jumlah data yang mencapai node
- **value**: distribusi jumlah data pada tiap kelas
- **class**: kelas mayoritas pada node

Informasi ini membantu kita memahami keputusan yang diambil model.


### 2.3 Gini Impurity

Gini impurity mengukur seberapa besar kemungkinan sebuah instance salah diklasifikasikan jika label dipilih secara acak berdasarkan distribusi kelas pada node tersebut.

- Nilai 0 menunjukkan node sepenuhnya murni
- Nilai yang lebih besar menunjukkan kelas yang semakin bercampur

Decision Tree berusaha memilih split yang meminimalkan nilai Gini impurity.


### 2.4 Contoh Konseptual Proses Prediksi

Untuk memahami bagaimana Decision Tree menghasilkan sebuah prediksi, kita dapat meninjau alur pengambilan keputusan secara konseptual pada satu instance data.

Misalkan kita memiliki sebuah bunga Iris dengan karakteristik sebagai berikut:

- panjang petal (petal length) = 5.0
- lebar petal (petal width) = 1.5

Proses prediksi dimulai dari **root node** pada pohon keputusan. Pada node ini, model mengevaluasi sebuah kondisi berbentuk pertanyaan, misalnya apakah nilai panjang petal lebih kecil atau sama dengan suatu ambang batas tertentu.

Jika kondisi tersebut terpenuhi, instance akan diarahkan ke cabang kiri. Jika tidak, instance akan mengikuti cabang kanan. Proses evaluasi kondisi ini berlangsung secara berurutan pada setiap node internal yang dilewati.

Alur traversal tersebut terus berlanjut hingga instance mencapai sebuah **leaf node**. Leaf node tidak lagi berisi pertanyaan, melainkan hasil keputusan akhir berupa kelas yang diprediksi.

Kelas yang dipilih umumnya adalah **kelas mayoritas** dari seluruh instance training yang berada pada leaf node tersebut. Dengan cara ini, Decision Tree mengubah serangkaian aturan sederhana menjadi sebuah keputusan klasifikasi yang dapat diinterpretasikan secara jelas.


### 2.5 Predicting Class Probabilities

Selain menghasilkan label kelas, Decision Tree juga mampu memberikan estimasi probabilitas kelas. Probabilitas ini dihitung berdasarkan proporsi data pada leaf node tempat instance berakhir.


In [None]:
tree_clf.predict_proba([[5, 1.5]])


## 3. Estimating Class Probabilities

Probabilitas kelas dihitung berdasarkan distribusi data pada leaf node tempat sebuah instance berakhir.

Jika sebuah leaf node hanya berisi satu kelas, probabilitas kelas tersebut adalah 100%. Jika berisi beberapa kelas, probabilitas dihitung berdasarkan proporsinya.


## 4. The CART Training Algorithm

Scikit-Learn menggunakan algoritma CART (Classification and Regression Trees) untuk melatih Decision Tree.

CART bekerja dengan mencari split terbaik pada setiap node yang menghasilkan pemisahan data paling murni berdasarkan kriteria tertentu.


In [None]:
tree_clf_entropy = DecisionTreeClassifier(criterion="entropy", max_depth=2)
tree_clf_entropy.fit(X, y)


## 5. Regularization Hyperparameters

Decision Tree sangat rentan terhadap overfitting jika dibiarkan tumbuh tanpa batas. Oleh karena itu, tersedia berbagai hyperparameter untuk membatasi kompleksitas model.


In [None]:
tree_clf_reg = DecisionTreeClassifier(
    max_depth=3,
    min_samples_split=5,
    min_samples_leaf=2,
    random_state=42
)

tree_clf_reg.fit(X, y)



Meskipun Decision Tree memiliki keunggulan dalam hal interpretabilitas dan kemudahan pemahaman, algoritma ini juga memiliki kelemahan yang cukup signifikan, yaitu **ketidakstabilan model**.

Decision Tree sangat bergantung pada data training yang digunakan. Perubahan kecil pada data, baik pada nilai fitur maupun jumlah sampel, dapat menghasilkan struktur pohon yang sangat berbeda. Hal ini menyebabkan performa model menjadi kurang konsisten ketika diterapkan pada data yang sedikit berbeda.

Masalah instabilitas ini berkaitan erat dengan cara Decision Tree membangun model, yaitu dengan memilih split terbaik secara lokal pada setiap node, tanpa mempertimbangkan dampaknya terhadap keseluruhan struktur pohon.


### 7.1 Sensitivity to Data Variations

Decision Tree sangat sensitif terhadap variasi data. Penambahan, penghapusan, atau perubahan kecil pada beberapa instance data dapat mengubah split awal pada root node.

Karena split awal memiliki pengaruh besar terhadap seluruh percabangan berikutnya, perubahan kecil tersebut dapat menyebabkan struktur pohon yang dihasilkan menjadi sangat berbeda, meskipun perbedaan data relatif kecil.

Akibatnya, Decision Tree memiliki **variance yang tinggi**, yaitu performa model dapat berubah secara signifikan ketika dilatih pada dataset yang sedikit berbeda.


### 7.2 Sensitivity to Axis Orientation

Selain sensitif terhadap variasi data, Decision Tree juga sensitif terhadap orientasi sumbu fitur.

Decision Tree hanya mampu membuat pemisahan data yang sejajar dengan sumbu fitur (axis-aligned splits). Jika data mengalami rotasi atau transformasi linier, Decision Tree mungkin memerlukan lebih banyak split untuk mencapai pemisahan yang baik.

Hal ini dapat menyebabkan pohon menjadi lebih dalam dan kompleks, yang pada akhirnya meningkatkan risiko overfitting.

Keterbatasan ini menjadi salah satu alasan utama mengapa metode ensemble seperti **Random Forest** dan **Gradient Boosting** dikembangkan, karena metode tersebut mampu mengurangi ketergantungan pada satu struktur pohon saja.



## Closing Summary (Chapter 6)

Pada Chapter 6, kita telah mempelajari Decision Trees sebagai algoritma Machine Learning yang sederhana namun sangat powerful.

Beberapa poin penting yang dibahas dalam chapter ini meliputi:

- proses pelatihan dan visualisasi Decision Tree,
- mekanisme pengambilan keputusan dan prediksi probabilitas kelas,
- penggunaan kriteria pemisahan seperti Gini impurity dan entropy,
- peran hyperparameter regularization dalam mengontrol kompleksitas model,
- serta keterbatasan Decision Tree terkait stabilitas dan sensitivitas terhadap data.

Meskipun Decision Tree memiliki kelemahan berupa variance yang tinggi, algoritma ini tetap menjadi fondasi penting bagi banyak metode Machine Learning modern.
