<a href="https://colab.research.google.com/github/muhiqbalalamin/DeepLearning-UAS/blob/main/Chapter_6_Teori.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Decision Trees**

## Apa Itu Decision Tree?
Decision Tree adalah algoritma pembelajaran yang dapat digunakan untuk tugas klasifikasi maupun regresi. Algoritma ini sangat intuitif, mudah divisualisasikan, dan tidak memerlukan proses feature scaling.

## Pelatihan dan Visualisasi Decision Tree
Pohon keputusan dilatih dengan membagi dataset berdasarkan aturan keputusan biner yang didasarkan pada fitur input. Proses ini berlangsung secara rekursif hingga mencapai kondisi penghentian tertentu, seperti kedalaman maksimum atau node yang sudah sepenuhnya homogen (pure).

## Mekanisme Prediksi
Prediksi dilakukan dengan menelusuri pohon dari akar hingga ke daun:

* Setiap node mengajukan pertanyaan (misalnya, “Apakah petal length ≤ 2.45?”).

* Berdasarkan jawaban (ya/tidak), algoritma bergerak ke anak node yang sesuai.

* Setelah mencapai leaf node, hasil prediksi ditentukan berdasarkan kelas mayoritas (untuk klasifikasi) atau nilai rata-rata (untuk regresi).

## Estimasi Probabilitas
Untuk tugas klasifikasi, Decision Tree juga dapat menghasilkan estimasi probabilitas:

\[
$P(k) = \frac{\text{Jumlah instance kelas } k}{\text{Total instance di node}}$
\]

## Ukuran Ketidakmurnian (Impurity Measures)
### Gini Impurity

\[
$G_i = 1 - \sum_{k=1}^n p_{i,k}^2$
\]

* Gini = 0 berarti node sudah pure.

* Merupakan ukuran ketidakmurnian default di Scikit-Learn.

### Entropy

\[
$H_i = - \sum_{k=1}^{n} p_{i,k} \log_2(p_{i,k})$
\]

* Lebih mahal secara komputasi dibandingkan Gini.

* Cenderung menghasilkan pohon yang lebih seimbang.

## Algoritma CART (Classification And Regression Tree)
Scikit-Learn menggunakan algoritma CART untuk membangun pohon keputusan.

Untuk Klasifikasi

\[
$J(k, t_k) = \frac{m_{left}}{m} G_{left} + \frac{m_{right}}{m} G_{right}$
\]

- Memilih fitur \($k$\) dan threshold \($t_k$\) yang meminimalkan impurity gabungan.

## Kompleksitas Waktu

- **Prediksi**: \($O(\log_2 m)$\)
- **Training**: \($O(n \cdot m \cdot \log_2 m)$\)
  - \($n$\): jumlah fitur
  - \($m$\): jumlah instance

## Regularisasi
Untuk mencegah overfitting, beberapa parameter pembatas dapat diterapkan:

* max_depth

* min_samples_split

* min_samples_leaf

* max_leaf_nodes

* max_features

Model tanpa pembatasan cenderung terlalu kompleks dan mudah overfit.

## Pruning
Sebagai alternatif regularisasi saat pelatihan, dapat dilakukan post-pruning:

* Setelah pohon selesai dibentuk, node-node yang kontribusinya tidak signifikan dihapus.

* Dapat menggunakan uji statistik seperti chi-squared test.

## Decision Tree untuk Regresi
* Konsep serupa dengan klasifikasi, namun leaf node menyimpan nilai rata-rata target.

* CART untuk regresi meminimalkan MSE (Mean Squared Error):

\[
$J(k, t_k) = \frac{m_{left}}{m} MSE_{left} + \frac{m_{right}}{m} MSE_{right}$
\]

Dengan:

\[
$MSE = \frac{1}{m_{node}} \sum_{i \in node} (y_i - \bar{y})^2$
\]

## Kelemahan Decision Tree
1. Overfitting: Rentan terlalu menyesuaikan data pelatihan jika tidak diregularisasi.

2. Tidak stabil: Perubahan kecil pada data dapat menghasilkan struktur pohon yang sangat berbeda.

3. Sensitif terhadap rotasi fitur: Karena pemisahan hanya dilakukan secara tegak lurus terhadap sumbu.

4. Model ortogonal: Tidak efisien untuk batas keputusan yang miring.

## White Box Model
Decision Tree disebut sebagai white box model karena keputusan yang dihasilkan dapat ditelusuri dan dijelaskan secara transparan. Hal ini berbeda dengan black box model seperti Neural Networks atau Random Forests yang lebih sulit diinterpretasikan.

# **Kesimpulan**
Decision Tree merupakan algoritma pembelajaran yang fleksibel dan intuitif, mampu menangani berbagai tugas seperti klasifikasi, regresi, hingga multioutput. Dengan struktur pohon yang mudah divisualisasikan dan ditelusuri, model ini termasuk dalam kategori white box sehingga sangat cocok digunakan ketika interpretabilitas menjadi prioritas. Scikit-Learn mengimplementasikan Decision Tree menggunakan algoritma CART yang membagi data secara biner berdasarkan fitur dan threshold yang meminimalkan impurity. Meskipun Decision Tree tidak memerlukan normalisasi fitur dan dapat bekerja dengan data dalam bentuk mentah, model ini memiliki kelemahan seperti rentan terhadap overfitting, sensitif terhadap perubahan kecil pada data, dan kurang efisien untuk batas keputusan yang tidak tegak lurus. Oleh karena itu, penerapan teknik regularisasi seperti pengaturan kedalaman maksimum atau jumlah sampel minimum sangat penting untuk menjaga generalisasi model. Dengan kelebihan dan kekurangannya, Decision Tree tetap menjadi pilihan yang kuat dan mudah digunakan dalam banyak kasus pembelajaran mesin.

# **Referensi**
Géron, A. (2019). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow. O'Reilly Media.