<a href="https://colab.research.google.com/github/Bagito999/Deep-Learning/blob/main/Chapter_6_Teori.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#  Chapter 6 - Decision Trees

##  Apa Itu Decision Tree?

Decision Tree adalah algoritma pembelajaran yang dapat digunakan untuk tugas klasifikasi maupun regresi. Mereka sangat intuitif, mudah divisualisasikan, dan tidak memerlukan scaling fitur.

---

##  Training dan Visualisasi Decision Tree

Tree dilatih dengan memecah dataset menggunakan aturan keputusan biner berbasis pada fitur input. Proses ini berulang hingga kondisi tertentu terpenuhi (misal: kedalaman maksimal atau node menjadi pure).

---

##  Cara Prediksi

Prediksi dilakukan dengan *menelusuri tree* dari akar ke daun:

- Setiap node mengajukan pertanyaan (misalnya "Apakah petal length ≤ 2.45?").
- Berdasarkan jawabannya (ya/tidak), pindah ke child node berikutnya.
- Jika mencapai *leaf node*, ambil kelas mayoritas (atau nilai rata-rata untuk regresi).

---

##  Estimasi Probabilitas

Untuk klasifikasi, tree juga bisa memberikan estimasi probabilitas dengan:

\[
$P(k) = \frac{\text{Jumlah instance kelas } k}{\text{Total instance di node}}$
\]

---

##  Impurity Measures

### 🔹 Gini Impurity

\[
$G_i = 1 - \sum_{k=1}^n p_{i,k}^2$
\]

- Gini = 0: node pure
- Digunakan default oleh Scikit-Learn

### 🔸 Entropy

\[
$H_i = - \sum_{k=1}^{n} p_{i,k} \log_2(p_{i,k})$
\]

- Lebih lambat dari Gini
- Mengarah ke tree lebih seimbang

---

##  CART Algorithm (Classification And Regression Tree)

Digunakan oleh Scikit-Learn untuk membangun decision tree.

### 🔹 Untuk Klasifikasi

\[
$J(k, t_k) = \frac{m_{left}}{m} G_{left} + \frac{m_{right}}{m} G_{right}$
\]

- Memilih fitur \($k$\) dan threshold \($t_k$\) yang meminimalkan impurity gabungan.

---

## 🧮 Kompleksitas Waktu

- **Prediksi**: \($O(\log_2 m)$\)
- **Training**: \($O(n \cdot m \cdot \log_2 m)$\)
  - \($n$\): jumlah fitur
  - \($m$\): jumlah instance

---

##  Regularisasi

Untuk mencegah overfitting, beberapa parameter digunakan:

- `max_depth`
- `min_samples_split`
- `min_samples_leaf`
- `max_leaf_nodes`
- `max_features`

Model tanpa batasan cenderung overfit karena terlalu kompleks.

---

##  Pruning

Alternatif dari regularisasi saat pelatihan adalah *post-pruning*:

- Setelah pohon dibentuk, hapus node yang tidak memberi kontribusi signifikan.
- Gunakan uji statistik seperti *chi-squared test*.

---

##  Decision Tree untuk Regresi

- Sama seperti klasifikasi, tetapi leaf node memuat nilai rata-rata target.
- **CART untuk regresi** meminimalkan **MSE**:

\[
$J(k, t_k) = \frac{m_{left}}{m} MSE_{left} + \frac{m_{right}}{m} MSE_{right}$
\]

Dengan:

\[
$MSE = \frac{1}{m_{node}} \sum_{i \in node} (y_i - \bar{y})^2$
\]

---

##  Kelemahan Decision Tree

1. **Overfitting**: Terlalu sesuai dengan data training jika tidak diregularisasi.
2. **Instabilitas**: Perubahan kecil di data → perubahan besar di tree.
3. **Sensitif terhadap rotasi fitur**: Karena split tegak lurus terhadap sumbu.
4. **Model bersifat orthogonal**: Tidak efisien untuk batas keputusan miring.

---

##  White Box Model

Decision Tree disebut *white box* karena keputusan mudah ditelusuri dan dijelaskan. Ini berbeda dari *black box model* seperti Neural Networks atau Random Forests.

---

##  Kesimpulan

- Decision Tree sangat fleksibel, cocok untuk klasifikasi, regresi, dan multioutput.
- Scikit-Learn menggunakan CART dan binary splits.
- Gunakan regularisasi untuk mencegah overfitting.
- Mereka intuitif dan mudah diinterpretasikan, tetapi sensitif terhadap data.

---

##  Referensi

Géron, A. (2019). *Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow*. O'Reilly Media.
