<a href="https://colab.research.google.com/github/Bagito999/Deep-Learning/blob/main/Chapter_8_Teori.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#  Chapter 8 - Dimensionality Reduction

##  Mengapa Perlu Mengurangi Dimensi?

Banyak masalah Machine Learning melibatkan ratusan hingga jutaan fitur. Dampaknya:
- Melambatkan proses training
- Meningkatkan risiko overfitting
- Menurunkan akurasi generalisasi

Motivasi utama:
-  Mempercepat training
-  Mengurangi noise
-  Memungkinkan visualisasi (2D/3D)
-  Kompresi data

---

##  The Curse of Dimensionality

Fenomena tak intuitif di ruang berdimensi tinggi:
- Titik data menjadi **jarang tersebar**
- Rata-rata jarak antar titik meningkat drastis
- Dimensi tinggi → prediksi makin tidak dapat diandalkan

Contoh:
- Di ruang 1 juta dimensi, rata-rata jarak antar titik bisa mencapai ~408.25
- Dibutuhkan jumlah data eksponensial untuk mempertahankan densitas yang cukup tinggi

---

##  Dua Pendekatan Utama

### 🔹 Projection

Data sering kali berada pada subspace berdimensi lebih rendah. Kita bisa:
- Menemukan subspace ini
- Memproyeksikan data secara ortogonal ke sana

Namun, tidak efektif untuk manifold nonlinier (contohnya Swiss Roll).

### 🔸 Manifold Learning

Asumsi manifold: data real-world cenderung berada pada manifold berdimensi rendah di dalam ruang berdimensi tinggi.

Contoh:
- MNIST → semua angka tulisan tangan terbentuk oleh garis yang terhubung
- Swiss Roll → secara lokal 2D, tapi dilipat dalam 3D

---

##  PCA - Principal Component Analysis

###  Tujuan
Menemukan subspace yang mempertahankan variansi data sebanyak mungkin.

###  Rumus

#### Langkah 1: SVD

\[
$X = U \Sigma V^T$
\]

- \($ V $\): matriks komponen utama (PC)
- \($ X $\): data yang sudah di-center-kan

#### Langkah 2: Proyeksi

\[
$X_{proj} = X \cdot W_d$
\]

- \($ W_d $\): d kolom pertama dari \($ V $\)

###  Explained Variance Ratio

\[
$\text{EVR}_k = \frac{\text{Var}(PC_k)}{\text{Total Variance}}$
\]

Pilih jumlah dimensi yang mempertahankan rasio varian tertentu (misalnya 95%).

---

##  PCA untuk Kompresi

- Kurangi dimensi → simpan data lebih efisien
- Kompres MNIST: 784 ➝ 154 fitur (95% varian dipertahankan)
- Bisa decompress dengan:

\[
$X_{recovered} = X_{proj} \cdot W_d^T$
\]

→ Disebut sebagai *reconstruction pre-image*.

---

##  Incremental PCA

Digunakan saat dataset terlalu besar untuk dimuat ke memori:
- Proses secara batch
- Cocok untuk online learning

---

##  Kernel PCA

Melakukan PCA di ruang berdimensi tinggi menggunakan kernel trick.

### 🔸 Kernel populer:
- Linear
- RBF (Gaussian)
- Sigmoid

Tidak ada cara pasti memilih kernel terbaik → gunakan Grid Search berdasarkan performa tugas supervised (misalnya klasifikasi).

---

##  LLE - Locally Linear Embedding

### Langkah 1: Rekonstruksi Lokal

\[
$W = \arg \min_W \sum_{i=1}^m \left\| x_i - \sum_j w_{ij} x_j \right\|^2$
\]

Syarat:
- \($ w_{ij} = 0 $\) jika \($ x_j $\) bukan tetangga terdekat dari \($ x_i $\)
- \($ \sum_j w_{ij} = 1 $\)

### Langkah 2: Mapping ke Ruang Rendah

\[
$Z = \arg \min_Z \sum_{i=1}^m \left\| z_i - \sum_j w_{ij} z_j \right\|^2$
\]

- Preservasi hubungan lokal
- Cocok untuk data manifold yang dilipat

---

##  Teknik Lain

### 🔹 Random Projections
- Proyeksi acak ke dimensi lebih rendah
- Preservasi jarak dijamin oleh *Johnson-Lindenstrauss Lemma*

### 🔹 Multidimensional Scaling (MDS)
- Mempertahankan jarak antar instance

### 🔹 Isomap
- Perluas MDS dengan geodesic distance

### 🔹 t-SNE
- Preservasi local structure (cluster)
- Ideal untuk visualisasi

### 🔹 LDA (Linear Discriminant Analysis)
- Klasifikasi + proyeksi ke dimensi yang memisahkan kelas sebaik mungkin

---

##  Kesimpulan

- Dimensionality Reduction mempercepat training dan memungkinkan visualisasi
- PCA sangat efektif untuk kompresi dan reduksi linier
- Kernel PCA dan LLE cocok untuk struktur non-linier
- Pilih teknik berdasarkan dataset dan tujuan (kompresi, visualisasi, preprocessing)

---

##  Referensi

Géron, A. (2019). *Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow*. O'Reilly Media.
