
# **Chapter 8: Dimensionality Reduction**

## **1. Pendahuluan**

Dimensionality Reduction bertujuan mengurangi jumlah fitur sambil mempertahankan informasi penting. Mengurangi komputasi, membantu visualisasi, dan mengurangi risiko overfitting.



## **2. Curse of Dimensionality**

Semakin banyak fitur, data makin jarang dan model sulit menemukan pola. Solusi: reduksi dimensi.



## **3. Pendekatan Utama**

1. Feature Selection: pilih subset fitur penting.  
2. Feature Extraction: gabungkan fitur → bentuk fitur baru berdimensi lebih rendah (fokus bab ini).



## **4. Principal Component Analysis (PCA)**

Menemukan sumbu baru yang menjelaskan varian data maksimum.

Langkah: pusatkan data, hitung kovarians, eigenvector, proyeksikan data.


In [None]:

from sklearn.decomposition import PCA

pca = PCA(n_components=2)
X2D = pca.fit_transform(X)

pca.explained_variance_ratio_



## **5. Memilih Jumlah Komponen**

Pilih komponen yang menjelaskan varian ≥ 95%.


In [None]:

pca = PCA(n_components=0.95)
X_reduced = pca.fit_transform(X)



## **6. PCA sebagai Kompresi**

Data direduksi → disimpan → direkonstruksi.

**Contoh:**


In [None]:

X_recovered = pca.inverse_transform(X_reduced)



## **7. Incremental PCA**

Untuk dataset besar: memproses mini-batch.

**Contoh:**


In [None]:

from sklearn.decomposition import IncrementalPCA

ipca = IncrementalPCA(n_components=2, batch_size=200)
X_reduced = ipca.fit_transform(X)



## **8. Kernel PCA**

Untuk data non-linear, memetakan data ke ruang dimensi lebih tinggi.

**Contoh:**


In [None]:

from sklearn.decomposition import KernelPCA

rbf_pca = KernelPCA(n_components=2, kernel="rbf", gamma=0.04)
X_reduced = rbf_pca.fit_transform(X)



## **9. Locally Linear Embedding (LLE)**

Metode non-linear: melestarikan hubungan lokal antar titik.

**Contoh:**


In [None]:

from sklearn.manifold import LocallyLinearEmbedding

lle = LocallyLinearEmbedding(n_neighbors=10, n_components=2)
X_reduced = lle.fit_transform(X)



## **10. Tips Praktis**

- Lakukan Feature Scaling.
- Gunakan reduksi dimensi sebelum training model.
- Visualisasi hasil reduksi.
