# Chapter 5: Support Vector Machines

Notebook ini merupakan hasil reproduksi dan penjelasan teori dari **Bab 5 - Support Vector Machines (SVM)** dari buku *Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow (2nd Edition)* oleh Aurélien Géron.

📌 Fokus bab ini adalah klasifikasi margin maksimum menggunakan Support Vector Classifier (SVC), serta konsep margin, kernel trick, dan regularisasi dalam SVM.

---


## Ringkasan Teori Bab 5: Support Vector Machines

### 1. Konsep Dasar
SVM bertujuan mencari hyperplane terbaik yang memisahkan dua kelas dengan **margin maksimum**.

### 2. Margin
- **Hard Margin**: memisahkan data tanpa kesalahan — hanya cocok untuk data yang bisa dipisahkan sempurna.
- **Soft Margin**: memungkinkan sedikit pelanggaran (misalnya outlier) untuk menghindari overfitting.

### 3. Kernel Trick
Digunakan untuk mengubah data ke dimensi yang lebih tinggi agar bisa dipisahkan secara linear.

Beberapa kernel umum:
- Linear
- Polynomial: $K(x, x') = (x^T x' + r)^d$
- RBF (Gaussian): $K(x, x') = \exp(-\gamma ||x - x'||^2)$

### 4. Hyperparameter
- $C$: mengontrol trade-off antara margin dan error (regularisasi)
- $\gamma$: pada RBF kernel, mengontrol seberapa jauh pengaruh satu sample



## Contoh Klasifikasi dengan SVC

In [None]:
from sklearn.datasets import make_moons
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC
import matplotlib.pyplot as plt

# Generate data
X, y = make_moons(n_samples=100, noise=0.15, random_state=42)

# Pipeline SVM dengan RBF kernel
svm_clf = Pipeline([
    ("scaler", StandardScaler()),
    ("svm", SVC(kernel="rbf", gamma=2, C=1))
])
svm_clf.fit(X, y)

In [None]:
import numpy as np

def plot_decision_boundary(clf, X, y, ax=None):
    h = .02
    x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
    y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
    xx, yy = np.meshgrid(np.arange(x_min, x_max, h),
                         np.arange(y_min, y_max, h))
    Z = clf.predict(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)

    if ax is None:
        ax = plt.gca()
    ax.contourf(xx, yy, Z, alpha=0.3)
    ax.scatter(X[:, 0], X[:, 1], c=y, edgecolors='k')
    ax.set_title("Decision Boundary SVM")

plot_decision_boundary(svm_clf, X, y)
plt.show()