In [2]:
import numpy as np

from sklearn import datasets
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.svm import LinearSVC

### Linear SVM classification

In [3]:
iris = datasets.load_iris()

X = iris["data"][:, 2:4]                      # 꽃잎 길이, 꽃잎 너비
y = (iris["target"] == 2).astype(np.float64) # Iris-Virginica

In [4]:
svm_clf = Pipeline([
 ("scaler", StandardScaler()),
 # LinearSVC 클래스 대신 선형 커널을 사용하는 SVC 클래스로 대체 가능
 ("linear_svc", LinearSVC(C=1, loss="hinge")),
 ])

In [5]:
svm_clf.fit(X, y)

Pipeline(steps=[('scaler', StandardScaler()),
                ('linear_svc', LinearSVC(C=1, loss='hinge'))])

In [6]:
 svm_clf.predict([[5.5, 1.7]])
 # SVM 분류기는 로지스틱 회귀 분류기와 다르게 클래스에 대한 확률 제공 X

array([1.])

- LinearSVC는 규제에 편향을 포함시키기 때문에 훈련 세트에서 평균을 빼서 중앙에 맞춰야 함

- StandardScaler를 사용하여 데이터 스케일을 맞추면 자동으로 설정됨

- loss 매개변수를 
"hinge"로 지정해야 함

- 훈련 샘플보다 특성이 많지 않다면 성능을 높이기 위해 dual 매개
변수를 False로 지정해야 함

### Non-linear SVM classification

In [8]:
from sklearn.datasets import make_moons
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import PolynomialFeatures

X, y = make_moons(n_samples=100, noise=0.15)

polynomial_svm_clf = Pipeline([
    ("poly_features", PolynomialFeatures(degree=3)),
    ("scaler", StandardScaler()),
    ("svm_clf", LinearSVC(C=10, loss="hinge"))
])

polynomial_svm_clf.fit(X, y)



Pipeline(steps=[('poly_features', PolynomialFeatures(degree=3)),
                ('scaler', StandardScaler()),
                ('svm_clf', LinearSVC(C=10, loss='hinge'))])

### 다항식 커널

In [9]:
from sklearn.svm import SVC

poly_kernel_svm_clf = Pipeline([
    ("scaler", StandardScaler()),
    ("svm_clf", SVC(kernel="poly", degree=3, coef0=1, C=5))
])

poly_kernel_svm_clf.fit(X, y)

Pipeline(steps=[('scaler', StandardScaler()),
                ('svm_clf', SVC(C=5, coef0=1, kernel='poly'))])

### 가우시안 RBF 커널

In [10]:
# gamma가 규제 역할
rbf_kernel_svm_clf = Pipeline([
    ("scaler", StandardScaler()),
    ("svm_clf", SVC(kernel="rbf", gamma=5, C=0.001))
])

rbf_kernel_svm_clf.fit(X, y)

Pipeline(steps=[('scaler', StandardScaler()),
                ('svm_clf', SVC(C=0.001, gamma=5))])