# 선형 SVM
- 서포트 벡터
    - 경계에 가장 가까운 샘플
    - 결정경계가 서포트 벡터에 의존하기 때문에 새로운 샘플이 들어와도 동작가능
- 스케일링을 해야 결정경계가 좋아짐
- 하드 마진 분류
    - 선형 데이터에서만 동작, 이상치에 민감
- 소프트 마진 분류
    - 마진오류
        - 샘플이 마진사이나 반대쪽에 위치하는 경우
        - 적은편이 좋음
    - 하이퍼 파라미터 C
        - 마진오류에 적절하게 균형잡음
        - C가 낮다 = 마진오류를 많이 허용한다, 일반화 성능 향상(규제)
        - C가 높다 = 마진오류를 적게 허용한다, 과대적합 가능성

In [3]:
import numpy as np
from sklearn import datasets
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.svm import LinearSVC

iris = datasets.load_iris()
X= iris['data'][:, (2,3)]
y =(iris['target']==2).astype(np.float64)

svm_clf= Pipeline([
    ('scalar', StandardScaler()),
    ('linear_svc', LinearSVC(C=1, loss='hinge'))
    # SVC(kernel='linear',C=1)와 동일
    # SGDClassifier(loss='hinge', alpha=1/(m*C)) 와 동일
])

svm_clf.fit(X, y)

In [4]:
svm_clf.predict([[5.5, 1.7]])

array([1.])

# 비선형 SVM
- 다항 추가
- 커널트릭
    - 실제 항이 추가 되지않아 학습속도 저하없음
- 랜드마크와의 유사도 측정
    - 각 샘플이 특정 랜드마크와 얼마나 유사한지 가우시간 방사기저함수(Radial Basis Function)와 같은 유사도 함수로 비교
    - Gaussian RBF
        - 랜드마크에서 아주 멀리 떨어진 경우를 0, 같은 위치인 경우를 1로 종모양 분포 예측
        - 하이퍼파라미터 gamma
            - 크면 종이 좁아져 샘플별 영향력이 줄어들어 경계가 선형에 가까워짐
            - 작으면 종이 커지면서 샘플별 영향력이 커져 경계가 곡선이 됨
        - 보통 linear, Gaussian RBF가 쓰이고 다른 커널은 특화되어 거의 사용되지 않음     
    - 랜드마크 선정 방법
        - 모든 샘플을 랜드마크로 설정
        - 단점: n개 특성을 가진 m개 샘플이 m개 특성을 가진 m개 샘플이 됨

In [5]:
from sklearn.svm import SVC

poly_kernel_svm_clf= Pipeline([
     ('scalar', StandardScaler()),
    ('linear_svc', LinearSVC(C=1, loss='hinge'))
])
poly_kernel_svm_clf.fit(X, y)

In [6]:
from sklearn.svm import SVC

rbf_kernel_svm_clf= Pipeline([
     ('scalar', StandardScaler()),
    ('linear_svc', SVC(kernel='rbf', gamma=5, C=0.001))
])
rbf_kernel_svm_clf.fit(X, y)

# SVM 회귀
- 반대로 마진안에 최대한 많은 샘플이 들어가도록 학습
- epsilon에 민감하지않다
    - 마진안에는 샘플이 추가되어도 모델의 예측에 영향이 없다.

In [None]:
from sklearn.svm import LinearSVR
from sklearn.svm import SVR

# 데이터 스케일

# 선형 회귀
svm_reg= LinearSVR(epsilon=1.5)
svm_reg.fit(X,y)

# 비선형 회귀(다항/커널트릭)
svm_poly_reg= SVR(kernel='poly', degree=2, C=100, epsilon=0.1)
svm_poly_reg.fit(X,y)