# 支持向量机(Support Vector Machine)

 支持向量机对于数据的缩放很敏感  
 在使用SVM算法前,需要对数据进行缩放

C值控制分类器的容许误差  
C越小,容许误差越大,正则化越强,越不容易过度拟合  
C越大,容许误差越小,正则化越弱,越容易造成过度拟合

使用LinearSVC进行训练, 速度较快  
1.必须设置loss="hinge",因为其并非默认选项  
2.当n_samples > n_features,推荐使用dual=False来提升运算效率,其默认选项为True

In [None]:
import numpy as np
from sklearn import datasets
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.svm import LinearSVC

iris = datasets.load_iris()
X = iris["data"][:, (2, 3)]  # petal length, petal width
y = (iris["target"] == 2).astype(np.float64)  # Iris-Virginica

svm_clf = Pipeline([
        ("scaler", StandardScaler()),
        ("linear_svc", LinearSVC(C=1, loss="hinge", random_state=42)),    #必须设置loss="hinge",因为其并非默认项
    ])

svm_clf.fit(X, y)

一种替代方案是使用SVC,但运行速度过慢,不推荐

In [None]:
from sklearn.svm import SVC
SVC(kernel="linear",c=1)

另一种替代方案是SGDClassifier  
该方法虽然没有LinearSVC快,但可以对数据进行在线更新,可以应用于庞大数据集中

In [None]:
from sklearn.linear_model import SGDClassifier
SGDClassifier(loss="hinge",alpha=1/(m*C))

## 非线性SVM分类器(Nonlinear SVM Classification)

### 添加多项式(高阶)特征

In [None]:
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import PolynomialFeatures

polynomial_svm_clf = Pipeline([
        ("poly_features", PolynomialFeatures(degree=3)),
        ("scaler", StandardScaler()),
        ("svm_clf", LinearSVC(C=10, loss="hinge", random_state=42))
    ])

polynomial_svm_clf.fit(X, y)

先运用PolynomialFeatures建立高阶多项式,然后代入进线性模型进行训练

### 多项式核(Polynomial Kernel)

取得和添加多项式特征一样的结果  
但在实际应用中,不需要添加这些特征,因此避免了特征数量和阶次上升时造成的特征数骤增

In [None]:
from sklearn.svm import SVC

poly_kernel_svm_clf = Pipeline([
        ("scaler", StandardScaler()),
        ("svm_clf", SVC(kernel="poly", degree=3, coef0=1, C=5))
    ])
poly_kernel_svm_clf.fit(X, y)

其中,coef0控制模型受到高阶多项式和低阶多项式影响的大小

### Gaussian RBF Kernel

In [None]:
rbf_kernel_svm_clf = Pipeline([
        ("scaler", StandardScaler()),
        ("svm_clf", SVC(kernel="rbf", gamma=5, C=0.001))
    ])
rbf_kernel_svm_clf.fit(X, y)

gamma($\gamma$) :  
gamma越大,决策边界的形状越不规则    
gamma越小,决策边界的形状越平滑  
因此,gamma可以作为一个正则化的超参数来使用  
如果模型过度拟合,则降低gamma; 如果欠拟合,则增加gamma (类似$C$)

## SVM Regression

SVM同样也支持线性和非线性回归

### 线性回归

In [None]:
from sklearn.svm import LinearSVR

svm_reg = LinearSVR(epsilon=1.5, random_state=42)
svm_reg.fit(X, y)

epsilon($\epsilon$)控制确定回归线的street的宽度  
$\epsilon$越大,则宽度越大,越小则宽度越小

### 非线性回归

In [None]:
from sklearn.svm import SVR  #SVR支持kernel trick

svm_poly_reg = SVR(kernel="poly", degree=2, C=100, epsilon=0.1)
svm_poly_reg.fit(X, y)