# サポートベクターマシン(Support Vector Machine Classification, SVM)

## サポートベクターマシンとは<a name="description"></a>

- 未知のデータに対する汎化能力が高い
- サンプルよりも特徴が多い場合に有効
- 基本的には線形分類器だが、カーネルトリックと呼ばれる手法を用いて非線形分類可能

## 使用例<a name="example"></a>

### データ準備<a name="data"></a>

In [None]:
import numpy as np
from sklearn import datasets
import pandas as pd

iris = datasets.load_iris()
X, y = iris.data[:, :2], iris.target
data = np.concatenate([X, y[:, np.newaxis]], axis=1)
columns = iris.feature_names[:2] + ['target']
df = pd.DataFrame(data=data, columns=columns)
df.tail()

### 線形カーネルの学習<a name="linear_training"></a>

In [None]:
from sklearn.svm import SVC

linear_clf = SVC(kernel='linear', random_state=0)
linear_clf.fit(X, y)

### 結果の可視化<a name="linear_visualization"></a>

In [None]:
import matplotlib.pyplot as plt
from matplotlib.colors import ListedColormap

def show(X, y, model):
    cmap = ListedColormap(['#FF0000', '#00FF00', '#0000FF'])
    margin = .5
    x_min, x_max = X[:, 0].min() - margin, X[:, 0].max() + margin
    y_min, y_max = X[:, 1].min() - margin, X[:, 1].max() + margin
    resolution = min(x_max - x_min, y_max - y_min) / 400

    xx, yy = np.meshgrid(np.arange(x_min, x_max, resolution), np.arange(y_min, y_max, resolution))

    Z = model.predict(np.c_[xx.ravel(), yy.ravel()]).reshape(xx.shape)
    plt.pcolormesh(xx, yy, Z, cmap=cmap, alpha=.6)

    plt.scatter(X[:, 0], X[:, 1], c=y, cmap=cmap)

    plt.xlim(x_min, x_max)
    plt.ylim(y_min, y_max)
    plt.xticks(())
    plt.yticks(())

    plt.show()

show(X, y, linear_clf)

### ガウシアンカーネルの学習<a name="rbf_training"></a>

In [None]:
rbf_clf = SVC(kernel='rbf', gamma=10, random_state=0)
rbf_clf.fit(X, y)

### 結果の可視化<a name="rbf_visualization"></a>

In [None]:
show(X, y, rbf_clf)