# 17章　サポートベクタマシン 

## レシピ17.1　線形クラス分類器の訓練 


In [None]:
# ライブラリをロード
from sklearn.svm import LinearSVC
from sklearn import datasets
from sklearn.preprocessing import StandardScaler
import numpy as np

# データをロードし、クラスを2つ、特徴量数も2つに制約
iris = datasets.load_iris()
features = iris.data[:100,:2]
target = iris.target[:100]

# 特徴量を標準化
scaler = StandardScaler()
features_standardized = scaler.fit_transform(features)

# サポートベクタクラス分類器を作成
svc = LinearSVC(C=1.0)

# サポートベクタクラス分類器を訓練
model = svc.fit(features_standardized, target)

# ライブラリをロード
from matplotlib import pyplot as plt

# 観測値をそれぞれの色でプロット
color = ["black" if c == 0 else "lightgrey" for c in target]
plt.scatter(features_standardized[:,0], features_standardized[:,1], c=color)

# 超平面を作成
w = svc.coef_[0]
a = -w[0] / w[1]
xx = np.linspace(-2.5, 2.5)
yy = a * xx - (svc.intercept_[0]) / w[1]

# 超平面をプロット
plt.plot(xx, yy)
plt.axis("off"), plt.show()

In [None]:
# 新たな観測値の作成
new_observation = [[ -2, 3]]

# 新たな観測値のクラスを予測
svc.predict(new_observation)

## レシピ17.2　 カーネルを用いた線形分離不能なクラスの取り扱い 


In [None]:
# ライブラリをロード
from sklearn.svm import SVC
from sklearn import datasets
from sklearn.preprocessing import StandardScaler
import numpy as np

# 乱数シードを設定
np.random.seed(0)

# 2つの特徴量を生成
features = np.random.randn(200, 2)

# XORゲート（ここではわからなくてよい）を用いて、
# 線形分離不能なデータを作成
target_xor = np.logical_xor(features[:, 0] > 0, features[:, 1] > 0)
target = np.where(target_xor, 0, 1)

# 放射基底関数（rbf）カーネルを用いたサポートベクタマシンを作成
svc = SVC(kernel="rbf", random_state=0, gamma=1, C=1)

# クラス分類器を訓練
model = svc.fit(features, target)

In [None]:
# 観測値と決定境界超平面をプロット
from matplotlib.colors import ListedColormap
import matplotlib.pyplot as plt

def plot_decision_regions(X, y, classifier):
    cmap = ListedColormap(["red", "blue"])
    xx1, xx2 = np.meshgrid(np.arange(-3, 3, 0.02), np.arange(-3, 3, 0.02))
    Z = classifier.predict(np.array([xx1.ravel(), xx2.ravel()]).T)
    Z = Z.reshape(xx1.shape)
    plt.contourf(xx1, xx2, Z, alpha=0.1, cmap=cmap)

    for idx, cl in enumerate(np.unique(y)):
        plt.scatter(x=X[y == cl, 0], y=X[y == cl, 1],
                    alpha=0.8, c=cmap(idx),
                    marker="+", label=cl)

In [None]:
# 線形カーネルを用いたサポートベクタクラス分類器を作成
svc_linear = SVC(kernel="linear", random_state=0, C=1)

# クラス分類器を訓練
svc_linear.fit(features, target)

In [None]:
# 観測値と超平面をプロット
plot_decision_regions(features, target, classifier=svc_linear)
plt.axis("off"), plt.show()

In [None]:
# 放射基底関数カーネルを用いたサポートベクタクラス分類器を作成
svc = SVC(kernel="rbf", random_state=0, gamma=1, C=1)

# クラス分類器を訓練
model = svc.fit(features, target)

# 観測値と超平面をプロット
plot_decision_regions(features, target, classifier=svc)
plt.axis("off"), plt.show()

## レシピ17.3　予測確率の生成 


In [None]:
# ライブラリをロード
from sklearn.svm import SVC
from sklearn import datasets
from sklearn.preprocessing import StandardScaler
import numpy as np

# データをロード
iris = datasets.load_iris()
features = iris.data
target = iris.target

# 特徴量を標準化
scaler = StandardScaler()
features_standardized = scaler.fit_transform(features)

# サポートベクタクラス分類器を作成
svc = SVC(kernel="linear", probability=True, random_state=0)

# クラス分類器を訓練
model = svc.fit(features_standardized, target)

# 新たな観測値を作成
new_observation = [[.4, .4, .4, .4]]

# 予測確率を表示
model.predict_proba(new_observation)

## レシピ17.4　サポートベクタの特定 


In [None]:
# ライブラリをロード
from sklearn.svm import SVC
from sklearn import datasets
from sklearn.preprocessing import StandardScaler
import numpy as np

#データをロードして2クラスだけ残す
iris = datasets.load_iris()
features = iris.data[:100,:]
target = iris.target[:100]

# 特徴量を標準化
scaler = StandardScaler()
features_standardized = scaler.fit_transform(features)

# サポートベクタクラス分類器を作成
svc = SVC(kernel="linear", random_state=0)

# サポートベクタクラス分類器を訓練
model = svc.fit(features_standardized, target)

# サポートベクタを表示
model.support_vectors_

In [None]:
model.support_

In [None]:
model.n_support_

## レシピ17.5　不均等なクラスサイズの取り扱い 


In [None]:
# ライブラリをロード
from sklearn.svm import SVC
from sklearn import datasets
from sklearn.preprocessing import StandardScaler
import numpy as np

#データをロードして2クラスだけ残す
iris = datasets.load_iris()
features = iris.data[:100,:]
target = iris.target[:100]

# 観測値の最初の40個を捨ててクラスのバランスの崩す
features = features[40:,:]
target = target[40:]

# クラス0かどうかを示すターゲットベクタを作成
target = np.where((target == 0), 0, 1)

# 特徴量を標準化
scaler = StandardScaler()
features_standardized = scaler.fit_transform(features)

# サポートベクタクラス分類器を作成
svc = SVC(kernel="linear", class_weight="balanced", C=1.0, random_state=0)

# サポートベクタクラス分類器を訓練
model = svc.fit(features_standardized, target)