In [31]:
# 必要なライブラリを読み込み
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
% matplotlib inline

In [32]:
# irisデータセットの読み込み
# 品種: SetosaとVersicolour（線形分離可能）
# 変数: petal lengthとpetal width
from sklearn.datasets import load_iris
iris = load_iris()
X = iris.data
y = iris.target

In [33]:
# データの標準化
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
scaler.fit(X)
X_std = scaler.transform(X)

In [37]:
# ホールド・アウト法による分割
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X_std, y, test_size=0.3, random_state=0)

In [38]:
# カーネルSVMによる学習
# C: 誤分類への厳しさ
# gamma: 決定曲線の複雑さ
rbf_svm = SVC(kernel='rbf', gamma=0.1, C=10)
rbf_svm.fit(X_train, y_train)

SVC(C=10, cache_size=200, class_weight=None, coef0=0.0,
  decision_function_shape='ovr', degree=3, gamma=0.1, kernel='rbf',
  max_iter=-1, probability=False, random_state=None, shrinking=True,
  tol=0.001, verbose=False)

In [39]:
# 正答率を出力
rbf_svm.score(X_test, y_test)

0.9777777777777777

In [40]:
# グリッドサーチ
# 調整したいパラメータを指定
param_grid = {'C': [0.1, 1.0, 10, 100, 1000, 10000],
              'gamma': [0.001, 0.01, 0.1, 1, 10]}

In [41]:
# データの分割方法を指定（層化）
from sklearn.model_selection import StratifiedKFold
kf_5 = StratifiedKFold(n_splits=5, shuffle=True, random_state=0)

In [42]:
# GridSearchCVのインスタンスを生成
from sklearn.model_selection import GridSearchCV
from sklearn.svm import SVC
# (モデルのインスタンス, 試したいパラメータの値, 分割方法)
gs_svc = GridSearchCV(SVC(), param_grid, cv=kf_5)

In [49]:
# GridSearchCVを利用した学習
# 最適なパラメータを自動で採用した分類器となる
gs_svc.fit(X_train, y_train)
# test精度の平均が最も高かった組み合わせを出力
print("best-parameters:{}".format(gs_svc.best_params_))
# そのときのtest精度の平均を出力
print("mean-score:{}".format(gs_svc.best_score_))
# ホールド・アウト法によるtest精度を出力
print("final-score:{}".format(gs_svc.score(X_test, y_test)))

best-parameters:{'C': 10, 'gamma': 0.1}
mean-score:0.9619047619047619
final-score:0.9777777777777777
