## 実践演習7-3

sklearnのSVMでGridSearchを行います。

In [0]:
from sklearn.datasets import load_wine
from sklearn.svm import SVC
from sklearn.model_selection import GridSearchCV

Wineデータを読み込み、パターン行列Xと教師ベクトルyにデータを格納します。

In [2]:
wine = load_wine()
X = wine.data
y = wine.target
print(wine.DESCR)

.. _wine_dataset:

Wine recognition dataset
------------------------

**Data Set Characteristics:**

    :Number of Instances: 178 (50 in each of three classes)
    :Number of Attributes: 13 numeric, predictive attributes and the class
    :Attribute Information:
 		- Alcohol
 		- Malic acid
 		- Ash
		- Alcalinity of ash  
 		- Magnesium
		- Total phenols
 		- Flavanoids
 		- Nonflavanoid phenols
 		- Proanthocyanins
		- Color intensity
 		- Hue
 		- OD280/OD315 of diluted wines
 		- Proline

    - class:
            - class_0
            - class_1
            - class_2
		
    :Summary Statistics:
    
                                   Min   Max   Mean     SD
    Alcohol:                      11.0  14.8    13.0   0.8
    Malic Acid:                   0.74  5.80    2.34  1.12
    Ash:                          1.36  3.23    2.36  0.27
    Alcalinity of Ash:            10.6  30.0    19.5   3.3
    Magnesium:                    70.0 162.0    99.7  14.3
    Total Phenols:                0

まず、演習書の事例にある「スラック変数の重みC」と「多項式カーネルの次数degree」の組み合わせでGridSearchを行います。

パラメータとして多項式カーネルを与えて、サポートベクトルマシン[SVC](http://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html)のインスタンスsvcを作成します。

In [3]:
svc = SVC(kernel='poly', gamma='scale')
svc

SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,
    decision_function_shape='ovr', degree=3, gamma='scale', kernel='poly',
    max_iter=-1, probability=False, random_state=None, shrinking=True,
    tol=0.001, verbose=False)

演習書の事例の通り、「スラック変数の重みC」と「多項式カーネルの次数degree」の組み合わせで、リストを値とするディクショナリの配列param\_gridを作成します。

In [0]:
param_grid = [
  {'C': [1, 10, 100, 1000], 'degree': [1,2,3]}
 ]

識別器のインスタンスを第1引数、グリッドを第2引数として、[GridSearch](http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html)のインスタンスを作成し、fitメソッドを実行します。パラメータcvの値がNone（デフォルト）のとき、性能は3-fold CVで評価されます。

In [5]:
clf = GridSearchCV(svc, param_grid, cv=5, iid=False, return_train_score=True)
clf.fit(X, y)                            

GridSearchCV(cv=5, error_score='raise-deprecating',
             estimator=SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,
                           decision_function_shape='ovr', degree=3,
                           gamma='scale', kernel='poly', max_iter=-1,
                           probability=False, random_state=None, shrinking=True,
                           tol=0.001, verbose=False),
             iid=False, n_jobs=None,
             param_grid=[{'C': [1, 10, 100, 1000], 'degree': [1, 2, 3]}],
             pre_dispatch='2*n_jobs', refit=True, return_train_score=True,
             scoring=None, verbose=0)

結果はcv\_results\_属性の値として、ディクショナリで得られます。

In [6]:
clf.cv_results_

{'mean_fit_time': array([0.00150008, 0.00078959, 0.00081563, 0.00074806, 0.00091186,
        0.00084624, 0.00084677, 0.00110865, 0.0014349 , 0.0023509 ,
        0.00786262, 0.0104496 ]),
 'mean_score_time': array([0.00056229, 0.00031643, 0.00030661, 0.00034232, 0.00038342,
        0.00031471, 0.00030842, 0.00031476, 0.0003305 , 0.00030823,
        0.00036335, 0.00040646]),
 'mean_test_score': array([0.66392283, 0.65296187, 0.66377268, 0.69838595, 0.67535998,
        0.66423171, 0.7436513 , 0.72045802, 0.70343806, 0.84958589,
        0.81684458, 0.78827239]),
 'mean_train_score': array([0.68695736, 0.6939795 , 0.6897146 , 0.70660713, 0.7010223 ,
        0.69114303, 0.73462992, 0.74875383, 0.73483595, 0.86955125,
        0.85825367, 0.84144994]),
 'param_C': masked_array(data=[1, 1, 1, 10, 10, 10, 100, 100, 100, 1000, 1000, 1000],
              mask=[False, False, False, False, False, False, False, False,
                    False, False, False, False],
        fill_value='?',
          

すべてのパラメータの組み合わせについて、スコアを表示します。

In [7]:
re = clf.cv_results_
for params, mean_score, std_score in zip(re['params'], re['mean_test_score'], re['std_test_score']):
    print("{:.3f} (+/- {:.3f}) for {}".format(mean_score, std_score, params))

0.664 (+/- 0.039) for {'C': 1, 'degree': 1}
0.653 (+/- 0.046) for {'C': 1, 'degree': 2}
0.664 (+/- 0.036) for {'C': 1, 'degree': 3}
0.698 (+/- 0.064) for {'C': 10, 'degree': 1}
0.675 (+/- 0.054) for {'C': 10, 'degree': 2}
0.664 (+/- 0.053) for {'C': 10, 'degree': 3}
0.744 (+/- 0.074) for {'C': 100, 'degree': 1}
0.720 (+/- 0.054) for {'C': 100, 'degree': 2}
0.703 (+/- 0.058) for {'C': 100, 'degree': 3}
0.850 (+/- 0.069) for {'C': 1000, 'degree': 1}
0.817 (+/- 0.103) for {'C': 1000, 'degree': 2}
0.788 (+/- 0.079) for {'C': 1000, 'degree': 3}


性能が最大となるパラメータとそのときのスコアを表示します。

In [8]:
clf.best_params_

{'C': 1000, 'degree': 1}

In [9]:
clf.best_score_

0.8495858884094177

次に、Cとgamma(RBF kernerl)の組み合わせでGridSearchを行います。  
まず、配列param_gridを作成します。

In [0]:
param_grid = [
  {'C':[1, 10, 100, 1000], 'gamma':[0.1, 0.01, 0.001, 0.0001]}
 ]

サポートベクトルマシンSVCのインスタンスsvcをRBFカーネルで作成し、GridSearchを行い、すべてのパラメータの組み合わせについて、スコアを表示します。

In [11]:
svc = SVC(kernel='rbf', gamma='scale')
svc

SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,
    decision_function_shape='ovr', degree=3, gamma='scale', kernel='rbf',
    max_iter=-1, probability=False, random_state=None, shrinking=True,
    tol=0.001, verbose=False)

In [12]:
clf = GridSearchCV(svc, param_grid,cv=5, iid=False, return_train_score=True)
clf.fit(X, y)   

GridSearchCV(cv=5, error_score='raise-deprecating',
             estimator=SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,
                           decision_function_shape='ovr', degree=3,
                           gamma='scale', kernel='rbf', max_iter=-1,
                           probability=False, random_state=None, shrinking=True,
                           tol=0.001, verbose=False),
             iid=False, n_jobs=None,
             param_grid=[{'C': [1, 10, 100, 1000],
                          'gamma': [0.1, 0.01, 0.001, 0.0001]}],
             pre_dispatch='2*n_jobs', refit=True, return_train_score=True,
             scoring=None, verbose=0)

In [13]:
re = clf.cv_results_
for params, mean_score, std_score in zip(re['params'], re['mean_test_score'], re['std_test_score']):
    print("{:.3f} (+/- {:.3f}) for {}".format(mean_score, std_score, params))

0.410 (+/- 0.018) for {'C': 1, 'gamma': 0.1}
0.642 (+/- 0.075) for {'C': 1, 'gamma': 0.01}
0.687 (+/- 0.056) for {'C': 1, 'gamma': 0.001}
0.714 (+/- 0.056) for {'C': 1, 'gamma': 0.0001}
0.417 (+/- 0.033) for {'C': 10, 'gamma': 0.1}
0.653 (+/- 0.075) for {'C': 10, 'gamma': 0.01}
0.748 (+/- 0.061) for {'C': 10, 'gamma': 0.001}
0.776 (+/- 0.054) for {'C': 10, 'gamma': 0.0001}
0.417 (+/- 0.033) for {'C': 100, 'gamma': 0.1}
0.653 (+/- 0.075) for {'C': 100, 'gamma': 0.01}
0.771 (+/- 0.070) for {'C': 100, 'gamma': 0.001}
0.855 (+/- 0.079) for {'C': 100, 'gamma': 0.0001}
0.417 (+/- 0.033) for {'C': 1000, 'gamma': 0.1}
0.653 (+/- 0.075) for {'C': 1000, 'gamma': 0.01}
0.771 (+/- 0.070) for {'C': 1000, 'gamma': 0.001}
0.872 (+/- 0.057) for {'C': 1000, 'gamma': 0.0001}


param\_gridに複数のグリッドを持たせることで、上記2回の実験を1回で行うことができます。その際、グリッドの情報にカーネルの種類を持たせることに注意してください。

In [0]:
param_grid = [
  {'C':[1, 10, 100, 1000], 'degree':[1, 2, 3], 'kernel':['poly']},
  {'C':[1, 10, 100, 1000], 'gamma':[0.1, 0.01, 0.001, 0.0001], 'kernel':['rbf']}
 ]

GridSearchを実行します。

In [15]:
clf = GridSearchCV(svc, param_grid, cv=5, iid=False)
clf.fit(X, y) 

GridSearchCV(cv=5, error_score='raise-deprecating',
             estimator=SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,
                           decision_function_shape='ovr', degree=3,
                           gamma='scale', kernel='rbf', max_iter=-1,
                           probability=False, random_state=None, shrinking=True,
                           tol=0.001, verbose=False),
             iid=False, n_jobs=None,
             param_grid=[{'C': [1, 10, 100, 1000], 'degree': [1, 2, 3],
                          'kernel': ['poly']},
                         {'C': [1, 10, 100, 1000],
                          'gamma': [0.1, 0.01, 0.001, 0.0001],
                          'kernel': ['rbf']}],
             pre_dispatch='2*n_jobs', refit=True, return_train_score=False,
             scoring=None, verbose=0)

すべてのパラメータの組み合わせについて、スコアを表示します。

In [16]:
re = clf.cv_results_
for params, mean_score, std_score in zip(re['params'], re['mean_test_score'], re['std_test_score']):
    print("{:.3f} (+/- {:.3f}) for {}".format(mean_score, std_score, params))

0.664 (+/- 0.039) for {'C': 1, 'degree': 1, 'kernel': 'poly'}
0.653 (+/- 0.046) for {'C': 1, 'degree': 2, 'kernel': 'poly'}
0.664 (+/- 0.036) for {'C': 1, 'degree': 3, 'kernel': 'poly'}
0.698 (+/- 0.064) for {'C': 10, 'degree': 1, 'kernel': 'poly'}
0.675 (+/- 0.054) for {'C': 10, 'degree': 2, 'kernel': 'poly'}
0.664 (+/- 0.053) for {'C': 10, 'degree': 3, 'kernel': 'poly'}
0.744 (+/- 0.074) for {'C': 100, 'degree': 1, 'kernel': 'poly'}
0.720 (+/- 0.054) for {'C': 100, 'degree': 2, 'kernel': 'poly'}
0.703 (+/- 0.058) for {'C': 100, 'degree': 3, 'kernel': 'poly'}
0.850 (+/- 0.069) for {'C': 1000, 'degree': 1, 'kernel': 'poly'}
0.817 (+/- 0.103) for {'C': 1000, 'degree': 2, 'kernel': 'poly'}
0.788 (+/- 0.079) for {'C': 1000, 'degree': 3, 'kernel': 'poly'}
0.410 (+/- 0.018) for {'C': 1, 'gamma': 0.1, 'kernel': 'rbf'}
0.642 (+/- 0.075) for {'C': 1, 'gamma': 0.01, 'kernel': 'rbf'}
0.687 (+/- 0.056) for {'C': 1, 'gamma': 0.001, 'kernel': 'rbf'}
0.714 (+/- 0.056) for {'C': 1, 'gamma': 0.0001, '

性能が最大となるパラメータとそのときのスコアを表示します。

In [17]:
clf.best_params_

{'C': 1000, 'gamma': 0.0001, 'kernel': 'rbf'}

In [18]:
clf.best_score_

0.871685214626391