# サポートベクタマシン

In [None]:
import numpy as np
import pandas as pd
import pylab as pl
from sklearn import svm
np.set_printoptions(suppress=True) 

In [None]:
# データの読込と概要の表示
from sklearn import  datasets
iris = datasets.load_iris()
print (iris.DESCR)

In [None]:
# pandas形式で先頭10件分を表示
df = pd.DataFrame(iris.data)
df.columns = iris.feature_names
df['class'] = iris.target
df.head(10)

# sepal length (cm):花弁の長さ
# sepal width (cm):花弁の幅
# petal length (cm):がく片の長さ
# petal width (cm):がく片の幅
# class: 品種:0=Setosa,1=Versicolor, 2=Virginica

In [None]:
# 入力変数と説明変数の切り分け
X = iris.data  
Y = iris.target

In [None]:
# SVMによるクラス分類の実行(線形カーネル)
clf = svm.SVC(kernel='linear')
clf.fit(X, Y)

In [None]:
# 予測精度の確認
clf.score(X,Y)

In [None]:
# 元データの150件目(X[149])で分類結果を表示(0=Setosa,1=Versicolor, 2=Virginica)
print (clf.predict([X[149]]))

In [None]:
# 元データの150件目(Y[149])の正解を表示(0=Setosa,1=Versicolor, 2=Virginica)
print ([Y[149]])

In [None]:
# RBFカーネルによる非線形SVMの実行と予測精度の確認
clf = svm.SVC(kernel='rbf')
clf.fit(X, Y)

In [None]:
# 予測精度の確認
clf.score(X,Y)

In [None]:
# 可視化のために元データの要素数を4から2に削減(主成分分析による次元削減を実行)
from sklearn.decomposition import PCA

pca = PCA(n_components=2).fit(X)
pca_2d = pca.transform(X)

# 次元削減されたデータの表示
pca_2d

In [None]:
# 線形SVMによるクラス分類と境界線を表示

from pylab import rcParams
rcParams['figure.figsize'] = 15,10

svmClassifier_2d = svm.LinearSVC().fit(pca_2d, Y)

for i in range(0, pca_2d.shape[0]):
    if Y[i] == 0:
        c1 = pl.scatter(pca_2d[i,0],pca_2d[i,1],c='r', s=50,marker='+')
    elif Y[i] == 1:
        c2 = pl.scatter(pca_2d[i,0],pca_2d[i,1],c='g', s=50,marker='o')
    elif Y[i] == 2:
        c3 = pl.scatter(pca_2d[i,0],pca_2d[i,1],c='b', s=50,marker='*')

        pl.legend([c1, c2, c3], ['Setosa', 'Versicolor',   'Virginica'])

x_min, x_max = pca_2d[:, 0].min() - 1,   pca_2d[:,0].max() + 1
y_min, y_max = pca_2d[:, 1].min() - 1,   pca_2d[:, 1].max() + 1
xx, yy = np.meshgrid(np.arange(x_min, x_max, .01),   np.arange(y_min, y_max, .01))
Z = svmClassifier_2d.predict(np.c_[xx.ravel(),  yy.ravel()])
Z = Z.reshape(xx.shape)

pl.contour(xx, yy, Z)
pl.axis('off')
pl.show()

In [None]:
# モデル精度の表示
svmClassifier_2d.score(pca_2d,Y)

In [None]:
# RBFカーネルによる非線形SVMによるクラス分類と境界線を表示
svmClassifier_2d = svm.SVC().fit(pca_2d, Y)

for i in range(0, pca_2d.shape[0]):
    if Y[i] == 0:
        c1 = pl.scatter(pca_2d[i,0],pca_2d[i,1],c='r', s=50,marker='+')
    elif Y[i] == 1:
        c2 = pl.scatter(pca_2d[i,0],pca_2d[i,1],c='g', s=50,marker='o')
    elif Y[i] == 2:
        c3 = pl.scatter(pca_2d[i,0],pca_2d[i,1],c='b', s=50,marker='*')

        pl.legend([c1, c2, c3], ['Setosa', 'Versicolor',   'Virginica'])

x_min, x_max = pca_2d[:, 0].min() - 1,   pca_2d[:,0].max() + 1
y_min, y_max = pca_2d[:, 1].min() - 1,   pca_2d[:, 1].max() + 1
xx, yy = np.meshgrid(np.arange(x_min, x_max, .01),   np.arange(y_min, y_max, .01))
Z = svmClassifier_2d.predict(np.c_[xx.ravel(),  yy.ravel()])
Z = Z.reshape(xx.shape)

pl.contour(xx, yy, Z)
pl.axis('off')
pl.show()
svmClassifier_2d.score(pca_2d,Y)

In [None]:
# モデル精度の表示
svmClassifier_2d.score(pca_2d,Y)