In [1]:
import numpy as np
from matplotlib import pyplot as plt
import matplotlib.cm as cm
import sklearn
from sklearn import datasets
from jupyterthemes import jtplot
from PIL import Image
jtplot.style()
%matplotlib inline
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"
import chainer
from chainer import cuda, Function, gradient_check, report, training, utils, Variable
from chainer import datasets, iterators, optimizers, serializers
from chainer import Link, Chain, ChainList
import chainer.functions as F
import chainer.links as L
from chainer.training import extensions
from chainer.dataset import concat_examples

def plot_decision_boundary(pred_func):
    # Set min and max values and give it some padding
    x_min, x_max = X[:, 0].min() - .5, X[:, 0].max() + .5
    y_min, y_max = X[:, 1].min() - .5, X[:, 1].max() + .5
    h = 0.01
    # Generate a grid of points with distance h between them
    xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h))
    # Predict the function value for the whole gid
    Z = pred_func(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)
    # Plot the contour and training examples
    plt.contourf(xx, yy, Z, cmap=plt.cm.Spectral)
    plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.Spectral)

ModuleNotFoundError: No module named 'sklearn'

#### 用いるデータセット

In [None]:
np.random.seed(0)
X, y = sklearn.datasets.make_moons(200, noise=0.20)
X[0:10,:]
plt.scatter(X[:,0], X[:,1], s=40, c=y, cmap=plt.cm.Spectral)

In [None]:
from chainer.datasets import tuple_dataset
tuple_dataset

線形分離不可能なデータセット

非線形的に分離するため、今まで素性2と固定定数項x0,x1,x2でやっていたところに$x_3 = x_1^2$を加える

#### 非線形に分離する識別関数の規定と各教師データでの値算出

In [None]:
th = [0.1,0.2,0.4,2.0]
#識別関数の定義（データセットの変形,theta初期化）
def makefx(data):
    f_x = np.empty(shape=(4,data.shape[0]))
    #x0=0
    ones = np.ones(shape=(1,data.shape[0]))
    f_x[0,:] = ones
    #x1,x2に教師データの2要素が入る
    f_x[1:3,:] = data.T[0:2]
    #x3=x1^2
    f_x[3,:] = data.T[0,:]**2
    return f_x.T
sample = makefx(X)
sample[0:10,:]

各教師データに対して

$\boldsymbol{x}^{(prac)} = [ x_0=0,x_1,x_2,x_3=x_1^2 ]^T$

が用意できたので、識別関数を形作るには

$\boldsymbol{θ^Tx}^{(prac)}$

とすればよい。また、これをシグモイド関数へ適用して分類確率とする。

### 初期状態でのシグモイド関数の可視化

In [None]:
#通常の1引数シグモイド関数
def sigmoid(x):
    return 1.0/(1.0+np.exp(-1.0*x))

#今回の識別関数用にσ(θx)を計算する関数
def sigmoidP(thArr,xArr):
    return sigmoid(np.dot(thArr,xArr))

def showSigmoidP(randSample, thArr, axis1=1, axis2=2):
    for s in randSample:
        ret = plt.scatter(s[axis1],s[axis2],c=cm.hot(sigmoidP(thArr,s)))


#ランダムサンプルで現在の識別関数の様子を見る
#randsample = makefx(np.random.choice(np.arange(-1.5,2.5,0.01), size=X.shape))
#showSigmoidP(randsample, th)
#plt.scatter(X[:,0], X[:,1], s=40, c=y, cmap=plt.cm.Spectral)

plot_decision_boundary(lambda x:sigmoidP(makefx(x),th))

初期状態のため教師データを分離するようにはなっていないが、非線形的に分離可能な形状であることがわかる 

In [None]:
def train(sample, labels, thetas, trainRoop, eta=50, logFlg=True):    
    for n in range(trainRoop):
        G = np.zeros(sample.shape[1])
        for j in range(sample.shape[1]):    
            for i,samp in enumerate(sample):
                G[j] = G[j] + (sigmoidP(thetas, samp)-labels[i])*samp[j]
        if logFlg:
            print("G=",G)
            print("thOld=",thetas)
        thetas = thetas - eta * np.array(G)
        if logFlg:
            print("thNew=",thetas)
    return thetas

th = train(sample, y, th, 50, eta=0.01, logFlg=False)

#showSigmoidP(randsample, th)

plot_decision_boundary(lambda x:sigmoidP(makefx(x),th))
plt.scatter(X[:,0], X[:,1], s=40, c=y, cmap=plt.cm.Spectral)

非線形的な分離ができると言っても二次関数的な形状のため、このmake_moon形状はうまく分離できていない

### 3次関数的な非線形分離
重み$\boldsymbol{θ}$と識別関数の素性を変えれば様々な非線形分離が可能

以下では$\boldsymbol{x}^{(prac)}=[x_0=0, x_1, x_2, x_3=x_1^2, x_4=x_1^3]$とする。

In [None]:
#識別関数の定義（データセットの変形,theta初期化）
th_tri = [0.1,0.2,0.4,2.0,5.0]
def makefx_tri(data):
    f_x = np.empty(shape=(5,data.shape[0]))
    #x0=0
    ones = np.ones(shape=(1,data.shape[0]))
    f_x[0,:] = ones
    #x1,x2に教師データの2要素が入る
    f_x[1:3,:] = data.T[0:2]
    #x3=x1^2
    f_x[3,:] = data.T[0,:]**2
    f_x[4,:] = data.T[0,:]**3
    return f_x.T

sample_tri = makefx_tri(X)
print("今回利用する素性")
print(sample_tri[0:10,:])

#学習
th_tri = train(sample_tri, y, th_tri, 50, eta=0.01, logFlg=False)

print("識別関数の値と教師データプロット")
#教師データに対する識別関数の形を見る
randsample_tri = makefx_tri(np.random.choice(np.arange(-1.5,2.5,0.01), size=(800,X.shape[1])))
plot_decision_boundary(lambda x:sigmoidP(makefx_tri(x),th_tri))

#showSigmoidP(randsample_tri, th_tri)

ret = plt.scatter(X[:,0], X[:,1], s=40, c=y, cmap=plt.cm.Spectral)

うまく月型を分離できている