slideshare:
[Simple perceptron by TJO](http://www.slideshare.net/takashijozaki1/simple-perceptron-by-tjo) from [Takashi J Ozaki](http://www.slideshare.net/takashijozaki1)を参考にさせてもらいました.

In [None]:
# -*- coding: utf-8 -*-
# simple_perceptron.py
# 演算用にNumPyを、プロット用にmatplotlibをimport
import numpy as np
import matplotlib.pyplot as plt

# 識別関数の本体：y=w'xを計算してるだけ
def predict(wvec,xvec):
    out=np.dot(wvec,xvec)
    if out>=0:
        res=1
    else:
        res=-1
    return [res,out]

# 学習部：識別関数に学習データを順繰りに入れて、
# 重みベクトルを更新する
def train(wvec,xvec,label):
    [res,out]=predict(wvec,xvec)
    c=0.5 # 学習係数。大き過ぎてもまともに学習してくれないので1未満ぐらいで
    if out*label<0:
        wtmp=wvec+c*label*xvec
        return wtmp
    else:
        return wvec

# 以下本体
if __name__=='__main__':
    
    item_num=100 # 学習データは100個
    loop=1000    # 収束判定は一切してないけどとりあえず1000回ループ
    init_wvec=[1,-1,1] # 重みベクトルの初期値、適当
    
    # 学習データはxy平面の第1象限と第3象限に50個ずつ
    # np.random.randomでばらつかせてみた
    x1_1=np.ones(int(item_num/2))+10*np.random.random(int(item_num/2))
    x1_2=np.ones(int(item_num/2))+10*np.random.random(int(item_num/2))
    x2_1=-np.ones(int(item_num/2))-10*np.random.random(int(item_num/2))
    x2_2=-np.ones(int(item_num/2))-10*np.random.random(int(item_num/2))
    z=np.ones(int(item_num/2)) # こいつはバイアス項、今回は無視して1に固定

    # 学習データを1つのマトリクスにまとめる
    x1=np.c_[x1_1,x1_2,z]
    x2=np.c_[x2_1,x2_2,z]
    class_x=np.array(np.r_[x1,x2])

    # 教師ラベルを1 or -1で振って1つのベクトルにまとめる
    label1=np.ones(int(item_num/2))
    label2=-1*np.ones(int(item_num/2))
    label_x=np.array(np.r_[label1,label2])

    # NumPy.ndarrayはappend()メソッドが使えないので
    # 糞コードらしく初期arrayを作ってそこに垂直に足していく策を取る
    wvec=np.vstack((init_wvec,init_wvec))
    
    # ループ回数の分だけ繰り返しつつ、重みベクトルを学習させる
    for j in range(loop):
        for i in range(item_num):
            wvec_new=train(wvec[-1],class_x[i,:],label_x[i])
            wvec=np.vstack((wvec,wvec_new))
    w=wvec[-1] # 重みベクトルを垂直に足していった最後のものを採用する
    print w

    # 分離直線を引く
    x_fig=range(-15,16)
    y_fig=[-(w[1]/w[0])*xi-(w[2]/w[1]) for xi in x_fig]

    # 漫然とプロットする
    plt.scatter(x1[:,0],x1[:,1],marker='o',color='g',s=100)
    plt.scatter(x2[:,0],x2[:,1],marker='s',color='b',s=100)
    plt.plot(x_fig,y_fig)
    plt.show()

# パーセプトロン
線形識別器の基礎(今は)
究極的には「識別関数」の値の大小で分類する.

$$y=\mathbf{w^{\mathrm{T}}x}$$

$y$: 返値（「±の符号」が大事！）  
$\mathbf{w^{\mathrm{T}}}$: 重みベクトル（学習結果）  
$\mathbf{x}$: 入力信号（これから識別したいもの）

例として,ここではメールのSPAM判定を想定する.

入力信号の例.「メールの単語頻度」と仮定.

$$ x=\begin{bmatrix}「会議」という語の数 \\「目標」という語の数  \\「お買い得」という語の数 \end{bmatrix} =  \begin{bmatrix}2 \\1  \\0 \end{bmatrix}  $$

次に,重みベクトルの例.適当に決め打ち.

$$ \mathbf{w}=\begin{bmatrix}w_{1} \\w_{2}  \\w_{3} \end{bmatrix} =\begin{bmatrix}1 \\1  \\-1 \end{bmatrix} $$

そこで識別関数を計算してみる.

$$\mathbf{y}=\mathbf{w^{\mathrm{T}}x}= \begin{bmatrix}1 & 1 & -1 \end{bmatrix} \begin{bmatrix}2 \\1  \\0 \end{bmatrix}=3$$

$\mathbf{w^{\mathrm{T}}}$ は$1 \times 3$行列 $(m =1,n =3)$  
$\mathbf{x}$ は$3 \times 1$行列 $(n =3,p =1)$

このとき $\mathbf{w^{\mathrm{T}}}$ の第 $1(i=1)$ 行と $\mathbf{x}$ の第 $1(j=1)$ 列はともに $3(n=3)$ 個の成分からなっているので,その対応する成分の積の和は

$$
\mathbf{y} = \sum_{k=1}^{3} w_{1k}^{{\mathrm{T}}}\mathbf{x}_{k1}=
w_{11}^{{\mathrm{T}}}\mathbf{x}_{11}+
w_{12}^{{\mathrm{T}}}\mathbf{x}_{21}+
w_{13}^{{\mathrm{T}}}\mathbf{x}_{31}=
1\cdot2 +1\cdot1+ (-1)\cdot0 =3
$$

$\mathbf{y}=3$ ゆえに,これは非SPAM.

In [1]:
import numpy as np

wt = np.array([1,1,-1])
x = np.array([[2],
              [1],
              [0]])

print np.dot(wt,x)

[3]


ところが,SPAMじゃないはずなのに,ベクトルがこのような数のメールが来たら

$$ x=\begin{bmatrix}「会議」という語の数 \\「目標」という語の数  \\「お買い得」という語の数 \end{bmatrix} =  \begin{bmatrix}1 \\1  \\3\end{bmatrix}  $$

そこで識別関数を計算してみる.

$$\mathbf{y}=\mathbf{w^{\mathrm{T}}x}= \begin{bmatrix}1 & 1 & -1 \end{bmatrix} \begin{bmatrix}1 \\1  \\3 \end{bmatrix}=-1$$

非SPAMのはずなのに $\mathbf{y}=-1$ というSPAM判定が出た.  
ということは,重みベクトルを変えねばならない.

In [1]:
import numpy as np

wt = np.array([1,1,-1])
x = np.array([[1],
              [1],
              [3]])

print np.dot(wt,x)

[-1]


そこで,重みベクトルを以下のように更新する.$\mu$は学習係数, $\begin{bmatrix}1 \\1 \\3 \end{bmatrix}$ は誤判定した時の入力信号の値.

$$ \mathbf{w_{new}}=\mathbf{w_{old}}+ \mu \begin{bmatrix}1 \\1 \\3 \end{bmatrix} =\begin{bmatrix}1 \\1  \\-1 \end{bmatrix} + \begin{bmatrix}\mu \\\mu  \\3\mu \end{bmatrix} = \begin{bmatrix}1+\mu \\1+\mu  \\-1+3\mu \end{bmatrix} $$