# パーセプトロン

作成者：往蔵隆成

## 1 パーセプトロン 

### 1.1 パーセプトロンの理論的説明

<div align="center">
<img src="Perceptron.png" width="600">
</div>

パーセプトロンとは上の図で示されているような構造を持つ計算機構
<br>計算式では

\begin{equation} z = w_{1}x_{1} +w_{2}x_{2}\tag{1}\end{equation}<br>
\begin{cases}z>\theta \Rightarrow y = 1\\z\leq \theta \Rightarrow y = 0\tag{2}\end{cases}

であらわされる

さて、何のこっちゃという感じだと思いますが、具体例で考えて見よう<br>例えばこんな真理値表があったとする

|\begin{align}x_{1}\end{align}|\begin{align}x_{2}\end{align}|\begin{align}y\end{align}|
|:----------------------------|:----------------------------|:------------------------|
|1|1|1|
|1|0|1|
|0|1|1|
|0|0|0|

皆さんご存じこれはOR演算の真理値表です
<br>実は、これは先ほどのパーセプトロンを用いて計算することができます
<br>もし、上の式において$w_{1}$,$w_{2}$,$\theta$の値が

\begin{align} w_{1} & =  0.6\end{align}
\begin{align} w_{2} & =  0.7 \end{align}
\begin{align} \theta & =  0.5\end{align}

だったとしたら, $x_{1},x_{2}$ の入力に対して $z$ はどのように計算されるでしょうか
<br>$w_{1}$,$w_{2}$を上のように設定したので、$z$は以下のようになります

\begin{align} z = x_{1}\times0.6 +x_{2}\times0.7\end{align}<br>
よって、各入力に対して出力zは以下の表のようになることがわかる

|\begin{align}x_{1}\end{align}|\begin{align}x_{2}\end{align}|\begin{align}z\end{align}|
|:----------------------------|:----------------------------|:------------------------|
|1|1|1.3|
|1|0|0.6|
|0|1|0.7|
|0|0|0|

ここで、閾値($ \theta = 0.5$)の値に従えば、このパーセプトロンの出力値は以下の表のようになる

|\begin{align}z\end{align}|⇒|\begin{align}y\end{align}|
|:----------------------------:|:----------------------------:|:------------------------:|
|1.3|\<>|1|
|0.6|\<>|1|
|0.7|\<>|1|
|0|\<>|0|

最後にまとめると、以下の表のようになる

|\begin{align}x_{1}\end{align}|\begin{align}x_{2}\end{align}|\begin{align}z\end{align}|⇒|\begin{align}y\end{align}|
|:---------------------------:|:---------------------------:|:-----------------------:|:-:|:----------------------:|
|1|1|1.3|>0.5|1|
|1|0|0.6|>0.5|1|
|0|1|0.7|>0.5|1|
|0|0|0|<0.5|0|

このような、ただの代数演算が単一パーセプトロンであり、これが今日、人間の職を奪うとされている**_Deep Neural Network_**の原点となるのである

### 1.2 パーセプトロンをPythonで実装してみよう

では、今勉強したパーセプトロンをプログラミング言語Pythonを用いて実装してみましょう！

In [None]:
# この左側に[ ]があるものはコードブロックといいpythonのプログラムを書き込むことができます

In [None]:
print("Hello World") #何かを表示したいときは print を用います
print(2**10) # 計算結果なども簡単に表示することができます

まず、先ほど登場した$w_{1}$,$w_{2}$,$\theta$を定義しましょう

In [None]:
w_1 = 0.6
w_2 = 0.7
theta = 0.5

そして、式(1)(2)にしたがって$x_{1},x_{2}$を入力として結果を出力する関数を作成します

\begin{equation} z = w_{1}x_{1} +w_{2}x_{2}\tag{1}\end{equation}<br>
\begin{cases}z>\theta \Rightarrow y = 1\\z\leq \theta \Rightarrow y = 0\tag{2}\end{cases}

In [None]:
def perceptron(x_1, x_2, w_1, w_2, theta):
    z = w_1 * x_1 + w_2 * x_2 # zの値を計算してみて
    
    if z > theta: # もしzの値がthetaよりも大きければ１ を返す
        return 1
    if z <= theta: # もしzの値がthetaよりも小さければ 0 を返す
        return 0

これで、2入力のパーセプトロンの関数を定義することができました。実際に使用してみましょう

In [None]:
print("x1 = 1, x2 = 1 ⇒", perceptron(1, 1, w_1, w_2, theta))
print("x1 = 1, x2 = 0 ⇒", perceptron(1, 0, w_1, w_2, theta))
print("x1 = 0, x2 = 1 ⇒", perceptron(0, 1, w_1, w_2, theta))
print("x1 = 0, x2 = 0 ⇒", perceptron(0, 0, w_1, w_2, theta))

どうでしょう、このパーセプトロンのふるまいは明らかにor関数のものと一致していますね<br>このように、パーセプトロンを用いて論理演算の関数を作ることができるということが明らかになりました。

では、いま作成した関数とパラメータをセットにしてor関数として定義しなおしましょう

In [None]:
def OR(x_1, x_2): #本来Pythonでは慣用的に関数は小文字で表記するのだが、orは予約語であるので大文字で表記する
    # 各変数の定義
    w_1 = 0.6
    w_2 = 0.7
    theta = 0.5
    
    z = w_1 * x_1 + w_2 * x_2 # zの値を計算してみて
    
    if z > theta: # もしzの値がthetaよりも大きければ１ を返す
        return 1
    if z < theta: # もしzの値がthetaよりも小さければ 0 を返す
        return 0

では、OR関数を使ってみれば

In [None]:
print("x1 = 1, x2 = 1 ⇒",OR(1,1))
print("x1 = 1, x2 = 0 ⇒",OR(1,0))
print("x1 = 0, x2 = 1 ⇒",OR(0,1))
print("x1 = 0, x2 = 0 ⇒",OR(0,0))

このようにOR関数を作成することができた<br>
ここから、さまざまなパラメータの値を設定してあげればいろんな演算が可能であることがわかった<br>
では、ここでAND関数を作成するためにはどのような$w_{1}$,$w_{2}$,$\theta$を設定すればいいだろうか

In [None]:
def AND(x_1, x_2): #本来Pythonでは慣用的に関数は小文字で表記するのだが、orは予約語であるので大文字で表記する
    # 各変数の定義
    w_1 = 0 #各自でパラメータを変更してみよう
    w_2 = 0 #各自でパラメータを変更してみよう
    theta = 0 #各自でパラメータを変更してみよう
    
    z = w_1 * x_1 + w_2 * x_2 # zの値を計算してみて
    
    if z > theta: # もしzの値がthetaよりも大きければ１ を返す
        return 1
    if z <= theta: # もしzの値がthetaよりも小さければ 0 を返す
        return 0

実際に動かして確認してみよう

In [None]:
print("x1 = 1, x2 = 1 ⇒",AND(1,1))
print("x1 = 1, x2 = 0 ⇒",AND(1,0))
print("x1 = 0, x2 = 1 ⇒",AND(0,1))
print("x1 = 0, x2 = 0 ⇒",AND(0,0))

ANDの挙動を示すパーセプトロンを作ることはできましたか？<br>
もし余裕があれば、もっとパラメータをいじってみて、NANDやNORなどの論理計算ができる関数を作成してみましょう

このように論理演算などをはじめとした認識問題はパーセプトロンを用いることで解決可能であると考えられ、パーセプトロンの研究は盛んにおこなわれることとなった

### 1.2 単層パーセプトロンの限界

しかしながら、1967年にミンスキーとシーモア・パパートにより、単一のパーセプトロンにはある限界があることが発見される。
<br>それは非線形分類問題の解決不可能性である(ゼミ第一回を参照)

今回、↑でAND関数とOR関数の定義を行ってもらった。ところでXOR(排他的論理和)の計算出力は、パーセプトロンに行うことはできるのであろうか

|\begin{align}x_{1}\end{align}|\begin{align}x_{2}\end{align}|\begin{align}y\end{align}|
|:----------------------------|:----------------------------|:------------------------|
|1|1|0|
|1|0|1|
|0|1|1|
|0|0|0|

結論から言えば、これは再現できない<br>なぜなら、線形分離不可能であるからである。
<br>線形分離不可能とはどういうことか、今日やってきたANDとORについて、以下に二次元平面上にプロットしたものを示す

<div align="center">
<img src="ANDOR.png" width="800">
</div>

この二つは以下の図のように赤い直線で分離することができる

<div align="center">
<img src="ANDOR2.png" width="800">
</div>

簡単に言ってしまえば、この「直線で分離することができる」というのが、「線形分離可能」であり、<br>「線形分離不可能」とはその反対、つまり直線で分離することができないような問題のことを言う

実際に、排他的論理和の真理値表を二次元平面上にプロットしてみた図を以下に示す

<div align="center">
<img src="XOR.png" width="600">
</div>

みてもわかる通り、排他的論理和を分類するには直線では不可能だ<br>
この線形分離不可能な問題について、単層のパーセプトロンでは実装することができないと指摘されることがきっかけとなり、第一次人工知能ブームは終わってしまう

### 1.3 多層パーセプトロンで解決！

そんな残念なパーセプトロンかと思いきや、ある転機が訪れる<br>
それはパーセプトロンの多層化による解決法の発見である<br>
以下の図に単純な三層パーセプトロンの図を示す

<div align="center">
<img src="Multilayer_perceptron.png" width="800">
</div>

何層になったとしても、一つの構成要素が行う計算は変わらない<br>
しかし、変化するパラメータが<br>
各矢印の重みである、<br>$w_{1 \rightarrow 3}$, $w_{1 \rightarrow 4}$, $w_{2 \rightarrow 3}$, $w_{2 \rightarrow 4}$, $w_{3 \rightarrow 5}$, $w_{4 \rightarrow 5}$<br>
と、各ノード(一つのパーセプトロン)の閾値である、<br>
$\theta_{3}$, $\theta_{4}$, $\theta_{5}$<br>
の計9個に達することになる<br>
この9個のパラメータを変化させて、排他的論理和の結果が得られるような最適なパラメータを探すことで、XORを作ることができる

しかし、こんな単純なパーセプトロンでさえ、パラメータがこんなにあり、人力で探すのは困難だ。<br>であるから、せっかくなのでこのパラメータ探索を自動で行えるようにしてみる

まず、パーセプトロンの関数を組み合わせて、上のようなネットワークを作ってみる<br>
パーセプトロンの関数はさっきせっかく作ったので、それをもう一回使おう

はじめに、初期のパラメータの値を0にしておく

In [None]:
w_13 = 0
w_14 = 0
w_23 = 0
w_24 = 0
w_35 = 0
w_45 = 0

theta3 = 0
theta4 = 0
theta5 = 0

# 簡単に記載するために辞書という形にパラメータを収納しておく。今回は話の本筋とは関係ないので説明は省略
params = {"w_13":w_13, "w_14":w_14, "w_23":w_23, "w_24":w_24, "w_35":w_35, "w_45":w_45, "theta3":theta3, "theta4":theta4, "theta5":theta5}

そんでもってパーセプトロンをつなげてみる

<div align="center">
<img src="Multilayer_perceptron.png" width="800">
</div>

In [None]:
# 入力をx_1,x_2,おもりと閾値のパラメータとして出力は計算された値
def multilayer_perceptron(x_1, x_2, params):
    
    # おもりw_13 w_23 閾値theta3 と 入力x_1, x_2を入力してパーセプトロンの計算結果を得る
    x_35 = perceptron(x_1, x_2, params["w_13"], params["w_23"], params["theta3"])
    
    # おもりw_14 w_24 閾値theta4 と 入力x_1, x_2を入力してパーセプトロンの計算結果を得る
    x_45 = perceptron(x_1, x_2, params["w_14"], params["w_24"], params["theta4"])
    
    # おもりw_13 w_23 閾値theta3 と 上から出てきた値であるx_35, x_45を入力してパーセプトロンの計算結果を得る
    y = perceptron(x_35, x_45, params["w_14"], params["w_24"], params["theta5"])
    
    # 最後に出力された値を返す
    return y

ネットワークができたので値を出力してみる

In [None]:
print("x1 = 1, x2 = 1 ⇒", multilayer_perceptron(1, 1, params))
print("x1 = 1, x2 = 1 ⇒", multilayer_perceptron(1, 0, params))
print("x1 = 1, x2 = 1 ⇒", multilayer_perceptron(0, 1, params))
print("x1 = 1, x2 = 1 ⇒", multilayer_perceptron(0, 0, params))

当たり前だが、でたらめな値がでてきて到底排他的論理和とは言えない

では、パラメータの値を変更してみよう

変更のしかたは、今回は単純にランダムに変更することにする<br>では、一度変更してみよう

In [None]:
import random

# おもりwをランダムな 0 ～　2の数字に再設定
w_13 = random.uniform(-2, 2)
w_14 = random.uniform(-2, 2)
w_23 = random.uniform(-2, 2)
w_24 = random.uniform(-2, 2)
w_35 = random.uniform(-2, 2)
w_45 = random.uniform(-2, 2)

# 閾値thetaは 0　～　1の数字に再設定
theta3 = random.uniform(-2, 2)
theta4 = random.uniform(-2, 2)
theta5 = random.uniform(-2, 2)

# 簡単に記載するために辞書という形にパラメータを収納しておく。今回は鼻sの本筋とは関係ないので説明は省略
params = {"w_13":w_13, "w_14":w_14, "w_23":w_23, "w_24":w_24, "w_35":w_35, "w_45":w_45, "theta3":theta3, "theta4":theta4, "theta5":theta5}

In [None]:
print("x1 = 1, x2 = 1 ⇒", multilayer_perceptron(1, 1, params))
print("x1 = 1, x2 = 0 ⇒", multilayer_perceptron(1, 0, params))
print("x1 = 0, x2 = 1 ⇒", multilayer_perceptron(0, 1, params))
print("x1 = 0, x2 = 0 ⇒", multilayer_perceptron(0, 0, params))

どうでしょう、出力される値が変わりましたね<br>排他的論理和の出力になっていない場合は何回か二個上のセルを実行しなおして所望の出力が出るか試してみましょう

運が相当よくない限り、排他的論理和の結果にはならないでしょう<br>ですから、これを手動でなんども繰り返すのはしんどいので、python君に単純作業は任せましょう<br>
以下のプログラムはwhile文を用いて、排他的論理和の出力が出てくるまでパラメータの更新をし続けてくれるプログラムです

In [None]:
result = []
XOR = [0, 1, 1, 0]
count = 0
while result != XOR:
    # おもりwをランダムな 0 ～　2の数字に再設定
    w_13 = random.uniform(-2, 2)
    w_14 = random.uniform(-2, 2)
    w_23 = random.uniform(-2, 2)
    w_24 = random.uniform(-2, 2)
    w_35 = random.uniform(-2, 2)
    w_45 = random.uniform(-2, 2)

    # 閾値thetaは 0　～　1の数字に再設定
    theta3 = random.uniform(-2, 2)
    theta4 = random.uniform(-2, 2)
    theta5 = random.uniform(-2, 2)

    # 簡単に記載するために辞書という形にパラメータを収納しておく。今回は鼻sの本筋とは関係ないので説明は省略
    params = {"w_13":w_13, "w_14":w_14, "w_23":w_23, "w_24":w_24, "w_35":w_35, "w_45":w_45, "theta3":theta3, "theta4":theta4, "theta5":theta5}

    y_11 = multilayer_perceptron(1, 1, params)
    y_10 = multilayer_perceptron(1, 0, params)
    y_01 = multilayer_perceptron(0, 1, params)
    y_00 = multilayer_perceptron(0, 0, params)
    
    result = [y_11, y_10, y_01, y_00]
    count += 1


セルの実行が終わったら、本当に正しいのか確かめてみましょう

In [None]:
print("x1 = 1, x2 = 1 ⇒", multilayer_perceptron(1, 1, params))
print("x1 = 1, x2 = 1 ⇒", multilayer_perceptron(1, 0, params))
print("x1 = 1, x2 = 1 ⇒", multilayer_perceptron(0, 1, params))
print("x1 = 1, x2 = 1 ⇒", multilayer_perceptron(0, 0, params))

確かに！きちんと排他的論理和の出力と一致していますね

ちなみに、なんど繰り返しパラメータを変更したのかを見るためには以下のセルを実行すればわかります

In [None]:
count

また、今回計算した排他的論理和を出力するネットワークのパラメータは以下のようになっています

In [None]:
import pandas as pd
pd.DataFrame(pd.Series(params), columns=["パラメータ"])

このように、パラメータの値を更新していくことを、人間が失敗を反省し再びやり直すことに対応させ、「学習」と呼んでいます。<br>
また、今回はパラメータの更新を完全にランダムで行っていましたが、誤差から逆算してパラメータの値を変化させる「誤差逆伝搬法」は、学習効率を飛躍的に上昇させました。<br>
そして、このネットワークをさらに多層化させ、もう一工夫させることによって認識精度をさらに上げたのが皆さんご存じの「deep neural network」です。