# パーセプトロン (Perceptron)

- 1957年に心理学者Rosenblattによって考案されたアルゴリズム
- パーセプトロンは複数の「信号」を入力として受け取り、1つのん信号を出力する
- ここでいう「信号」は、電流や川のような「流れ」を持つモノというイメージで、電流が導線を流れ、電子を先に送り出すように、パーセプトロンも流れを作り、情報を先へと伝達する
- ただし、実際の電流とは異なり、パーセプトロンの信号は、「流す (1) or 流さない (0)」の二値の値をとる

### 図2-1 2入力のパーセプトロン

<pre>
[x1] ----- w1 -----
                             |
                             -----> [y]  
                             |  
[x2] ----- w2 -----  
</pre>

- x1, x2: 入力信号
- y: 出力信号
- w1, w2: 重み (weight)
- []: ニューロン、ノード *実際は○で記述

- 入力信号は、ニューロンに送られる際に、固有の重みが乗算される
    - w1x1
    - w2x2
- この重みは各信号の重要性をコントロールするための要素として働き、重みが大きいほど対応する信号の重要性は増す
    - 重みは電流でいうところの「抵抗」に相当し、電流の流れに草を決めるパラメータで、抵抗が低いほど大きな電流が流れる
    - パーセプトロンでは逆で、重みが大きいほど大きな信号が流れる
- ニューロンでは、送られてきた信号の総和が計算され、その総和がある限界値を超えた場合にのみ1を出力
    - これを「ニューロンが発火する」と表現することもある
    - ここでは限界値は閾値と呼び、θ(theta)で表す

#### パーセプトロンの動作原理の数式

$$
    y =
        \begin{cases}
            0 \quad w1x1+w2x2 \leqq θ \\
            1 \quad w1x1+w2x2 > θ \\
        \end{cases}
$$

## 単純な論理回路

### ANDゲート

### 図2-2 ANDゲートの真理値表 
| x1 | x2 | |: | y |
|---|:---:| |: |---:|
| 0 | 0 | |: | 0 |
| 1 | 0 | |: | 0 |
| 0 | 1 | |: | 0 |
| 1 | 1 | |: | 1 |

- 真理値表を満たすように、w1, w2, θの値を決めるだけで、パーセプトロンを表現できる
- 各パラメータの選び方は無限で、下記はいずれもANDゲートの条件を満たす
    - (w1, w2, θ) = (0.5, 0.5, 0.7)
    - (w1, w2, θ) = (0.5, 0.5, 0.8)
    - (w1, w2, θ) = (1.0, 1.0, 1.0)
- こうしたパラメータを設定すれば、x1, x2の両方が1の時だけ、重み月信号の総和が、与えられた閾値を上回る

### NAND (Not AND) ゲート

- NANDゲート: ANDの出力を逆にしたもの

### 図2-3 NANDゲートの真理値表 
| x1 | x2 | |: | y |
|---|:---:| |: |---:|
| 0 | 0 | |: | 1 |
| 1 | 0 | |: | 1 |
| 0 | 1 | |: | 1 |
| 1 | 1 | |: | 0 |

- NANDゲートを表現する場合の例
    - (w1, w2, θ) = (-0.5, -0.5, -0.7)
- ANDゲートを実現するパラメータの値に対して、それらの符号を全て反転するだけ

### ORゲート

- 入力信号の少なくとも1つが1であれば、出力が1になる

### 図2-4 ORゲートの真理値表 
| x1 | x2 | |: | y |
|---|:---:| |: |---:|
| 0 | 0 | |: | 0 |
| 1 | 0 | |: | 1 |
| 0 | 1 | |: | 1 |
| 1 | 1 | |: | 1 |

## ポイント

- 「学習」とは、適切なパラメータを決める作業
    　- 人が行う作業: パーセプトロンの構造(モデル)を考え、コンピュータに学習データを与えること
    - コンピュータが行う作業: パラメータの値を決める
- パーセプトロンの構造は、AND/NAND/ORゲートの全てで同じで、異なるのはパラメータ(重みと閾値)のみ

## パーセプトロンの実装

### ANDゲートの実装

In [1]:
def AND(x1, x2):
    w1, w2, theta = 0.5, 0.5, 0.7
    tmp= x1*w1 + x2*w2
    if tmp <= theta:
        return 0
    elif tmp > theta:
        return 1

In [2]:
AND(0, 0) # 0を出力

0

In [3]:
AND(1, 0) # 0を出力

0

In [4]:
AND(0, 1) # 0を出力

0

In [5]:
AND(1, 1) # 1を出力

1

### 重みとバイアスの導入

$$
    y =
        \begin{cases}
            0 \quad (b+w1x1+w2x2 \leqq 0) \\
            1 \quad (b+w1x1+w2x2 > 0) \\
        \end{cases}
$$

- b: bias, バイアス
    - 発火のしやすさ(出力信号が1を出力する度合い)を調整いするパラメータ
    - 「下駄履き」という意味があり、入力が何もない時(入力が0の時)、出力にどれだけ下駄を履かせるか(値を上乗せするか)を意味する
- w1, w2: weight, 重み
- 上述の数式において、パーセプトロンは、入力信号に重みが乗算された値とバイアスの和が計算する
    - その和が０を上回る　--> 1を出力
    - その和が０以下 --> 0を出力

In [6]:
import numpy as np

In [7]:
x = np.array([0, 1]) # 入力
w = np.array([0.5, 0.5]) # 重み
b = -0.7 # バイアス

In [8]:
w * x

array([0. , 0.5])

In [9]:
np.sum(w*x) # 各要素の総和

0.5

In [10]:
np.sum(w*x) + b # 浮動小数点による演算誤差のため、最後が6になっている

-0.19999999999999996

### 重みとバイアスによる実装

In [21]:
def AND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

### NANDゲートとORゲートの実装

In [22]:
def NAND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([-0.5, -0.5]) # 重みとバイアスだけがANDと違う！
    b = 0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

In [23]:
def OR(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5]) # 重みとバイアスだけがANDと違う！
    b = -0.2
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

## パーセプトロンの限界

### XORゲート (排他的論理和)

| x1 | x2 | |: | y |
|---|:---:| |: |---:|
| 0 | 0 | |: | 0 |
| 1 | 0 | |: | 1 |
| 0 | 1 | |: | 1 |
| 1 | 1 | |: | 0 |

- どちらかが1の時のみ1を出力

$$
    y =
        \begin{cases}
            0 \quad (-0.5+w1x1+w2x2 \leqq 0) \\
            1 \quad (-0.5+w1x1+w2x2 > 0) \\
        \end{cases}
$$

- パーセプトロンの限界は1本の直線で分けた**線形**の領域しか表現できないこと
    - 正確には、「単層のパーセプトロンではXORを表現できない」、または、「単層のパーセプトロンでは非線形領域は分類できない」
- XORゲートを表現するには、**非線形**な領域を作る必要がある

## 多層パーセプトロン (Multi-Layered Perceptron)

- パーセプトロンは、**層を重ねる**ことができ、そうすることで、XORを表現できるようになる

<pre>
x1-----(NAND)-----s1-----  
   \    /                                |  
     \/                                  -----(AND)---> y  
     / \                                 |    
    /    \                               |  
x2-----  (OR)  -----s2-----
</pre>

| x1 | x2 | |: | s1 | s2 | |: | y |
|---|:---:| |: | ---: | --: | |: |---:|
| 0 | 0 | |: | 1 | 0 | |: | 0 |
| 1 | 0 | |: | 1 | 1 | |: | 1 |
| 0 | 1 | |: | 1 | 1 | |: | 1 |
| 1 | 1 | |: | 0 | 1 | |: | 0 |

### XORゲートの実装

In [24]:
def XOR(x1, x2):
    s1 = NAND(x1, x2)
    s2 = OR(x1, x2)
    y = AND(s1, s2)
    return y

In [25]:
XOR(0, 0) # 0を出力

0

In [26]:
XOR(1, 0) # 1を出力

1

In [27]:
XOR(0, 1) # 1を出力

1

In [28]:
XOR(1, 1) # 0を出力

0

### 図2-13 XORのパーセプトロンによる表記

<pre>
第0層　　　　　　第1層              第2層
[x1] ----- [s1] -----
        \   /                 |
         \/                   -----> [y]  
         / \                  |  
        /    \                |  
[x2] ----- [s2] -----  
</pre>

- パーセプトロンは合計で3層から構成されているが、重みを持つ層は実質2層(第0層と第1層の間、第1層と第2層の間)だから「2層のパーセプトロン」と呼ぶ
    - 重みを持つ層の組み合わせ(第0層と第1層の間、第1層と第2層の間)をDenseと呼ぶ
- 文献により、3層のパーセプトロンとも呼ばれる
- 信号の送受信の流れは以下の通り
    1. 第0層の2つのニューロンが入力信号を受け取り、第1層のニューロンへ信号を送る
    2. 第1層のニューロンが第2層のニューロンへ信号を送り、第2層のニューロンはyを出力する

## 発展学習

- 「コンピュータシステムの理論と実装---モダンなコンピュータの作り方」: NANDゲートの組み合わせだけからコンピュータが作れる(パーセプトロンの組み合わせだけで表現できる)ことを理解するために、「NANDからテトリスへ」を標語の元、実際にNANDからテトリスが動くコンピュータを作る本