# パーセプトロン(perceptron)

* パーセプトロンとは
    * 複数の信号を入力として受け取り、一つの「信号」を出力するためのアルゴリズム
        * ここでのパーセプトロンは正確には「人工ニューロン」や「単純パーセプトロン」と呼ばれる
    * ニューラルネットワークの起源となるアルゴリズム
    * ローゼンブラットというアメリカの研究者によって19571年に考案された
    * 信号
        * 電流や川のような流れをもつもののイメージ
        * 二値の値 (信号を「**流す(1)/流さない(0)**」)

## パーセプトロンの動作原理

<img src="img/2-1.png" alt="2入力のパーセプトロン" title="2入力のパーセプトロン" width="300" height="300" align="left" />  

<br clear="left">

$
y = 
\begin{eqnarray}
\left\{
\begin{array}{l}
0 & ( \omega_{1} x_{1} + \omega_{2} x_{2} \leqq \theta ) \\
1 & ( \omega_{1} x_{1} + \omega_{2} x_{2} > \theta ) 
\end{array}
\right.
\end{eqnarray}
$

* $ x_{1}, x_{2} $ は入力信号
* $ \omega_{1}, \omega_{2} $ は重み
* $ \theta $ は閾値

 
 * 図中の「○」はニューロン(もしくはノード)
     1. 入力信号は、ニューロンに送られる際にそれぞれに固有の重みが乗算される
         1. 重みが大きいほどその信号の重要性が高くなる
         1. 重みは電流で言うところの抵抗に相当 (ただし、パーセプトロンは**重みが大きいほど大きな信号が流れる**ので電流の抵抗とは逆)
     1. ニューロンでは送られてきた信号の総和が計算される
     1. 総和がある閾値(限界値)を超えた場合に1を出力する (ニューロンが発火すると表現することもある)


## 単純な論理回路

* ANDゲート
    * 2入力1出力のゲート
        * 2つの入力が1のときのみ1を出力
        * それ以外は0を出力する

| $ x_1 $ | $ x_2$ | y |
|:---:|:---:|:---:|
| 0 | 0 | 0 |
| 1 | 0 | 0 |
| 0 | 1 | 0 |
| 1 | 1 | 1 |
入力信号と出力信号の対応表(真理値表)

* ここで行うことは真理値表を満たすように $ \omega_{1} x_{1}, \omega_{1} x_{2}, \theta $ を決める
    * $ (\omega_{1}, \omega_{2}, \theta ) = (0.5, 0.5, 0.9) $
    * $ (\omega_{1}, \omega_{2}, \theta ) = (1, 1, 1) $
    * のように無限にパラメータを選ぶことができる

---

* NAND(not AND)ゲート

| $ x_1 $ | $ x_2$ | y |
|:---:|:---:|:---:|
| 0 | 0 | 1 |
| 1 | 0 | 1 |
| 0 | 1 | 1 |
| 1 | 1 | 0 |

* $ (\omega_{1}, \omega_{2}, \theta ) = (-0.5, -0.5, -0.9) $
* のように無限にパラメータを選ぶことができる
    * ANDゲートのパラメータの符号を反転するとNANDゲートを実現できる

---

* ORゲート

| $ x_1 $ | $ x_2$ | y |
|:---:|:---:|:---:|
| 0 | 0 | 0 |
| 1 | 0 | 1 |
| 0 | 1 | 1 |
| 1 | 1 | 1 |

* 入力信号が少なくとも一つが1であれば出力が1になる論理回路
* $ (\omega_{1}, \omega_{2}, \theta ) = (0.9, 0.9, 0.5) $
* のように無限にパラメータを選ぶことができる

---

* 今はパーセプトロンのパラメータを決めているのは人間
    * 真理値表という「学習データ」を見ながら人の手によってパラメータ値を考えている
    * 機械学習では、この**パラメータの値を決める作業をコンピュータに自動で行わせる。**
    * 学習とは
        * 適切なパラメータを決める作業
        * 人が行う仕事はパーセプトロンの構造(モデル)を考えてコンピュータに学習データを与えること
* **パーセプトロンの構造は、AND,NAND,ORゲートの全てで同じ**
    * 3つのゲートで異なるのはパラメータ(重みと閾値)の値だけ
    * 同じ構造のパーセプトロンでパラメータや閾値を適切に調整するだけでゲートが変わっている

## パーセプトロンの実装

In [2]:
def AND(x1, x2):
    w1, w2, theta = 0.5, 0.5, 0.9
    tmp = x1*w1 + x2*w2
    if tmp <= theta:
        return 0
    elif tmp > theta:
        return 1

print ('---AND---')
print (AND(0,0))
print (AND(1,0))
print (AND(0,1))
print (AND(1,1))

def NAND(x1, x2):
    w1, w2, theta = -0.5, -0.5, -0.9
    tmp = x1*w1 + x2*w2
    if tmp <= theta:
        return 0
    elif tmp > theta:
        return 1

print ('---NAND---')
print (NAND(0,0))
print (NAND(1,0))
print (NAND(0,1))
print (NAND(1,1))

def OR(x1, x2):
    w1, w2, theta = 0.9, 0.9, 0.5
    tmp = x1*w1 + x2*w2
    if tmp <= theta:
        return 0
    elif tmp > theta:
        return 1

print ('---OR---')
print (OR(0,0))
print (OR(1,0))
print (OR(0,1))
print (OR(1,1))


---AND---
0
0
0
1
---NAND---
1
1
1
0
---OR---
0
1
1
1


## 重みとバイアスの導入

パーセプトロンの別の実装

$
y = 
\begin{eqnarray}
\left\{
\begin{array}{l}
0 & ( b + \omega_{1} x_{1} + \omega_{2} x_{2} \leqq 0 ) \\
1 & ( b + \omega_{1} x_{1} + \omega_{2} x_{2} > 0 ) 
\end{array}
\right.
\end{eqnarray}
$

* $ x_{1}, x_{2} $ は入力信号
* $ \omega_{1}, \omega_{2} $ は重み
* $ b $ はバイアス
    * 文脈によっては $ b $ も重みと呼ばれることもある

---

* 最初の実装の $ \theta $ を $ b $ とし、左辺に移動しただけ
    * バイアスは重みとは別の働きをする
        * 重みは入力信号の重要度をコントロールする
        * バイアスは**発火のしやすさ(出力信号が1を出力する度合い)**を調整する
        * バイアスには「ゲタはき」という意味があり、入力が何もないとき出力にどれだけゲタをはかせるか(上乗せするか)ということを意味する
* 入力信号に重みが乗算された値とバイアスの我が0を上回れば1を出力、そうでなければ0を出力

In [3]:
import numpy as np

x = np.array([0,1])
w = np.array([0.5, 0.5])
b = -0.7
print ("w*x = {0}".format(w*x))
print ("np.sum(w*x) = {0}".format(np.sum(w*x)))
print ("np.sum(w*x) + b = {0}".format(np.sum(w*x) + b))

### AND
def AND(x1,x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

print ('---AND---')
print (AND(0,0))
print (AND(1,0))
print (AND(0,1))
print (AND(1,1))

### NAND
def NAND(x1,x2):
    x = np.array([x1, x2])
    w = np.array([-0.5, -0.5])
    b = 0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

print ('---NAND---')
print (NAND(0,0))
print (NAND(1,0))
print (NAND(0,1))
print (NAND(1,1))


### OR
def OR(x1,x2):
    x = np.array([x1, x2])
    w = np.array([0.9, 0.9])
    b = -0.5
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

print ('---OR---')
print (OR(0,0))
print (OR(1,0))
print (OR(0,1))
print (OR(1,1))


w*x = [ 0.   0.5]
np.sum(w*x) = 0.5
np.sum(w*x) + b = -0.19999999999999996
---AND---
0
0
0
1
---NAND---
1
1
1
0
---OR---
0
1
1
1


## パーセプトロンの限界

### XORゲート

* XORゲート(排他的論理和)
    * $x_1, x_2$ どちらか片方が1のときだけ出力が1になる

| $ x_1 $ | $ x_2$ | y |
|:---:|:---:|:---:|
| 0 | 0 | 0 |
| 1 | 0 | 1 |
| 0 | 1 | 1 |
| 1 | 1 | 0 |

* 一本の直線で0と1の状態を分けることができないため、これまでの式ではXORゲートの実装は不可能
    * パーセプトロンは**1本の直線で分けた領域(線形な領域)だけしか表現できない**
        * 曲線による領域(非線形な領域)では表現できる
        * もしくは、「層を重ねる」事で表現できる
            * パーセプトロンの限界を正確に言うと、「単層のパーセプトロンではXORゲートを表現できない」
            * もしくは、「単層のパーセプトロンでは非線形領域は分離できない」

### 多層パーセプトロン

<img src="img/2-11.png" alt="組み合わせでXORゲートを実現" title="組み合わせでXORゲートを実現" />

* NANDの出力は $ s_1 $
* ORの出力は $ s_2 $
* 一番右はAND

| $ x_1 $ | $ x_2$ | $ s_1 $ | $ s_2$ | y |
|:---:|:---:|:---:|:---:|:---:|
| 0 | 0 | 1 | 0 | 0 |
| 1 | 0 | 1 | 1 | 1 |
| 0 | 1 | 1 | 1 | 1 |
| 1 | 1 | 0 | 1 | 0 |

In [4]:
import numpy as np

### AND
def AND(x1,x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

### NAND
def NAND(x1,x2):
    x = np.array([x1, x2])
    w = np.array([-0.5, -0.5])
    b = 0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

### OR
def OR(x1,x2):
    x = np.array([x1, x2])
    w = np.array([0.9, 0.9])
    b = -0.5
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

### XOR
def XOR(x1, x2):
    s1 = NAND(x1, x2)
    s2 = OR(x1, x2)
    y = AND(s1, s2)
    return y

print ('---XOR---')
print (XOR(0,0))
print (XOR(1,0))
print (XOR(0,1))
print (XOR(1,1))

---XOR---
0
1
1
0


<img src="img/2-13.png" alt="XORのパーセプトロンによる表記" title="XORのパーセプトロンによる表記" />

* XORは上図のような多層構造のネットワーク
    * 一番左の段 : 第0層
    * その右の段 : 第1層
    * 一番右の段 : 第2層
* XORは**多層パーセプトロン (multi-layered perceptron)**
    * ANDやORは単層パーセプトロン
* ここでXORは「2層のパーセプトロン」と呼ぶことにする
    * 実質重みの持つ層は2つのため
        文献によっては層の数をそのまま数えて「2層のパーセプトロン」と呼ぶ場合もある
* 2層のパーセプトロンの動作
    1. 第0層の2つのニューロンが入力信号を受け取り、第1層のニューロンへ信号を送る
    2. 第1層のニューロンが第2層のニューロンへ信号を送り、第2層目のニューロンは $ y $ を出力する

---

* パーセプトロンは層を重ねることでより柔軟な表現が可能になる
   * NANDゲートの組み合わせだけでコンピュータの行う処理を再現することができる
       * パーセプトロンでもコンピュータを表現できる
           * パーセプトロンの組み合わせは、幾層にも重なった単一のパーセプトロンとして表現できる
   * 理論上は2層のパーセプトロンであればコンピュータを作れる
       * 活性化関数に非線形なシグモイド関数を用いた２層のパーセプトロン
       * ただ、実際に2層のパーセプトロンでコンピュータを作るのはかなり大変
           * コンピュータの表現も、層が幾重にも重なった構造として作られるのが自然
           * AND やORゲート -> 半加算器、全加算器 -> 算術論理演算装置(ALU) -> CPU
               * 必要なモジュールを段階的に作り上げていくのが自然