### 2.1 パーセプトロンとは


パーセプトロンとは,複数の信号を入力として受け取り,ひとつの信号を出力とします.
電流が導線を流れ,電子を先に送り出すように,パーセプトロンの信号も流れを作り,情報を先へと伝達していきます.
ただし,実施の電流とは違い,パーセプトロンの信号は「流す/流さない(1か0)」の二値の値です.


$x_1, x_2$ は入力信号,
$y_1, y_2$ は出力信号,
$w_1, w_2$ は重みを表します.
図の○は「ニューロン」や「ノード」と呼ばれます.  
入力信号は,ニューロンに送られる際に,それぞれに固有の重みが乗算されます.  
ニューロンでは送られてきた信号の総和が計算され,その総和がある限界値を超えた場合にのみ1を出力します.  
ここでは,その **限界値** を$\theta$ という記号で表すことにします.  
パーセプトロンの動作原理はこれだけです.  
以上のことを数式で表すと次の式のようになります.  

![perceptron](perceptron.png)
図2-1

$$
    \mathrm{y} =
        \begin{cases}
            0 \quad ( w_1 x_1 + w_2 x_2 \leqq \theta ) \\
            1 \quad ( w_1 x_1 + w_2 x_2 > \theta ) \\
        \end{cases}
    \tag{2.1}
$$

パーセプトロンは,複数ある入力信号のそれぞれに固有の重みを持ちます.
そして,その重みは,各信号の重要性をコントロールする要素として働きます.
つまり,重みが大きいほど,その重みに対応する信号の重要性が高くなります.

### 2.2 単純な論理回路

### 2.2.1 ANDゲート

| $x_1$ | $x_2$ | y |
|:---:|:---:|:---:|
|  0  |  0  |  0  |
|  1  |  0  |  0  |
|  0  |  1  |  0  |
|  1  |  1  |  1  |


### 2.2.2 NANDゲートとORゲート

### NANDゲート

| $x_1$ | $x_2$ | y |
|:---:|:---:|:---:|
|  0  |  0  |  1  |
|  1  |  0  |  1  |
|  0  |  1  |  1  |
|  1  |  1  |  0  |

### ORゲート

| $x_1$ | $x_2$ | y |
|:---:|:---:|:---:|
|  0  |  0  |  0  |
|  1  |  0  |  1  |
|  0  |  1  |  1  |
|  1  |  1  |  1  |


### 2.3 パーセプトロンの実装
### 2.3.1 簡単な実装

先の論理回路をPythonで実装する.
ここでは引数をとしてx1 と x2を受け取るANDという関数を定義する.

In [3]:
def AND(x1, x2):
    w1, w2, theta = 0.5, 0.5, 0.7
    tmp = x1*w1 + x2*w2
    if tmp <= theta:
        return 0
    elif tmp > theta:
        return 1

パラメータのw1, w2, thetaは関数内で初期化し,重み付きの入力の総和が閾値を超えると1を返し,それ以外は0を返します.

In [4]:
AND(0, 0) # 0を出力

0

In [5]:
AND(1, 0) # 0を出力

0

In [6]:
AND(0, 1) # 0を出力

0

In [7]:
AND(1, 1) # 0を出力

1

### 2.3.2 重みとバイアスの導入

先のANDゲートの実装は素直で分かりやすいのですが,これ以降のことを考えて、別の実装方式へと修正したいと思います.
それに先立ち式(2.1)の$\theta$を$-b$として,パーセプトロンの動作を次の式(2.2)で表します.

$$
    \mathrm{y} =
        \begin{cases}
            0 \quad ( b + w_1 x_1 + w_2 x_2 \leqq 0 ) \\
            1 \quad ( b + w_1 x_1 + w_2 x_2 > 0 ) \\
        \end{cases}
    \tag{2.2}
$$

式$(2.1)$と式$(2.2)$は記号の表記を変えただけで,まったく同じことを表しています.  
ここで,$b$を**バイアス**と呼び,$w_1$や$w_2$を**重み**と呼びます.  
式$(2.2)$で表せるように,パーセプトロンでは,入力信号に重みが乗算された値をバイアスの和が計算され,その値が0を上回れば1を出力し,そうでなければ0を出力します.  
それでは,NumPyを使って式$(2.2)$の方式で実装してみましょう.  

In [9]:
import numpy as np
x = np.array([0, 1]) # 入力
w = np.array([0.5, 0.5]) # 重み
b  = -0.7 # バイアス

In [10]:
w*x

array([0. , 0.5])

In [11]:
np.sum(w*x)

0.5

In [12]:
np.sum(w*x) + b

-0.19999999999999996

この例で示すように,NumPyt配列の乗算では,2つの配列の要素数が同じ場合,その要素どうしが乗算されます.  
そのため, $w*x$の計算では,各要素の乗算が計算されることになります.  
([0, 1] * [0.5, 0.5] => [0, 0.5])  
また, np.sum(w*x)では各要素の総和が計算されます.  
この重み付き和にバイアスを加算すれば,式$(2.2$)の計算は終了です.  

### 2.3.3 重みとバイアスによる実装

「重みとバイアスによる方式」を用いれば, ANDゲートは次のように実装することができます.  

In [None]:
def AND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

ここで$-\theta$をバイアス$b$と命名しましたが, バイアスは, 重みの$w_1$や$w_2$とは別の働きをすることに注意しましょう.  
具体的に言うと, $w_1$や$w_2$は入力信号への重要度をコントロールするパラメータとして機能しますが, バイアスは発火のしやすさ  
--- 出力信号が1を出力する度合い ---  
を調整するパラメータとして機能します.  
たとえば, $b$が$-0.1$であれば, 入力信号の重み付き和が $0.1$ を右腕割るだけでニューロンが発火します.  
しかし, もし$b$が$-20.0$であれば, 入力信号の重み付き和が $20.0$ を上回らなければニューロンが発火しません.  
このように, バイアスの値によって, ニューロンの発火のしやすさが決まります. 
なお, $w_1$ や $w_2$ は「重み」と呼び, $b$ は「バイアス」と区別して呼びますが, 文脈によっては, $b, w_1, w_2$ のすべてのパラメータを指して「重み」と呼ぶことがあります.  

NANDゲートとORゲートを実装すると以下の通りとなります.  

In [13]:
def NAND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, -0.5]) # 重みとバイアスだけがANDと違う!
    b = 0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

In [14]:
def OR(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5]) # 重みとバイアスだけがANDと違う!
    b = -0.2
    tmp = np.sum(w+x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

AND, NAND, ORは同じ構造のパーセプトロンであり, 違いは重みのパラメータの値だけでした.  
NANDとORゲートの実装においても, ANDと異なる箇所は重みとバイアスの値を設定する箇所だけになります.  

### 2.4 パーセプトロンの限界

### 2.4.1 XORゲート

XORゲートは**排他的論理和**とも呼ばれる論理回路です.  
$x_1$と$x_2$のどちらかが1のとだけ出力が1になります.  (「排他的」とは自分以外は拒否することを意味します.)  
このXORゲートをパーセプトロンで実装するには, どのような重みパラメータを設定すればよいでしょうか?  

### XORゲート

| $x_1$ | $x_2$ | y |
|:---:|:---:|:---:|
|  0  |  0  |  0  |
|  1  |  0  |  1  |
|  0  |  1  |  1  |
|  1  |  1  |  0  |


実は,これまで見てきたパーセプトロンでは, このXORゲートを実現できません.
それを説明するためにここでは図を描いて視覚的に考えてみたいと思います.  
まずORゲートの挙動を視覚的に考えてみます.  
ORゲートは例えば, 重みパラメータが$(b, w_1, w_2) = (-0.5, 1.0, 1.0)$のとき,ORゲートの真理値表を満たします.  
このときパーセプトロンは次の式(2.3)で表現されます.  


$$
    \mathrm{y} =
        \begin{cases}
            0 \quad ( -0.5 + x_1 + x_2 \leqq 0 ) \\
            1 \quad ( -0.5 + x_1 + x_2 > 0 ) \\
        \end{cases}
    \tag{2.3}
$$

式(2.3)で表されるパーセプトロンは, $-0.5 + x_1 + x_2 = 0$の直線で分断された2つの領域を作ります.  
直線で分けられた, 片方の領域を1を出力し, もう片方は0を出力します.  

![perceptron_kasika](perceptron_kasika.png)
図2-6

ORゲートは$(x_1, x_2) = (0, 0$のとき0を出力し, $(0, 1), (1, 0), (1, 1)$のとき1を出力します.  
図では0を○, 1を△であらわしています.  
ORゲートを作ろうと思えば, 図の○と△を直線によって分ける必要があります.  
実際, 先の直線は, 4つの点を正しく分けることができています.  
それでは, XORゲートの場合はどうでしょうか.  
ORゲートのときのように, 1本の直線でわけることができｓるでしょうか?
図2-7の○と△を直線によってわけることは,いくら考えてもできないでしょう.  
実は1本の直線では, ○と△を分けることができないのです.  

![xor_gate](xor_gate.png)
図2-7

### 2.4.2 線形と非線形

図2-7の○と△は, 1本の直線ではわけることができません.  
しかし, もし"直線"という制約を外すことができたら, ○と△を分けることができます.  
たとえば, 図2-8のように○と△を分ける領域を作ることができます.  
パーセプトロンの限界は, このように1本の直線で分けた領域だけした表現できない点にあります.  
図2-8のようなクネッとした曲線をパーセプトロンでは表現できないのです.  
ちなみに, 図2-8のような曲線による領域を**非線形**な領域と言い,直線による領域を**線形**な領域と言います.  
線形・非線形という言葉は機械学習の分野でよく耳にしますが, イメージとしては図2-6や図2-8のようなものを頭に浮かべることができます.  

![perseptron_hisenkei](perseptron_hisenkei.png)
図2-8

### 2.5 多層パーセプトロン

残念ながらパーセプトロンはXORゲートを表現できませんでした.  
しかし, "層を重ねる"ことでXORゲートを表現できるようになります.  

### 2.5.1 既存ゲートの組み合わせ

In [None]:
XORゲートを作るにはいくつか方法があります.  
ひとつの方法は, これまで作ってきたAND, NAND, ORゲートを組み合わせて配線することです.  
ここではAND, NAND, ORゲートを図2-9の記号で表記します.  
