<a href="https://colab.research.google.com/github/SojiroNishimura/deeplearning-from-scratch/blob/master/chapter2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# パーセプトロン
* パーセプトロンは複数の信号を入力として受け取り、ひとつの信号を出力する
* パーセプトロンの出力は「信号を流す/流さない」の2通りであり、通常「1 or 0」である
* パーセプトロンで入力を受け取る部分は **「ニューロン」** または **「ノード」** と呼ばれ、各信号ごとに **重み** を掛けて足し合わせたものを入力とする
* 全入力信号の総和が一定の値(**閾値**)を超えている場合、出力が1になる。これは **ニューロンの発火** と表現される。ここでは閾値を$\theta$で表す
  
入力信号が2つのパーセプトロンを数式で表すと以下のようになる。  

\

$
\begin{eqnarray}
y = \left\{
  \begin{array}{ll}
    0 \ (w_1x_1 + w_2x_2 \le \theta)\\
    1 \ (w_1x_1 + w_2x_2 \gt \theta)
  \end{array} \right.
\end{eqnarray}
$

\
  
パーセプトロンは複数の入力信号ごとに独自の重みを持つ。それぞれの重みは **各信号の重要度をコントロールする要素** として働く。重みが大きくなるほど、その重みに対応する入力信号の出力への寄与度が大きくなる。

## 単純な論理回路
単純な論理回路を使ってパーセプトロンを実装する。

### ANDゲート
|$x_1$|$x_2$|y|
|:---:|:---:|:---:|
|0|0|0|
|1|0|0|
|0|1|0|
|1|1|1|

### NANDゲート
|$x_1$|$x_2$|y|
|:---:|:---:|:---:|
|0|0|1|
|1|0|1|
|0|1|1|
|1|1|0|

### ORゲート
|$x_1$|$x_2$|y|
|:---:|:---:|:---:|
|0|0|0|
|1|0|1|
|0|1|1|
|1|1|1|

以下でパーセプトロンを用いて各論理ゲートを実装する。

## パーセプトロンの実装
### 簡単な実装

In [0]:
def AND(x1, x2):
  W1, W2, theta = 0.5, 0.5, 0.7
  tmp = x1*W1 + x2*W2
  
  if tmp <= theta:
    return 0
  elif tmp > theta:
    return 1

In [2]:
print(AND(0, 0))
print(AND(1, 0))
print(AND(0, 1))
print(AND(1, 1))

0
0
0
1


### 重みとバイアスの導入
上記の式にバイアスを導入する。バイアスはパーセプトロンの式を変形させ、以下のように表す。

\

$
\begin{eqnarray}
y = \left\{
  \begin{array}{ll}
    0 \ (b + w_1x_1 + w_2x_2 \le 0)\\
    1 \ (b + w_1x_1 + w_2x_2 \gt 0)
  \end{array} \right.
\end{eqnarray}
$

\

上記はパーセプトロンの$\theta$を移行しただけである。ここで$b$をバイアスと呼び、$w_1, w_2$を重みと呼ぶ。重みは「各入力信号の重要度」を表す値であったが、バイアスは  **ニューロンの発火しやすさ** を表す値である。


In [0]:
# 改良版AND
import numpy as np

def AND(x1, x2):
  x = np.array([x1, x2])
  w = np.array([0.5, 0.5])
  b = -0.7
  tmp = np.sum(w*x) + b
  
  if tmp <= 0:
    return 0
  else:
    return 1

In [0]:
def NAND(x1, x2):
  x = np.array([x1, x2])
  w = np.array([-0.5, -0.5]) # 重みとバイアスだけがANDと異なる
  b = 0.7
  tmp = np.sum(w*x) + b
  
  if tmp <= 0:
    return 0
  else:
    return 1
  
def OR(x1, x2):
  x = np.array([x1, x2])
  w = np.array([0.5, 0.5])
  b = -0.2
  tmp = np.sum(w*x) + b
  
  if tmp <= 0:
    return 0
  else:
    return 1

## パーセプトロンの限界
### XORゲート
|$x_1$|$x_2$|y|
|:---:|:---:|:---:|
|0|0|0|
|1|0|1|
|0|1|1|
|1|1|0|

\

XORの出力は線形分離不可能なため、1層の単純なパーセプトロンでは出力できない。しかし既存の複数の層を重ねることによって、線形分離不可能な問題に対応することができる。これを **多層パーセプトロン** という。

## 多層パーセプトロン
### 既存ゲートの組み合わせ
XORゲートは以下の真理値表の組み合わせで実現できる。ここで$s_1$はNAND、$s_2$はOR、$y$はANDゲートを意味する。

|$x_1$|$x_2$|$s_1$|$s_2$|y|
|:---:|:---:|:---:|:---:|:---:|
|0|0|1|0|0|
|1|0|1|1|1|
|0|1|1|1|1|
|1|1|0|1|0|

\

これまでに定義したAND、NAND、ORゲートを組み合わせて上記のXORゲートを実装することができる。

In [0]:
def XOR(x1, x2):
  s1 = NAND(x1, x2)
  s2 = OR(x1, x2)
  y = AND(s1, s2)
  return y

In [6]:
print(XOR(0, 0))
print(XOR(1, 0))
print(XOR(0, 1))
print(XOR(1, 1))

0
1
1
0
