# 二章　パーセプトロン

パーセプトロン†1は、複数の信号を入力として受け取り、ひとつの信号を出力しま
す。ここで言う「信号」とは、電流や川のような「流れ」をもつものをイメージする
とよいでしょう。電流が導線を流れ、電子を先に送り出すように、パーセプトロンの
信号も流れを作り、情報を先へと伝達していきます。ただし、実際の電流とは違い、
パーセプトロンの信号は「流す／流さない（1 か 0）」の二値の値です。本書では、0
を「信号を流さない」、1 を「信号を流す」に対応させて記述します。<br>
y =
{
0 (w1x1 + w2x2 ≦ θ)
1 (w1x1 + w2x2 > θ)<br>
パーセプトロンは、複数ある入力信号のそれぞれに固有の重みを持ちます。そし
て、その重みは、各信号の重要性をコントロールする要素として働きます。つまり、
重みが大きければ大きいほど、その重みに対応する信号の重要性が高くなるのです。<br>
重みは、電流で言うところの「抵抗」に相当します。抵抗は電流の流れにくさを
決めるパラメータであり、抵抗が低ければ低いほど大きな電流が流れます。一
方、パーセプトロンの重みは、その値が大きければ大きいほど、大きな信号が
流れることを意味します。抵抗も重みも信号の流れにくさ（流れやすさ）をコ
ントロールするという点では同じ働きをします。


ANDゲートとは、2 入力 1 出力のゲートです。<br>
NAND とは、Not AND を意味し、その振る舞いは、AND ゲートの出力を逆にしたものになります。<br>
OR ゲートは入力信号の少なくともひとつが 1 であれば、出力が 1 になる論理回路です。<br>

In [5]:
import numpy as np

In [1]:
# AND　gate implementation
def AND(x1, x2):
    w1, w2, theta = 0.5, 0.5, 0.7
    tmp = x1*w1 + x2*w2
    if tmp <= theta:
        return 0
    elif tmp > theta:
        return 1

In [4]:
print(AND(0,0))
print(AND(0,1))
print(AND(1,0))
print(AND(1,1))

0
0
0
1


In [6]:
# Implementation by weight and bias
def AND(x1, x2):
    x = np.array([x1, x2]) #入力
    w = np.array([0.5, 0.5]) #重み
    b = -0.7 #バイアス
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

ここで −θ をバイアス b と命名しましたが、バイアスは、重みの w1 や w2 とは別
の働きをすることに注意しましょう。具体的に言うと、w1 や w2 は入力信号への重
要度をコントロールするパラメータとして機能しますが、バイアスは発火のしやすさ
――出力信号が 1 を出力する度合い――を調整するパラメータとして機能します。た
とえば、b が −0.1 であれば、入力信号の重み付き和が 0.1 を上回るだけでニューロ
ンが発火します。しかし、もし b が −20.0 であれば、入力信号の重み付き和が 20.0
を上回らなければニューロンは発火しません。このように、バイアスの値によって、
ニューロンの発火のしやすさが決まります。なお、w1 や w2 は「重み」と呼び、b は
「バイアス」と区別して呼びますが、文脈によっては、b、w1、w2 のすべてのパラメー
タを指して「重み」と呼ぶこともあります。<br>
-バイアスという用語には、「ゲタはき」という意味があります。これは、入力が
何もないときに（入力が 0 のときに）、出力にどれだけゲタをはかせるか（値を
上乗せするか）ということを意味します。実際、式 (2.2) の b+w1x1 +w2x2
の計算では、入力の x1 と x2 が 0 の場合、バイアスの値だけが出力されます。

In [7]:
def NAND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([-0.5, -0.5])
    b = 0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

In [9]:
print(NAND(0,0))
print(NAND(1,0))
print(NAND(0,1))
print(NAND(1,1))

1
1
1
0


In [8]:
def OR(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.2
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

XOR ゲートは**排他的論理和**とも呼ばれる論理回路です。図2-5 に示すように、x1
と x2 のどちらかが 1 のときだけ出力が 1 になります（「排他的」とは自分以外は拒
否することを意味します）。さて、この XOR ゲートをパーセプトロンで実装するに
は、どのような重みパラメータを設定すればよいでしょうか？<br>
実は、これまで見てきたパーセプトロンでは、この XOR ゲートを実現することが
できません。なぜ AND や OR は実現できて、XOR は実現できないのでしょうか？

パーセプトロンの限界は、このように 1 本の直線で分けた領域だけしか表現できな
い点にあります。図2-8 のようなクネッとした曲線をパーセプトロンでは表現できな
いのです。ちなみに、図2-8 のような曲線による領域を非線形な領域と言い、直線に
よる領域を線形な領域と言います。線形・非線形という言葉は機械学習の分野でよく
耳にしますが、イメージとしては図2-6 や図2-8 のようなものを頭に浮かべることが
できます。

In [10]:
def XOR(x1, x2):
    s1 = NAND(x1, x2)
    s2 = OR(x1, x2)
    y = AND(s1, s2)
    return y

In [12]:
print(XOR(0, 0))
print(XOR(1, 0))
print(XOR(0, 1))
print(XOR(1, 1))

0
1
1
0


「NAND ゲートの組み合わせだけからコンピュータが作れる」と言うと、にわ
かに信じられないかもしれません。この点に興味のある方は『コンピュータシ
ステムの理論と実装――モダンなコンピュータの作り方』（オライリー・ジャパ
ン）という本をおすすめします。この本では、コンピュータを深く理解すること
をテーマに掲げ、「NAND からテトリスへ」という標語のもと、実際に NANDからテトリスが動くコンピュータを作ります。この本を読めば、NAND という
単純な素子だけから、コンピュータという複雑なシステムが作られることを実
感できるでしょう。

●パーセプトロンは入出力を備えたアルゴリズムである。ある入力を与えた
ら、決まった値が出力される。<br>
● パーセプトロンでは、「重み」と「バイアス」をパラメータとして設定する。<br>
● パーセプトロンを用いれば、AND や OR ゲートなどの論理回路を表現で
きる。<br>
● XOR ゲートは単層のパーセプトロンでは表現できない。<br>
● 2 層のパーセプトロンを用いれば、XOR ゲートを表現することができる。<br>
● 単層のパーセプトロンは線形領域だけしか表現できないのに対して、多層
のパーセプトロンは非線形領域を表現することができる。<br>
● 多層のパーセプトロンは、（理論上）コンピュータを表現できる。<br>