# 第二章　パーセプトロン

## Introduction

機械学習は様々な分野に応用されていますが、いずれの場合も入力に対して出力があります。例えば、
1. 画像認識では画像が入力で画像に対する判定(犬なのか猫なのかなど)が出力
2. CTR推定ではBidRequestが入力になりCTR推定値が出力

機械学習で行っていることは、この入力から出力を計算する"規則"を大量のデータから決定することです。
機械学習には様々な種類がありますが、違いはこの”規則”として何を使っているかという点だけです。ディープラーニングではニューラルネットワークと呼ばれるネットワーク構造を使います。

[ゼロから作るDeep Learning] ( 以下、テキストと呼ぶ)の第二章では入力から出力を計算する簡単なモデルであるパーセプトロンを使ってAND回路やOR回路を作る問題を考えます。

## 2.1 パーセプトロンとは

テキスト図2-1参照

２つの入力$x_1, x_2$とパラメータ$w_1, w_2, \theta$から一つの出力$y$を計算する2入力パーセプトロンを定義します。

In [10]:
def two_perceptron(w1, w2, theta):
    def __func__(x1, x2):
        if(x1*w1+x2*w2<=theta):
            return 0
        else:
            return 1
    return __func__

## 2.2　単純な論理回路

In [57]:
import itertools
def print_result(w1, w2, theta):
    p = two_perceptron(w1, w2, theta)
    print("x1, x2, y")
    for (x1, x2) in itertools.product([0, 1], [0, 1]):
        print("{},   {},   {}".format(x1, x2, p(x1, x2)))        

### ANDゲート

パラメータを適切に設定するとANDゲートを再現できます。方法は一つではなく無限個あります。

In [61]:
w1 = 1
w2 = 1
theta = 1
print_result(w1, w2, theta)

x1, x2, y
0,   0,   0
0,   1,   0
1,   0,   0
1,   1,   1


### ORゲート

In [32]:
w1 = 1
w2 = 1
theta = 0
print_result(w1, w2, theta)

x1, x2, y
0,   0,   0
0,   1,   1
1,   0,   1
1,   1,   1


# 2.3.3 重みとバイアスによる実装

後の拡張に備えてしきい値$\theta$に代わりバイアス$b$を用います。ベクトルを使ってパーセプトロンを再実装します。

In [117]:
def two_perceptron_bias(w1, w2, b):
    def __func__(x1, x2):
        xs = np.array([x1, x2])
        ws = np.array([w1, w2])
        if(np.sum(xs*ws)+b<=0):
            return 0
        else:
            return 1
    return __func__

def print_result_bias(p):
    print("x1, x2, y")
    for (x1, x2) in itertools.product([0, 1], [0, 1]):
        print("{},   {},   {}".format(x1, x2, p(x1, x2)))        

ANDやORの計算は先と同様に可能です。

In [142]:
AND = two_perceptron_bias(1, 1, -1)
print_result_bias(AND)
OR = two_perceptron_bias(1, 1, 0)
print_result_bias(OR)
NAND = two_perceptron_bias(-1, -1, 2)
print_result_bias(NAND)

x1, x2, y
0,   0,   0
0,   1,   0
1,   0,   0
1,   1,   1
x1, x2, y
0,   0,   0
0,   1,   1
1,   0,   1
1,   1,   1
x1, x2, y
0,   0,   1
0,   1,   1
1,   0,   1
1,   1,   0


ここで、パーセプトロンの動作を図示してみます。一般に$w_1x_1+w_2x_2+b=0$は($x_1, x_2$)平面の上で直線を表現します。なので、パーセプトロンの二値は直線で分断された領域をそれぞれ表現しています。

下の図は、テキストの図2.6に対応する図でORに対するパーセプトロンの可視化をしている。

In [110]:
def f(w1, w2, b):
    xmin = -1
    xmax =  2
    
    x1s = np.linspace(xmin, xmax)
    x2s = (-w1*x1s-b)/w2
    plt.plot(x1s, x2s, "k", lw=2)
    plt.fill_between(x1s, x2s, np.linspace(xmin-1, xmin-1), color="pink")
    plt.plot([-1, 3], [0, 0], "k--")
    plt.plot([0, 0], [-1, 3], "k--")
    
    plt.plot([0], [0], "ro")
    plt.plot([0], [1], "b^")
    plt.plot([1], [0], "b^")
    plt.plot([1], [1], "b^")    
    
    plt.xlim(xmin, xmax)
    plt.ylim(xmin, xmax)
    plt.xlabel("$x_1$")
    plt.ylabel("$x_2$")

interact(f, w1=(0.25, 2, 0.25), w2=(0.25, +2, 0.25), b=(-2, 2, 0.5))

interactive(children=(FloatSlider(value=1.0, description='w1', max=2.0, min=0.25, step=0.25), FloatSlider(valu…

<function __main__.f(w1, w2, b)>

青は1を赤は0を表現している。

ORの点の分布の形から、適切にパラメータを設定すれば、単一の直線で0(赤)と1(青)を分割できる。これが、OR回路をパーセプトロンで表現できる要因です。

AND回路は？

次にXOR回路をパーセプトロンで表現することを考える。先と同様に、$(x_1, x_2)$平面で考える。

In [111]:
def f(w1, w2, b):
    xmin = -1
    xmax =  2
    
    x1s = np.linspace(xmin, xmax)
    x2s = (-w1*x1s-b)/w2
    plt.plot(x1s, x2s, "k", lw=2)
    plt.fill_between(x1s, x2s, np.linspace(xmin-1, xmin-1), color="pink")
    plt.plot([-1, 3], [0, 0], "k--")
    plt.plot([0, 0], [-1, 3], "k--")
    
    plt.plot([0], [0], "ro")
    plt.plot([0], [1], "b^")
    plt.plot([1], [0], "b^")
    plt.plot([1], [1], "ro")    
    
    plt.xlim(xmin, xmax)
    plt.ylim(xmin, xmax)
    plt.xlabel("$x_1$")
    plt.ylabel("$x_2$")

interact(f, w1=(0.25, 2, 0.25), w2=(0.25, +2, 0.25), b=(-2, 2, 0.5))

interactive(children=(FloatSlider(value=1.0, description='w1', max=2.0, min=0.25, step=0.25), FloatSlider(valu…

<function __main__.f(w1, w2, b)>

どような直線を用いても、XORの0と1を分割することはできない。

## 2.5.2 XORゲートの実装

デジタル回路ではよく知られているように、ANDとORを組み合わせてXORを表現できる。

In [143]:
AND = two_perceptron_bias(1, 1, -1)
OR = two_perceptron_bias(1, 1, 0)
def XOR(x1, x2):
    s1 = NAND(x1, x2)
    s2 = OR(x1, x2)
    y = AND(s1, s2)
    return y
print_result_bias(XOR)

x1, x2, y
0,   0,   0
0,   1,   1
1,   0,   1
1,   1,   0


これは、複数のゲートを組み合わせているので最初の一層のパーセプトロンに対して多層パーセプトロンと呼ばれる。