# 2章 パーセプトロン

> パーセプトロンはニューラルネットワークの起源となるアルゴリズム

これがモチベ．

## 2.1. パーセプトロンとは

パーセプトロンってのは結局， (2.1) , (2.2) に表されているようなモデル．  
パラメータは $\boldsymbol{w}, \theta$ の $p+1$ 個．  
PRML 的な分類では識別関数．生成モデルや識別モデルではなく．  

ANDゲートとかの実装では人力でパラメータ決定してるが，p25 にも

> 機械学習の問題では，このパラメータの値を決める作業をコンピュータに自動で行わせます

とあるし．

## 2.3. パーセプトロンの実装

In [8]:
import numpy as np

In [3]:
class LogicGate:
    def __init__(self, w1, w2, theta):
        self.w1 = w1
        self.w2 = w2
        self.theta = theta
    def predict(self, x1, x2):
        tmp = self.w1*x1 + self.w2*x2
        if tmp > self.theta:
            return 1
        else:
            return 0

In [7]:
and_gate = Logic(w1=0.5, w2=0.5, theta=0.7)
and_gate.predict(1, 1)

1

In [15]:
class LogicGate2:
    def __init__(self, w1, w2, b):
        self.w = np.array([w1, w2])
        self.b = b
    def predict(self, x1, x2):
        tmp = self.b + np.dot(self.w, np.array([x1, x2]))
        if tmp > 0:
            return 1
        else:
            return 0

In [32]:
and_gate = LogicGate2(w1=0.5, w2=0.5, b=-0.7)
and_gate.predict(1, 1)

1

In [33]:
nand_gate = LogicGate2(w1=-0.5, w2=-0.5, b=0.7)
nand_gate.predict(1,1)

0

In [34]:
or_gate = LogicGate2(w1=0.5, w2=0.5, b=-0.2)
or_gate.predict(1,1)

1

## 2.4. (単層の)パーセプトロンの限界

統計では例えば SVM で説明されるような「直線(超平面)による分離の限界」を，論理ゲートから説明してたのか．斬新だな．  
線形分離(単層のパーセプトロンによる分離)不可能なデータ(分類タスク)の具体例として，XORゲートが挙げられるのか．面白い．
- SVM
  - 線形分離不可能なデータもあるよね．
  - あえて高次元に写像しよう．カーネルトリックを使おう．
- NN
  - パーセプトロンによる線形分離が不可能なデータもあるよね．
  - 層を重ねよう．   

## 2.5. 多層パーセプトロン

In [47]:
class XOR:
    def __init__(self):
        self.nand_gate = LogicGate2(w1=-0.5, w2=-0.5, b=0.7)
        self.or_gate = LogicGate2(w1=0.5, w2=0.5, b=-0.2)
        self.and_gate = LogicGate2(w1=0.5, w2=0.5, b=-0.7)
    def predict(self, x1, x2):
        s1 = self.nand_gate.predict(x1, x2)
        s2 = self.or_gate.predict(x1, x2)
        y = self.and_gate.predict(s1, s2)
        return y

In [48]:
xor_gate = XOR()
xor_gate.predict(1,1)

0

層を重ねることで...  
図2-7のような XOR 分類ができた  
＝ モデルの表現力が増し非線型な分離もできるようになった


> 図2-13のパーセプトロンは合計で３層から構成されますが， ... 「２層のパーセプトロン」と呼ぶことにします．

この辺ややこしいので，しっかり覚えとこう．  

入力層を第 0 層とみなして出力層が第 $n$ 層にあたるとき， $n$ 層パーセプトロンと呼ぶ．  
$n=1$ なら単層パーセプトロンで， $n>1$ なら多層パーセプトロン．  
気持ちとしては，何層に対して変換が行われているか，という感じ．  

だったら特徴量の部分を層と呼ぶのではなく，施す変換の部分を層と呼べよ．と思うが．  
後の3.1節の図3-1のところでもっとちゃんとした定義的な説明あるよ，まあ俺の理解で大丈夫そう．

## 2.7. まとめ

> 本章で学んだこと

これに綺麗にまとまっている．分かりやすい．

# 実装の感想

集中講義でやった PyTorch コーディング (unitインスタンスを組み合わせてどうこう) を意識してオプジェクト指向で実装したが，なんか筋が悪そう．  
テキストにあるような関数型パラダイムでの実装は分かりやすいし，アドバンテージ感じない．  
ちょっと PyTorch の講義コード見直して，設計を考え直すべきかも．

----