04 単純なレイヤの実装
=================

* この節では、「リンゴの買い物」の例を、実装していく

* 計算グラフのノードを「乗算レイヤ(`MulLayer`)」、加算ノードを「加算レイヤ(`AddLayer`)」という名前で実装する

## 1. 乗算レイヤの実装

* レイヤは、`forward()`と`backward()`という共通のメソッド(インターフェース)を持つように実装する

    * `forward()`は順伝播、`backward()`は逆伝播に対応する
    
* ここで、乗算レイヤを実装する

    * このレイヤは、`MulLayer`という名前のクラスとして、次のように実装することができる

In [1]:
class MulLayer:
    def __init__(self):
        self.x = None
        self.y = None

    def forward(self, x, y):
        self.x = x
        self.y = y                
        out = x * y

        return out

    def backward(self, dout):
        # xとyをひっくり返す
        dx = dout * self.y
        dy = dout * self.x

        return dx, dy

* `__init__()`：インスタンス変数である`x`と`y`の初期化を行う

    * また、順伝播時の入力値を保持するために用いる
    
* `forward()`：`x`と`y`の2つの引数を受け取り、それらを乗算して出力する

* `backwork()`：上流から伝わってきた微分(`dout`)に対して、順伝播の"ひっくり返した値"を乗算して下流に流す

* `MulLayer`を使ってこれまで見てきた「リンゴの買い物」を実装してみる

    * この乗算レイヤを使えば、`順伝播`は次のように実装できる

In [2]:
apple = 100
apple_num = 2
tax = 1.1

mul_apple_layer = MulLayer()
mul_tax_layer = MulLayer()

# forward
apple_price = mul_apple_layer.forward(apple, apple_num)
price = mul_tax_layer.forward(apple_price, tax)

print(price)

220.00000000000003


* また、各変数に対する微分は、`backward()`で求めることができる

In [3]:
# backward
dprice = 1
dapple_price, dtax = mul_tax_layer.backward(dprice)
dapple, dapple_num = mul_apple_layer.backward(dapple_price)

print(dapple, dapple_num, dtax)

2.2 110.00000000000001 200


* ここで、`backward()`の呼び出す順番は、`forward()`の時と逆の順番で行う

* また、`backward()`の引数は、「順伝播の際の出力変数に対する微分」を入力することに注意する

    * 例)`mul_apple_layer`という乗算レイヤは、順伝播時に`apple_price`を出力するが、逆伝播時には`apple_price`の微分値である`dapple_price`を引数に指定する

![5.3.9](./images/5.3.9.png)

## 2. 加算レイヤの実装

* 足し算ノードである加算レイヤを実装する

In [4]:
class AddLayer:
    def __init__(self):
        pass

    def forward(self, x, y):
        out = x + y

        return out

    def backward(self, dout):
        dx = dout * 1
        dy = dout * 1

        return dx, dy

* 加算レイヤでは特に初期化は必要ないので、`__init__()`では何も行わない

    * `pass`という記述は、「何も行わない」という記述
       

* 加算レイヤの`forward()`では、2つの引数`x`、`y`を受け取り、それらを加算して出力する

* `backward()`では、上流から伝わってきた微分(`dout`)を、そのまま下流に流す

* この計算グラフを実装すると、以下のようになる

In [5]:
apple = 100
apple_num = 2
orange = 150
orange_num = 3
tax = 1.1

# layer
mul_apple_layer = MulLayer()
mul_orange_layer = MulLayer()
add_apple_orange_layer = AddLayer()
mul_tax_layer = MulLayer()

# forward
apple_price = mul_apple_layer.forward(apple, apple_num)  # (1)
orange_price = mul_orange_layer.forward(orange, orange_num)  # (2)
all_price = add_apple_orange_layer.forward(apple_price, orange_price)  # (3)
price = mul_tax_layer.forward(all_price, tax)  # (4)

# backward
dprice = 1
dall_price, dtax = mul_tax_layer.backward(dprice)  # (4)
dapple_price, dorange_price = add_apple_orange_layer.backward(dall_price)  # (3)
dorange, dorange_num = mul_orange_layer.backward(dorange_price)  # (2)
dapple, dapple_num = mul_apple_layer.backward(dapple_price)  # (1)

print(price)

715.0000000000001


In [6]:
print(dapple_num, dapple, dorange, dorange_num, dtax)

110.00000000000001 2.2 3.3000000000000003 165.0 650


* これは、必要なレイヤを作成し、順伝播のメソッド`forward()`を適切な順番で呼び出す

    * そして、順伝播と逆の順番で逆伝播のメソッド`backward()`を呼び出すと、求めたい微分が得られる

![5.4.1](./images/5.4.1.png)

* このように、計算グラフにおけるレイヤの実装は簡単に行うことができ、それらを使えば複雑な微分の計算を求めることができる

| 版   | 年/月/日   |
| ---- | ---------- |
| 初版 | 2019/05/07 |