# 誤差逆伝播法
## 計算グラフ

![画像がありません](../image/計算グラフ.png)

ノードと矢印によって計算の過程を表す。
１）計算グラフを構築する。
２）計算グラフ上で計算を左から右へ進める（順伝播）。

〜計算グラフの利点〜
- 局所的な計算
各ノードで計算を行う際、自分に関係する計算だけすればよく、全体のことについては何も考えなくて良い。<br>
そのため、全体の計算がどれほど複雑であっても、各ノードでは単純な計算に集中することで、問題を単純化できる。
- 途中の計算の結果をすべて保持できる
- 逆方向の伝播（逆伝播）によって「微分」を効率よく計算できる

## 計算グラフの逆伝播

![画像がありません（計算グラフback）](../image/計算グラフback.png)

→$y=f(x)$という計算があるとして、信号$E$に対してノードの局所的な微分$\frac{{\delta}y}{{\delta}x}$を乗算し、それを次のノードへと伝達している。<br>
この計算を行うことで、目的とする微分の値を効率よく求めることができる。（<u>連鎖律の原理</u>）

## 連鎖律

連鎖律とは合成関数の微分についての性質であり、次のように定義される。

**ある関数が合成関数で表される場合、その合成関数の微分は、合成関数を構成するそれぞれの関数の微分の積によって表すことができる。**

例えば、$z=(x+y)^2$という式は、ルギの2つの式で構成される。<br>
$$
    z = t^2 \\
    t = x + y
$$
連鎖律の計算をする・
$$
    \frac{{\delta}z}{{\delta}x}=\frac{{\delta}z}{{\delta}t}\frac{{\delta}t}{{\delta}x} = 2t･1 = 2(x+y)
$$

![画像がありません](../image/ChainRule.png)

このように、計算グラフの逆伝播は連鎖律によって成り立つ。

- 加算ノードの逆伝播<br>
：１を乗算するだけなので、入力された値をそのまま次のノードへ流すだけ。
- 乗算ノードの逆伝播<br>
：順伝播の際の入力信号をひっくり返した値を乗算して下流へ流す。

# 活性化関数レイヤの実装

計算グラフの考え方をNNに適用する。

## ReLUレイヤ

(5.7)
$$
    y = \begin{cases}
        x \quad x > 0 \\
        0 \quad x \leq 0 \\
        \end{cases}
$$

(5.8)
$$
    \frac{{\delta}y}{{\delta}x} = \begin{cases}
        1 \quad x > 0 \\
        0 \quad x \leq 0 \\
        \end{cases}
$$

式(5.7)から、xに関するyの微分は式(5.8)のように求まる。<br>
式(5.8)で表されるように、順伝播時の入力xが0より大きければ、逆伝播は上流の値をそのまま下流に流す。

●$x>0$の時
![画像がありません](../image/relu1.png)

●$x\leq0$の時
![画像がありません](../image/relu2.png)

→ReLUレイヤの計算グラフ

## Sigmoidレイヤ

(5.9)
$$
    y=\frac{1}{1+exp(-x)}
$$

計算グラフで表す。

![画像がありません](../image/sigmoid1.png)

ステップ１<br>
「/」ノードは$y=\frac{1}{x}$を表すが、この微分は解析的に次の指揮によって表される。

(5.10)
$$
    \frac{{\delta}y}{{\delta}x}=-\frac{1}{x^2}=-y^2
$$

式(5.10)より、逆伝播の時は上流の値に対して$-y^2$（順伝播の出力の２乗にマイナスをつけた値）を乗算して下流へ伝播する。

ステップ２<br>
「＋」ノードは、上流の値を下流にそのまま流すだけ。

ステップ３<br>
「exp」ノードは、$y=exp(x)$を表、その微分は次式で表される。

(5.11)
$$
    \frac{{\delta}y}{{\delta}x}=exp(x)
$$

計算グラフでは、上流の値に対して順伝播時の出力を乗算して下流へ伝播する。