<a href="https://colab.research.google.com/github/yukinaga/minnano_dl/blob/main/section_5/01_chain_next.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 連鎖律の拡張
ニューラルネットワークの学習で使用できるように、連鎖律をより汎用的な形に拡張します。

## 複雑な合成関数

Section2では以下のシンプルな合成関数を扱いました。  

$$ \begin{aligned} \\
y & = f(u) \\
u & = g(x) \\
\end{aligned} $$

この場合、$y$は$u$の関数で、$u$は$x$の関数です。  

これを、以下のように多変数関数に拡張します。

（式1）  
$$ y = f(u_1,u_2,\cdots, u_i, \cdots, u_n)$$
$$u_i = g_i(x_1, x_2, \cdots, x_j, \cdots, x_m)$$

ここで、$1\leq i \leq n$、$1\leq j \leq m$です。  
$y$は$u_1,u_2,\cdots, u_i, \cdots, u_n$の関数で、$u_i$は$x_1, x_2, \cdots, x_j, \cdots, x_m$の関数です。  
$g_i$は添字ごとに異なる関数です。  

## 連鎖律の拡張

（式1）の合成関数$y$を$x_j$で偏微分する場合には、以下の通り総和の形で連鎖律を適用できます。    

（式2） 
$$ \frac{\partial y}{\partial x_j} = \sum_{i=1}^{n}\frac{\partial y}{\partial u_i}\frac{\partial u_i}{\partial x_j}$$ 

この式が実際に機能することを確かめましょう。  
例として、以下の関数を扱います。  
（式3）
$$ \begin{aligned} \\
y &= (x_1^2+x_2+1)(x_2-1)+x_2-1 \\
\end{aligned} $$

この関数は以下のように展開できます。  
（式4）  
$$ \begin{aligned} \\
y &= x_1^2x_2 - x_1^2 + x_2^2 - x_2 + x_2 -1 + x_2 -1 \\
&= x_1^2x_2 - x_1^2 + x_2^2 + x_2 - 2
\end{aligned} $$

この（式4）は以下のように偏微分することができます。

（式5）
$$ \frac{\partial y}{\partial x_1} = 2x_1x_2 - 2x_1 $$
$$ \frac{\partial y}{\partial x_2} = x_1^2 + 2x_2 + 1 $$

ここで、（式2）の連鎖律を使っても同じ結果が得られることを確認します。  
以下の通りに$u_1$と$u_2$を設定します。  

$$u_1=x_1^2+x_2+1$$
$$u_2=x_2-1$$

このとき、（式3）は次のように表されます。  

$$y=u_1u_2+u_2$$

ここで、（式2）を使います。

$$ \begin{aligned} \\
\frac{\partial y}{\partial x_1} &= \frac{\partial y}{\partial u_1} \frac{\partial u_1}{\partial x_1} + \frac{\partial y}{\partial u_2} \frac{\partial u_2}{\partial x_1} \\
& = 2u_2 x_1 \\
& = 2x_1x_2 - 2x_1
\end{aligned} $$

$$ \begin{aligned} \\
\frac{\partial y}{\partial x_2} &= \frac{\partial y}{\partial u_1} \frac{\partial u_1}{\partial x_2} + \frac{\partial y}{\partial u_2} \frac{\partial u_2}{\partial x_2} \\
& = u_2 + (u_1+1) \\
& = x_1^2 +2x_2 + 1
\end{aligned} $$

連鎖律が機能し、（式5）と同じ結果が得られました。  
ニューラルネットワークが学習するためのアルゴリズム「バックプロパゲーション」では、このような連鎖律が必要不可欠です。  