04 3層ニューラルネットワークの実装
============================

* ここでは、以下の図に示す3層ニューラルネットワークを対象として、その入力から出力への処理(フォワード方向への処理)を実装する

![3層NN](./images/3層NN.png)

## 1. 記号の確認

* 以下の図を用いて説明する

* 入力層$x_2$のニューロンから、次層のニューロン$a_1^{(1)}$への重みだけをピックアップして図示している

![重みの記号2](./images/重みの記号2.png)

![重みの記号1](./images/重みの記号1.png)

## 2. 各層における信号伝達の実装

* 入力層から、「第1層目の1番目のニューロン」への信号伝達を考える

![入力層から第1層目への信号の伝達](./images/入力層から第1層目への信号の伝達.png)

* ただし、バイアスニューロンは1つしか存在しない

* ここで、$a_1^{(1)}$を数式で表す

    * $a_1^{(1)}$は重み付き信号と、バイアスの和で、以下の式で表される
    
\begin{eqnarray}
a_1^{(1)} = w_{11}^{(1)}x_1 + w_{12}^{(1)}x_2 + b_1^{(1)}
\end{eqnarray}

* また、行列の積を用いると、第1層目の「重み付き和」は次の式で表される

\begin{eqnarray}
A^{(1)} = XW^{(1)} + B^{(1)}
\end{eqnarray}

* ただし、$A^{(1)}$、$X$、$B^{(1)}$、$W^{(1)}$は下記の通りとなる

\begin{eqnarray}
A^{(1)}=
\begin{pmatrix}
a_1^{(1)} & a_2^{(1)} & a_3^{(1)}
\end{pmatrix}
\end{eqnarray}

\begin{eqnarray}
X =
\begin{pmatrix}
x_1 & x_2
\end{pmatrix}
\end{eqnarray}

\begin{eqnarray}
B^{(1)}=
\begin{pmatrix}
b_1^{(1)} & b_2^{(1)} & b_3^{(1)}
\end{pmatrix}
\end{eqnarray}

\begin{eqnarray}
A^{(1)}=
\begin{pmatrix}
w_{11}^{(1)} & w_{21}^{(1)} & w_{31}^{(1)} \\
w_{12}^{(1)} & w_{22}^{(1)} & w_{32}^{(1)} \\
\end{pmatrix}
\end{eqnarray}

* NumPyの多次元配列を用いて、上の式を実装する

In [1]:
import numpy as np

X = np.array([1.0, 0.5])
W1 = np.array([[0.1, 0.3, 0.5], [0.2, 0.4, 0.6]])
B1 = np.array([0.1, 0.2, 0.3])

In [2]:
print(W1.shape)

(2, 3)


In [3]:
print(X.shape)

(2,)


In [4]:
print(B1.shape)

(3,)


In [5]:
A1 = np.dot(X, W1) + B1

### 第1層の活性化関数によるプロセス

* 隠れ層での重み付き和(重み付き信号とバイアスの総和)を$a$で表し、活性化関数で変換された信号を$z$で表す

* また、活性化関数を$h()$で表し、ここではシグモイド関数を用いる

![入力層から第1層](./images/入力層から第1層への伝達.png)

In [6]:
import numpy as np

# シグモイド関数の定義
def sigmoid(x):
    return 1 / (1 + np.exp(-x))    

In [7]:
Z1 = sigmoid(A1)

In [8]:
print(A1)

[0.3 0.7 1.1]


In [9]:
print(Z1)

[0.57444252 0.66818777 0.75026011]


### 第1層から第2層までの実装

* 以下の図を用いて考える

![第1層から第2層への信号の伝達](./images/第1層から第2層への信号の伝達.png)

In [10]:
W2 = np.array([[0.1, 0.4], [0.2, 0.5], [0.3, 0.6]])
B2 = np.array([0.1, 0.2])

In [11]:
print(Z1.shape)

(3,)


In [12]:
print(W2.shape)

(3, 2)


In [13]:
print(B2.shape)

(2,)


In [14]:
A2 = np.dot(Z1, W2) + B2

In [15]:
Z2 = sigmoid(A2)

* この実装は第1層の出力(`Z1`)が第2層への出力になっている点を除けば、先ほどの実装と全く同じ

### 第2層から出力層への信号の伝達

* 以下の図を参考に考える

    * ただし、最後の活性化関数だけが、これまでの隠れ層とは異なる

![第2層から出力層への信号の伝達](./images/第2層から出力層への信号の伝達.png)

In [16]:
def identity_function(x):
    return x

In [17]:
W3 = np.array([[0.1, 0.3], [0.2, 0.4]])
B3 = np.array([0.1, 0.2])

In [18]:
A3 = np.dot(Z2, W3) + B3

In [20]:
Y = identity_function(A3)

* ここでは、`identity_funtction()`という関数を定義した

    * これを、`恒等関数`と呼ぶ
    
    * 出力層の活性化関数として利用する

* `恒等関数`は、入力をそのまま出力する関数

    * そのため、この例ではわざわざ関数を定義する必要はないが、これまでの流れに合わせて定義している
    
    * 出力層の活性化関数は$\sigma()$で表し、隠れ層の活性化関数$h()$とは異なることを示している

> 出力層で利用する活性化関数は、解く問題の性質に応じて決定する
>
> 例)回帰問題では`恒等関数`
>
> 例) 2クラス分類問題では`シグモイド関数`
>
> 例)多クラス分類問題では`ソフトマックス関数`

## 3. 実装のまとめ

* 3層ニューラルネットワークの実装をまとめて考える

    * ただし、重みだけを`W1`といった大文字に変換し、それ以外は小文字で表現する

In [21]:
def init_network():
    network = {}
    network['W1'] = np.array([[0.1, 0.3, 0.5], [0.2, 0.4, 0.6]])
    network['b1'] = np.array([0.1, 0.2, 0.3])
    network['W2'] = np.array([[0.1, 0.4], [0.2, 0.5], [0.3, 0.6]])
    network['b2'] = np.array([0.1, 0.2])
    network['W3'] = np.array([[0.1, 0.3], [0.2, 0.4]])
    network['b3'] = np.array([0.1, 0.2])
    
    return network

In [24]:
def forward(network, x):
    W1, W2, W3 = network['W1'], network['W2'], network['W3']
    b1, b2, b3 = network['b1'], network['b2'], network['b3']
    
    a1 = np.dot(x, W1) + b1
    z1 = sigmoid(a1)
    a2 = np.dot(z1, W2) + b2
    z2 = sigmoid(a2)
    a3 = np.dot(z2, W3) + b3
    y = identity_function(a3)
    
    return y

In [25]:
network = init_network()
x = np.array([1.0, 0.5])
y = forward(network, x)
print(y)

[0.31682708 0.69627909]


* `init_network()`関数で、重みとバイアスの初期化を行い、それらをディクショナリ型の変数`network`に格納する

* このディクショナリ型の変数`network`には、それぞれの層で必要なパラメータ(重みとバイアス)が格納されている

* そして、`forward()`関数では、入力信号が出力へと変換されるプロセスがまとめて実装されている

| 版   | 年/月/日   |
| ---- | ---------- |
| 初版 | 2019/05/01 |