# ニューラルネットワークの構築（回帰）
ここからはニューラルネットワーク、すなわち複数のニューロンからなるネットワークを実装します。  
まず、出力が連続的な数値になる問題、すなわち回帰問題を扱います。

## ●実装するニューラルネットワーク
今回は、以下に示す3層のシンプルなニューラルネットワークを実装します。  

<img src="images/nn_regression.png">

このニューラルネットワークは、入力層（ニューロン数: n=2）、中間層（n=2）、出力層（n=1）の3層構造です。  
中間層の活性化関数はシグモイド関数で、出力層の活性化関数は回帰であるため恒等関数になります。  

ディープラーニングでは近年中間層の活性化関数にReLUを使うことが多いのですが、今回は結果を連続的に表示するためにシグモイド関数を使います。  
このニューラルネットワークに入力を順伝播させて、出力を今回もグリッドで表示します。  
そして、出力の傾向を観察します。

## ●各層の実装
3層のニューラルネットワークの各層を実装します。  
入力層は入力をそのまま受け取るのみなので、解説は省略します。  
中間層は、次のように関数で実装します。 

In [None]:
# 中間層
def middle_layer(x, w, b):
    u = np.dot(x, w) + b
    return 1/(1+np.exp(-u)) # シグモイド関数

この関数は、引数として中間層への入力（`x`）、重み（`w`）とバイアス（`b`）を受け取ります。  
そして、以下の箇所でNumpyのdot関数を用いて行列wとベクトル`x`の行列積を計算し、バイアスを足し合わせます。  

In [None]:
u = np.dot(x, w) + b

行列積を用いる理由は以前に解説しています。  
このコードは、ニューロンのネットワーク化の際に解説した以下の式に対応します。

$$  \begin{aligned} \\
\vec{u_j} & = \vec{x_i}W + \vec{b_j} \\
  \end{aligned}
$$ 

得られた`u`を活性化関数であるシグモイド関数に入れて、中間層の出力を得ることができます。  

出力層も、中間層と同様に関数で実装します。  

In [None]:
# 出力層
def output_layer(x, w, b):
    u = np.dot(x, w) + b
    return u  # 恒等関数

引数、及び`u`の計算は中間層と同様です。  
中間層との違いは、活性化関数が恒等関数である点です。

重みは、次のようにNumpyの配列を用いた行列として実装します。

In [None]:
# 重み
w_im = np.array([[4.0,4.0],
                 [4.0,4.0]])  # 中間層 2x2の行列
w_mo = np.array([[1.0],
                 [-1.0]])     # 出力層 2x1の行列

入力層のニューロン数は2、中間層のニューロン数は2なので、中間層には2x2=4個の重みが必要になります。  
また、中間層のニューロン数は2、出力層のニューロン数は1なので、出力層には2x1=2個の重みが必要になります。  

バイアスは次のようにベクトルとして実装します。

In [None]:
# バイアス
b_im = np.array([3.0,-3.0]) # 中間層
b_mo = np.array([0.1])      # 出力層 

バイアスの数はニューロンの数に等しいので、中間層には2個、出力層には1個のバイアスが必要になります。  
なお、重みとバイアスの値は適当な値を設定しています。

以上を踏まえて、順伝播を次のように実装します。

In [None]:
# 順伝播
inp = np.array([...])               # 入力層
mid = middle_layer(inp, w_im, b_im) # 中間層
out = output_layer(mid, w_mo, b_mo) # 出力層

入力を重みとバイアスとともに中間層の関数に渡します。  
そして、中間層の出力を重みとバイアスとともに出力層の関数に渡して、出力層の出力を得ます。

## ●全体のコード
ニューラルネットワークのコード全体は、以下の通りです。

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# x、y座標
X = np.arange(-1.0, 1.0, 0.2)  # 要素数は10個
Y = np.arange(-1.0, 1.0, 0.2)

# 出力を格納する10x10のグリッド
Z = np.zeros((10,10))

# 重み
w_im = np.array([[4.0,4.0],
                 [4.0,4.0]])  # 中間層 2x2の行列
w_mo = np.array([[1.0],
                 [-1.0]])     # 出力層 2x1の行列

# バイアス
b_im = np.array([3.0,-3.0]) # 中間層
b_mo = np.array([0.1])      # 出力層 

# 中間層
def middle_layer(x, w, b):
    u = np.dot(x, w) + b
    return 1/(1+np.exp(-u)) # シグモイド関数

# 出力層
def output_layer(x, w, b):
    u = np.dot(x, w) + b
    return u  # 恒等関数

# グリッドの各マスでニューラルネットワークの演算
for i in range(10):
    for j in range(10):
        
        # 順伝播
        inp = np.array([X[i], Y[j]])        # 入力層
        mid = middle_layer(inp, w_im, b_im) # 中間層
        out = output_layer(mid, w_mo, b_mo) # 出力層
        
        # グリッドにNNの出力を格納
        Z[j][i] = out[0]

# グリッドの表示
plt.imshow(Z, "gray", vmin = 0.0, vmax = 1.0)
plt.colorbar()  
plt.show()

グリッドの形式は単一ニューロンの際と同じです。  
単一ニューロンの際は白の領域と黒の領域の2つに分けるのみであったのに対して、このニューラルネットワークを用いると白が黒に挟まれる結果となりました。  
より複雑な条件で、ニューロンが興奮するようになっています。 

なお、グリッドに出力を格納する際に、`out`に`[0]`が付いているのは`out`が要素数1の配列だからです。  

重みとバイアスを様々な値に変更し、ニューラルネットワークの表現力を試してみましょう。  
重みとバイアスが変わると、グリッドにおける出力の分布が様々な形状に変化します。  

複数のニューロンをネットワーク化しニューラルネットワークを構築することで、単一ニューロンと比べて表現力が向上することが確認されました。   
ニューロンの数や層の数をさらに増すことで、より複雑な分布を出力することも可能です。  
複雑な出力分布を利用することで、ニューラルネットワークは高度な予測や分類ができるようになります。  