## ３層ニューラルネットワークの実装

### 記号の確認

$w_{12}^{(1)}$: 第 1 層目の重みで、前層の 2 番目のニューロンから、次層の 1 番目のニューロンへの重みを表す。

バイアスも考えて、重み付き和（活性化関数の入力）は $a_1^{(1)} = w_{11}^{(1)} x_1 + w_{12}^{(1)} x_2 + b_1^{(1)}$ のようになる。

これを行列積を用いてまとめて表すと、$A^{(1)} = X W^{(1)} + B^{(1)}$

ただし、
$A^{(1)} = \begin{bmatrix} a_1^{(1)} & a_2^{(1)} & a_3^{(1)} \end{bmatrix}$,
$X = \begin{bmatrix} x_1 & x_2 \end{bmatrix}$,
$W = \begin{bmatrix} w_{11}^{(1)} & w_{21}^{(1)} & w_{31}^{(1)} \\ w_{12}^{(1)} & w_{22}^{(1)} & w_{32}^{(1)} \end{bmatrix}$,
$B = \begin{bmatrix} b_1^{(1)} & b_2^{(1)} & b_3^{(1)} \end{bmatrix}$


### 適当な数値で実装


In [1]:
import numpy as np

In [2]:
# 活性化関数の定義
def sigmoid(x: np.ndarray):
    return 1 / (1 + np.exp(-x))

In [3]:
# 入力層
X = np.array([1.0, 0.5])

In [4]:
# 第1層
W1 = np.array([[0.1, 0.3, 0.5], [0.2, 0.4, 0.6]])
B1 = np.array([0.1, 0.2, 0.3])

A1 = np.dot(X, W1) + B1
print('A1: ')
print(A1)

Z1 = sigmoid(A1)
print('\nZ1: ')
print(Z1)

A1: 
[0.3 0.7 1.1]

Z1: 
[0.57444252 0.66818777 0.75026011]


In [5]:
# 第2層
W2 = np.array([[0.1,0.4],[0.2,0.5],[0.3,0.6]])
B2 = np.array([0.1,0.2])

A2 = np.dot(Z1, W2) + B2
print('A2: ')
print(A2)

Z2 = sigmoid(A2)
print('\nZ2: ')
print(Z2)

A2: 
[0.51615984 1.21402696]

Z2: 
[0.62624937 0.7710107 ]


In [6]:
# 第3層
W3 = np.array([[0.1,0.3],[0.2,0.4]])
B3 = np.array([0.1,0.2])

A3 = np.dot(Z2, W3) + B3
Y = A3 # 活性化関数はこれまでとは異なり、恒等関数（与えられた入力をそのまま出力する）
print('Y: ')
print(Y)

Y: 
[0.31682708 0.69627909]


### まとめて書く

In [None]:
def initNetwork():
    '''３層のネットワークを作成して返す'''
    network = {}
    network['W1'] = np.array([[0.1, 0.3, 0.5], [0.2, 0.4, 0.6]])
    network['b1'] = np.array([0.1, 0.2, 0.3])
    network['W2'] = np.array([[0.1,0.4],[0.2,0.5],[0.3,0.6]])
    network['b2'] = np.array([0.1,0.2])
    network['W3'] = np.array([[0.1,0.3],[0.2,0.4]])
    network['b3'] = np.array([0.1,0.2])
    return network

def forward(network, x):
    '''入力信号を出力に変換するプロセスをまとめて実装した関数'''
    W1, W2, W3 = network['W1'], network['W2'], network['W3']
    b1, b2, b3 = network['b1'], network['b2'], network['b3']

    a1 = np.dot(x, W1) + b1
    z1 = sigmoid(a1)
    a2 = np.dot(z1, W2) + b2
    z2 = sigmoid(a2)
    a3 = np.dot(z2, W3) + b3
    y = a3

    return y

network = initNetwork()
x = np.array([1.0,0.5])
y = forward(network=network, x=x)
print(y)

[0.31682708 0.69627909]
