# Chapter 3. 신경망
## 3.4 3층 신경망 구현하기
![3층 신경망](https://user-images.githubusercontent.com/61455647/114133955-d75c3380-9941-11eb-9850-ee30e1aa4ca4.png)
- 입력층(0층) 2개, 1번째 은닉층(1층) 3개, 2번째 은닉층(2층) 2개, 출력층(3층) 2개
### 3.4.1 표기법 설명
- 신경망에서의 계산을 행렬 계산으로 정리할 수 있음의 목적

![image](https://user-images.githubusercontent.com/61455647/114134222-5487a880-9942-11eb-9471-0899b846f0c6.png)

- (1): 1층의 가중치, 1층의 뉴런
- 12: **다음 층 번호, 앞층 번호** 순으로 표기
### 3.4.2 각 층의 신호 전달 구현하기
![입력층에서 1층으로 신호 전달](https://user-images.githubusercontent.com/61455647/114135188-da582380-9943-11eb-8ddd-17fda666db5a.png)

- 신경망을 수식으로 나타내면 다음과 같다.

![image](https://user-images.githubusercontent.com/61455647/114136411-9b2ad200-9945-11eb-8e45-eff7a7807e1e.png)

In [1]:
import numpy as np

def sigmoid(x):
    return 1 / (1 + np.exp(-x))

In [2]:
X = np.array([1.0, 0.5])
W1 = np.array([[0.1, 0.3, 0.5], [0.2, 0.4, 0.6]])
B1 = np.array([0.1, 0.2, 0.3])

print(W1.shape)
print(X.shape)
print(B1.shape)

A1 = np.dot(X, W1) + B1

(2, 3)
(2,)
(3,)


#### 1. 입력층 -> 1층으로의 신호 전달
- a: 은닉층에서의 가중치 합(가중 신호와 편향의 총합)
- z: 활성화 함수 h()로 변환된 신호
- 활성화 함수: 시그모이드 함수

![image](https://user-images.githubusercontent.com/61455647/114139136-9ec05800-9949-11eb-906c-3ee67fea0078.png)

In [3]:
Z1 = sigmoid(A1)

print(A1)
print(Z1)

[0.3 0.7 1.1]
[0.57444252 0.66818777 0.75026011]


#### 1층 -> 2층으로의 신호 전달
![image](https://user-images.githubusercontent.com/61455647/114140962-ed6ef180-994b-11eb-92ba-26d0c5a00a91.png)

- 1층의 출력 Z1이 2층의 입력이 됨
- 넘파이 배열을 사용하면서 층 사이의 신호 전달을 쉽게 구현할 수 있음

In [4]:
W2 = np.array([[0.1, 0.4], [0.2, 0.5], [0.3, 0.6]])
B2 = np.array([0.1, 0.2])

print(Z1.shape)
print(W2.shape)
print(B2.shape)

(3,)
(3, 2)
(2,)


In [5]:
A2 = np.dot(Z1, W2) + B2
Z2 = sigmoid(A2)

print(A2)
print(Z2)

[0.51615984 1.21402696]
[0.62624937 0.7710107 ]


#### 2층 -> 출력층으로의 신호 전달
- 활성화 함수가 은닉층과 다름

![image](https://user-images.githubusercontent.com/61455647/114142007-530fad80-994d-11eb-9cbe-1c199280d0f4.png)

In [6]:
def identity_function(x):
    return x

In [7]:
W3 = np.array([[0.1, 0.3], [0.2, 0.4]])
B3 = np.array([0.1, 0.2])

In [8]:
A3 = np.dot(Z2, W3) + B3
Y = identity_function(A3)

print(A3)
print(Y)

[0.31682708 0.69627909]
[0.31682708 0.69627909]


- 항등 함수인 identity_function()을 정의해, 출력층의 활성화 함수로 사용
- 출력층의 활성화 함수를 σ()로 표시해, 은닉층의 활성화 함수 h()와 다름을 명시

### 3.4.3 구현 정리

In [9]:
import numpy as np

def sigmoid(x):
    return 1 / (1 + np.exp(-x))

In [10]:
def init_network():
    network = {}
    network['W1'] = np.array([[0.1, 0.3, 0.5], [0.2, 0.4, 0.6]])
    network['b1'] = np.array([0.1, 0.2, 0.3])
    network['W2'] = np.array([[0.1, 0.4], [0.2, 0.5], [0.3, 0.6]])
    network['b2'] = np.array([0.1, 0.2])
    network['W3'] = np.array([[0.1, 0.3], [0.2, 0.4]])
    network['b3'] = np.array([0.1, 0.2])
    
    return network

def forward(network, x):
    W1, W2, W3 = network['W1'], network['W2'], network['W3']
    b1, b2, b3 = network['b1'], network['b2'], network['b3']
    
    a1 = np.dot(x, W1) + b1
    z1 = sigmoid(a1)
    a2 = np.dot(z1, W2) + b2
    z2 = sigmoid(a2)
    a3 = np.dot(z2, W3) + b3
    y = identity_function(a3)
    
    return y

In [11]:
network = init_network()
x = np.array([1.0, 0.5])
y = forward(network, x)
print(y)

[0.31682708 0.69627909]


- init_network(): 가중치와 편향 초기화, network에 저장
- forward(): 입력 -> 출력으로 변환하는 처리 과정, 신호가 순방향으로 전달됨