* 각각의 동그라미는 노드라고도 불리고, 뉴런이라고도 함.
* 지금은 순방향 신경망이고, 아직 역전파 개념이 등장하기 전.
* FC Layers (Fully connected layers)

<p align="center"><img src="3_15.png" width=500></p>
<br><br><br>

# 3.4.1 표기법 설명
(1)이라는 것은 1층의 가중치를 의미한다. 밑에 있는 작은 숫자들은 to, from의 순서라는 점을 기억하자. 그런데 이것이 일반적으로 통용되는 표기법인지 아니면 여기서만 국한되서 사용되는 것인지는 모르겠다.
<p align="center"><img src="3-16.png" width=500></p>

# 3.4.2 각 층의 신호 전달 구현하기

1층의 첫 번째 뉴런으로 가는 신호를 살펴보자. 작은 글자들에 표기되어 있는 것이 무슨 뜻인지 알면, 의미들을 쉽게 파악할 수 있다. 아무거나 선을 하나 정해서, 그 선에 표기될 기호들이 어떻게 될 지 알아맞춰 보는 것도 좋다.

<p align="center"><img src="3-17.png" width=500></p>

이제 은닉층 중 첫 번째 뉴런을 수식으로 구현해보자. 아래와 같이 식을 전개할 수 있다. 포인트는 행렬의 shape이다. 왜 1 x 3 행렬이 나오는지 이해하면 넘어가도 좋다. 아래 코드는 np.dot을 이용한 연산이다. elementwise 방식이 필요할 때, 행렬 곱 연산이 필요할 때 어떻게 구현해야 하는지 각각 알아두도록 하자.

<p align="center"><img src="3-17-2.png" width=500></p>

In [6]:
import numpy as np

X = np.array([1.0, 0.5])
W1 = np.array([[0.1, 0.3, 0.5], [0.2, 0.4, 0.6]])
B1 = np.array([0.1, 0.2, 0.3])

print(W1.shape)
print(X.shape)
print(B1.shape)

print('---------------------')

A1 = np.dot(X, W1) + B1
print(A1, A1.shape)

(2, 3)
(2,)
(3,)
---------------------
[0.3 0.7 1.1] (3,)


이제 A1을 활성화 함수에 통과시킬 차례다. 활성화 함수는 시그모이드를 사용한다. 이전 장에서 구현해 둔 것인데, lib 디렉토리에 구현해 둔 것을 쓰도록 하겠다. 시그모이드 함수를 통과하면, 출력값이 0과 1 사이의 값으로 바뀐다.

<p align="center"><img src="3-18.png" width=500></p>

In [8]:
from lib.activation import sigmoid

Z1 = sigmoid(A1)

print(A1)
print(Z1)

[0.3 0.7 1.1]
[0.57444252 0.66818777 0.75026011]


이제 Z1에서 은닉층(2)로 넘어가는 것을 구현해보자. 앞과 다른 점은 뉴런이 3개로 늘어났다는 것이다.

<p align="center"><img src="3-19.png" width=500></p>

In [9]:
W2 = np.array([[0.1, 0.4], [0.2, 0.5], [0.3, 0.6]])
B2 = np.array([0.1, 0.2])

print(Z1.shape)
print(W2.shape)
print(B2.shape)

(3,)
(3, 2)
(2,)


In [12]:
A2 = np.dot(Z1, W2) + B2
Z2 = sigmoid(A2)
print(A2)
print(Z2)

[0.51615984 1.21402696]
[0.62624937 0.7710107 ]


이제 마지막 단계인 출력층을 구현해 봅니다. 출력층의 구현도 그 동안의 구현과 똑같습니다. 딱 하나, 활성화 함수만 지금까지의 은닉층과 다릅니다.

<p align="center"><img src="3-20.png" width=500></p>

In [13]:
def identity_function(x):
    return x

In [21]:
W3 = np.array([[1.0, 0.3], [0.2, 0.4]])
B3 = np.array([0.1, 0.2])

print(Z2)
print(W3)
print('-----------')
A3 = np.dot(Z2, W3) + B3
print(A3)

[0.62624937 0.7710107 ]
[[1.  0.3]
 [0.2 0.4]]
-----------
[0.88045151 0.69627909]


In [23]:
Y = identity_function(A3)
Y

array([0.88045151, 0.69627909])

출력층의 활성화 함수는 풀고자 하는 문제의 성질에 맞게 정한다고 한다.

* 회귀 = 항등함수
* 2클래스 분류 = 시그모이드
* 다중 분류 = 소프트맥스

# 3.4.3 구현 정리

* init_network: 가중치와 바이어스 값들을 할당 (초기화)
* forward: 연산들이 진행 됨

In [29]:
def init_network():
    network = {}
    network['W1'] = np.array([[0.1, 0.3, 0.5], [0.2, 0.4, 0.6]])
    network['b1'] = np.array([0.1, 0.2, 0.3])
    network['W2'] = np.array([[0.1, 0.4], [0.2, 0.5], [0.3, 0.6]])
    network['b2'] = np.array([[0.1, 0.2]])
    network['W3'] = np.array([[0.1, 0.3], [0.2, 0.4]])
    network['b3'] = np.array([0.1, 0.2])
    return network

In [27]:
def forward(network, x):
    W1, W2, W3 = network['W1'], network['W2'], network['W3']
    b1, b2, b3 = network['b1'], network['b2'], network['b3']
    
    a1 = np.dot(x, W1) + b1
    z1 = sigmoid(a1)
    a2 = np.dot(z1, W2) + b2
    z2 = sigmoid(a2)
    a3 = np.dot(z2, W3) + b3
    y = identity_function(a3)
    
    return y

In [30]:
network = init_network()
x = np.array([1.0, 0.5])
y = forward(network, x)
print(y)

[[0.31682708 0.69627909]]
