<a href="https://colab.research.google.com/github/nureeee/DeepLearning/blob/main/%ED%96%89%EB%A0%AC%EA%B3%BC_%EC%8B%A0%EA%B2%BD%EB%A7%89.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 신경망의 입력값과 가중치
* 신경망

In [3]:
import numpy as np

x = np.array([1, 2])
w = np.array([[1, 2, 3],
              [4, 5, 6]]) # 2개의 입력을 받는 3개의 뉴런

print('입력값 x의 shape : {}'.format(x.shape))
print('입력값 w의 shape : {}'.format(w.shape))

입력값 x의 shape : (2,)
입력값 w의 shape : (2, 3)


In [5]:
# 내적하기
z = np.dot(x, w)
print('출력값 z : {}'.format(z))

출력값 z : [ 9 12 15]


In [7]:
w.T @ x

array([ 9, 12, 15])

In [8]:
x @ w

array([ 9, 12, 15])

In [10]:
# w @ x 에러발생!

# 단순한 3층 신경망 구성하기

In [13]:
# 시그모이드 함수 - 은닉층에서 사용
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

# 항등 함수 구현 - 출력층에서 사용
def identity_function(x):
    return x

# 1층 구현하기

In [16]:
X = np.array([1.0, 0.5])
W1 = np.array([[0.1, 0.3, 0.5],
               [0.2, 0.4, 0.6]])

B1 = np.array([0.1, 0.2, 0.3])
Z1 = np.dot(X, W1) + B1
A1 = sigmoid(Z1)

print('1층의 결과 : {}'.format(A1))

print('입력값 X의 shape : {}'.format(X.shape))
print('입력값 W1의 shape : {}'.format(W1.shape))
print('입력값 B1의 shape : {}'.format(B1.shape))
print('입력값 Z1의 shape : {}'.format(Z1.shape))
print('입력값 A1의 shape : {}'.format(A1.shape))

1층의 결과 : [0.57444252 0.66818777 0.75026011]
입력값 X의 shape : (2,)
입력값 W1의 shape : (2, 3)
입력값 B1의 shape : (3,)
입력값 Z1의 shape : (3,)
입력값 A1의 shape : (3,)


# 2층 구현하기

In [24]:
W2 = np.array([[0.1, 0.4],
              [0.2, 0.5],
              [0.3, 0.6]])

B2 = np.array([0.1, 0.2])
Z2 = np.dot(A1, W2) + B2
A2 = sigmoid(Z2)

print('2층의 결과 : {}'.format(A2))

print('입력값 W2의 shape : {}'.format(W2.shape))
print('입력값 B2의 shape : {}'.format(B2.shape))
print('Z2의 shape : {}'.format(Z2.shape))
print('A2의 shape : {}'.format(A2.shape))

2층의 결과 : [0.62624937 0.7710107 ]
입력값 W2의 shape : (3, 2)
입력값 B2의 shape : (2,)
Z2의 shape : (2,)
A2의 shape : (2,)


# 3층 구현하기 (출력층)
 * 활성화 함수로 항등함수

In [25]:
W3 = np.array([[0.1, 0.3],
               [0.2, 0.4]])

B3 = np.array([0.1, 0.2])
Z3 = np.dot(A2, W3) + B3
A3 = identity_function(Z3)

print('입력값 W3의 shape : {}'.format(W3.shape))
print('입력값 B3의 shape : {}'.format(B3.shape))
print('Z3의 shape : {}'.format(Z3.shape))
print('')
print('3층의 출력값 : {}'.format(A3))

입력값 W3의 shape : (2, 2)
입력값 B3의 shape : (2,)
Z3의 shape : (2,)

3층의 출력값 : [0.31682708 0.69627909]


# 순전파 최종 구현

In [27]:
# 네트워크 초기화
#  네트워크가 최초로 가지고 있어야 할 가중와 편향을 설정
#  보통은 정규분포 랜덤으로 초기화 하거나, 카이밍 히, 사비에르 초깃값 등을 활용
def init_network():
  network = {}

  # 1층 매개변수 초기화
  network["W1"] = np.array([[0.1, 0.3, 0.5],
                            [0.2, 0.4, 0.6]])
  network["B1"] = np.array([0.1, 0.2, 0.3])

  # 2층 매개변수 초기화
  network["W2"] = np.array([[0.1, 0.4],
                            [0.2, 0.5],
                            [0.3, 0.6]])
  network["B2"] = np.array([0.1, 0.2])

  # 3층 매개변수 초기화
  network["W3"] = np.array([[0.1, 0.3],
                            [0.2, 0.4]])
  network["B3"] = np.array([0.1, 0.2])

  return network

# 순전파 XW+B
def forward(network, x):
  # 가중치, 편향 꺼내기
  W1, W2, W3 = network["W1"], network["W2"], network["W3"]
  b1, b2, b3 = network["B1"], network["B2"], network["B3"]

  # 1층 계산
  Z1 = (x @ W1) + b1
  A1 = sigmoid(Z1)

  # 2층 계산
  Z2 = (A1 @ W2) + b2
  A2 = sigmoid(Z2)
  
  # 3층 계산
  Z3 = (A2 @ W3) + b3
  y = identity_function(Z3)
  
  return y

In [33]:
network = init_network()
x = np.array([1.0, 0.5])
y = forward(network, x) 
print(y)

[0.31682708 0.69627909]
