# 역전파 (Backpropagation)

### 연쇄 법칙

- 기본 수식으 역전파 & 연쇄법치 적용

In [1]:
import numpy as np

def forward(x):
    y = x ** 2
    return y

def backward(x):
    dy_dx = 2 * x
    return dy_dx

x = 3.0
print(forward(x))
print(backward(x))

9.0
6.0


- 다층 신경망에서 연쇄법칙 적용

In [2]:
def forward(x):
    y = x ** 2
    z = 2 * y
    return z
    
def backward(x):
    dy_dx = 2 * x
    dz_dy = 2
    dz_dx = dz_dy * dy_dx
    return dz_dx

x = 3.0
print(forward(x))
print(backward(x))

18.0
12.0


### 신경망에서의 활용

- 단순 신경망 학습

In [38]:
def sigmoid(x):
    return 1 / (1+np.exp(-x))

def sigmoid_d(x):
    return sigmoid(x) * (1 - sigmoid(x))

X = np.array([0.5, 0.8])
y = np.array([1])

W = np.array([0.2 , 0.4])

# 순전파
z = np.dot(x, W)
r = sigmoid(z)

# 오차 계산
loss = 0.5 * (y - r) ** 2

# 역전파 (기울기 계산)
delta = (r - y ) * sigmoid_d(z)
grad_w = delta * X

# 가중치 갱신
W -= 0.1 * grad_w   # 01. = learning_rate

print(W)

[0.20405341 0.40329425]


- 은닉층 추가

In [50]:
def relu(x):
     return np.maximum(0, x)
 
def relu_d(x):
    return np.where(x > 0, 1 ,0)
 
X = np.array([0.5, 0.8])                    # (2,)
y = np.array([1])

W1 = np.array([[0.2, 0.4], [0.1, 0.3]])     # (2, 2)
b1 = np.array([0.1 , 0.2])                  # (2,)
W2 = np.array([[0.5], [0.6]])               # (2, 1)
b2 = np.array([0.3])                      

# 순전피
z1 = np.dot(X, W1) + b1
r1 = relu(z1)

z2 = np.dot(r1, W2) + b2
r2 = relu(z2)

# 역전피(기울기 계산)
delta2 = (r2 - y) * relu_d(z2)
grad_w2 = np.outer(r1, delta2)

delta1 = np.dot(W2, delta2) * relu_d(z1)
grad_w1 = np.outer(x, delta)

# 가중치 계산
learning_rate = 0.01
W1 -= learning_rate * grad_w1
W2 -= learning_rate * grad_w2

print(W1)
print(W2)

[[0.20243205 0.40123534]
 [0.10243205 0.30123534]]
[[0.5004928]
 [0.6011264]]


### 수치미분과 역전파

In [49]:
def f(x):
    return x**2

def num_d_gradient(f, x):
    h = 1e-5
    return (f(x + h) - f(x - h)) / (2 * h)

def backward_gradient(x):
    return 2 * x

print(num_d_gradient(f, 3.0))
print(backward_gradient(3.0))

6.000000000039306
6.0


##### 숫자 맞추기 AI

In [140]:
target_number = 42


guess = np.random.randn()

learning_rate = 0.1

for i in range(50):
    # 오차 계산
    loss = 0.5 * (target_number - guess) ** 2
    
    # 역전파 (기울기 계산)
    grad = (guess - target_number)
    
    # 업데이트 (guess 업데이트)
    guess -= learning_rate * grad
    
    # epoch 5마다 예측값과 손실 출략 
    if i%5 == 0:
        print(f'{i}번째 예측 값: {guess}, 손실 {loss}')
    
# 최종 예측값 guess 출력
print(f'최종 예측:', guess)

0번째 예측 값: 4.758148597656306, 손실 856.1453678236104
5번째 예측 값: 20.009059165430074, 손실 298.5194313515772
10번째 예측 값: 29.014569346594804, 손실 104.08728966320696
15번째 예측 값: 34.33223305347077, 손실 36.292993794003806
20번째 예측 값: 37.47226029574396, 손실 12.654584462652226
25번째 예측 값: 39.326414982033846, 손실 4.412380770551279
30번째 예측 값: 40.421274782741165, 손실 1.5385020442030652
35번째 예측 값: 41.067778546460836, 손실 0.5364424928633797
40번째 예측 값: 41.44953255389966, 손실 0.18704593161495653
45번째 예측 값: 41.6749544777522, 손실 0.06521888366255793
최종 예측: 41.78673763285322
