0805

# 역전파 (Backpropagation)

### 연쇄법칙 
- 기본 수식의 역전파 & 연쇄법칙 적용

In [None]:
import numpy as np 

def forward(x):   # 순전파 
    y = x**2
    return y

def backward(x):   # 역전파 : 순전파에 대해 미분함 
    dy_dx = 2 * x
    return dy_dx

x = 3.0 
print(forward(x))     # 예측값으로 생각하면 됨. 
print(backward(x))    # 기울기 값이라고 생각하면 됨.

9.0
6.0


- 다층 신경망에서 연쇄법칙 적용

In [3]:
def forward(x):   # 순전파 
    y = x**2
    z = 2 * y
    return y

def backward(x):   # 역전파 : 순전파에 대해 미분함 
    dy_dx = 2 * x
    dz_dy = 2
    dz_dx = dy_dx * dz_dy      # 연쇄법칙
    return dy_dx

x = 3.0 
print(forward(x))     # 예측값으로 생각하면 됨. 
print(backward(x))    # 기울기 값이라고 생각하면 됨.

9.0
6.0


### 신경망에서의 활용
- 단순 신경망 학습

In [7]:
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

def sigmoid_d(x):
    return sigmoid(x) * (1-sigmoid(x))

In [5]:
x = np.array([0.5, 0.8])
y = np.array([1])

W = np.array([0.2, 0.4])

In [8]:
# 순전파
z = np.dot(x, W)
r = sigmoid(z)

# 오차 계산 
loss = 0.5 * (y - r) ** 2

# 역전파 (기울기 계산)
delta = (r - y) * sigmoid_d(z)
grad_w = delta * x

# 가중치 갱신
W -= 0.1 * grad_w              # 0.1 == learning_rate

print(W)

[0.20474415 0.40759064]


- 은닉층 추가 

In [13]:
def relu(x) :
    return np.maximum(0, x)

def relu_d(x):
    return np.where(x > 0, 1, 0)

In [15]:
x = np.array([0.5, 0.8])   # (2, )
y = np.array([1])          # (1, )

W1 = np.array([[0.2, 0.4], [0.1, 0.3]])       # (2, 2)
b1 = np.array([0.1, 0.2])                     # (2, )
W2 = np.array([[0.5], [0.6]])                 # (2. 1)
b2 = np.array([0.3])                          # (1, )

In [16]:
# 순전파 
z1 = np.dot(x, W1) + b1
r1 = relu(z1)

z2 = np.dot(r1, W2) + b2
r2 = relu(z2)

# 손실 계산 -> 역전파 (기울기 계산)
delta2 = (r2 - y) * relu_d(z2)
grad_W2 = np.outer(r1, delta2)

delta1 = np.dot(W2, delta2) * relu_d(z1)
grad_W1 = np.outer(x, delta1)

# 가중치 갱신
learning_rate = 0.01
W2 -= learning_rate * grad_W2
W1 -= learning_rate * grad_W1

print(W2)
print(W1)

[[0.5004928]
 [0.6011264]]
[[0.20044   0.400528 ]
 [0.100704  0.3008448]]


### 수치미분과 역전파 

In [None]:
def f(x):
    return x **2

def num_d_gradient(f, x):
    h = 1e-5
    return (f(x + h) - f(x - h)) / (2 * h)   # 수치미분 중앙차원법

def backward_gradient(x) : 
    return 2 * x             # 해석적 미분? 검증 목적으로 사용 

print(num_d_gradient(f, 3.0))
print(backward_gradient(3.0))

6.000000000039306
6.0


##### 숫자 맞추기 AI

In [22]:
target_number = 42
guess = np.random.randn()
learning_rate = 0.1
epochs = 500

for i in range(epochs) : 
    # 오차 계산 
    loss = 0.5 * ((guess - target_number) ** 2)
    # 역전파 (기울기 계산)
    grad = (guess - target_number)

    # 업데이트 (guess 계산)
    guess -= learning_rate * grad
    # epoch 100 마다 예측값과 손실 출력 
    if (i+1) % 100 == 0 :
     print(f'epoch { i +1 } | 예측값 {guess} | 손실 {loss}')
# 최종 예측값 guess 출력
print(f'최종 예측값: {guess}')

epoch 100 | 예측값 41.99886313461546 | 손실 7.978166065210436e-07
epoch 200 | 예측값 41.99999996980326 | 손실 5.628659180927374e-16
epoch 300 | 예측값 41.9999999999992 | 손실 4.0076658340124107e-25
epoch 400 | 예측값 41.99999999999997 | 손실 4.0389678347315804e-28
epoch 500 | 예측값 41.99999999999997 | 손실 4.0389678347315804e-28
최종 예측값: 41.99999999999997
