# **순전파**

In [1]:
import numpy as np
# ReLU 함수 정의
def ReLU(X):
    return np.maximum(0,X)
# 입력층 데이터(1*3)
x = np.array([[0.5, 0.8, 0.2]])
# 은닉층 가중치(3*2), 편향(1*2)
W1 = np.array([[1.0, -1.0],
               [0.0, 2.0],
               [1.0, 0.5]])
b1 = np.array([[0.1, 0.2]])
# 은닉층 계산
z1 = x @ W1 + b1
a1 = ReLU(z1)
# 출력층 가중치(2*1), 편향(1*1)
W2 = np.array([[2.0],
               [-1.0]])
b2 = np.array([[0.5]])
# 출력층 계산
z2 = a1 @ W2 + b2
y_pred = ReLU(z2)
# 결과 출력
print("입력 벡터 x:", x)
print("은닉층 선형 출력 z1:", z1)
print("은닉층 활성화 a1 (ReLU):", a1)
print("출력층 선형 출력 z2:", z2)
print("최종 예측 y_pred (ReLU):", y_pred)

입력 벡터 x: [[0.5 0.8 0.2]]
은닉층 선형 출력 z1: [[0.8 1.4]]
은닉층 활성화 a1 (ReLU): [[0.8 1.4]]
출력층 선형 출력 z2: [[0.7]]
최종 예측 y_pred (ReLU): [[0.7]]


# **역전파 (직접 미분)**

In [None]:
import numpy as np

# ReLU 함수와 도함수 정의
def ReLU(X):
    return np.maximum(0, X)

def relu_deriv(X):
    return (x > 0).astype(float)
# 입력층 데이터(1*3)
x = np.array([[0.5, 0.8, 0.2]])
# 은닉층 가중치(3*2), 편향(1*2)
W1 = np.array([[1.0, -1.0],
               [0.0, 2.0],
               [1.0, 0.5]])
b1 = np.array([[0.1, 0.2]])
# 은닉층 계산
z1 = x @ W1 + b1
a1 = ReLU(z1)
# 출력층 가중치(2*1), 편향(1*1)
W2 = np.array([[2.0],
               [-1.0]])
b2 = np.array([[0.5]])
# 순전파 계산
z2 = a1 @ W2 + b2
y_pred = ReLU(z2)
# 손실함수
loss = 0.5 * (y_pred - y) ** 2

# --- 역전파 ---

# 출력층 계산
# dL_dW2 = dL_dy * dy_dz2 * dz2_dW2
dL_dy = y_pred - y                     # dL/dy_pred
dy_dz2 = relu_deriv(z2)                # ReLU 미분
dz2 = dL_dy * dy_dz2                   # dL/dz2 (1,1)

dW2 = a1.T @ dz2                       # (2,1)
db2 = dz2                              # (1,1)

# 은닉층 계산
dz1 = dz2 @ W2.T * relu_deriv(z1)      # (1,2)
dW1 = x.T @ dz1                        # (3,2)
db1 = dz1                              # (1,2)

# 가중치 및 편향 업데이트
lr = 0.1

W2 -= lr * dW2
b2 -= lr * db2
W1 -= lr * dW1
b1 -= lr * db1

# 두 번째 순전파

# 결과 출력
print("---순전파---")
print("z1:", z1)
print("a1:", a1)
print("z2:", z2)
print("y_pred:", y_pred)
print("loss:", loss.item())

print("\n---역전파---")
print("dW2:", dW2)
print("db2:", db2)
print("dW1:", dW1)
print("db1:", db1)

print("\n---업데이트 후---")
print("W1:", W1)
print("b1:", b1)
print("W2:", W2)
print("b2:", b2)

print("\n---두 번째 순전파---")
print("z1:", z1_2)
print("a1:", a1_2)
print("z2:", z2_2)
print("y_pred:", y_pred_2)
print("loss:", loss_2.item())

# **역전파(pytorch 사용)**

In [2]:
import torch
# 입력 데이터와 정답
x = torch.tensor([[0.5, 0.8, 0.2]], dtype = torch.float32)
y = torch.tensor([[1.0]], dtype = torch.float32)

# 가중치 및 편향
W1 = torch.tensor([[1.0, -1.0],
                   [0.0, 2.0],
                    [1.0, 0.5]], requires_grad = True)
b1 = torch.tensor([[0.1, 0.2]], dtype = torch.float32, requires_grad = True)

W2 = torch.tensor([[2.0],
                   [-1.0]], dtype=torch.float32, requires_grad=True)

b2 = torch.tensor([[0.5]], dtype=torch.float32, requires_grad=True)

# 순전파

# 역전파

# 파라미터 업데이트

# 두 번째 순전파

# 결과 출력

# **순전파+역전파 for문**

In [None]:

# 입력 데이터와 정답
x = torch.tensor([[0.5, 0.8, 0.2]], dtype = torch.float32)
y = torch.tensor([[1.0]], dtype = torch.float32)

# 가중치 및 편향
W1 = torch.tensor([[1.0, -1.0],
                   [0.0, 2.0],
                    [1.0, 0.5]], requires_grad = True)
b1 = torch.tensor([[0.1, 0.2]], dtype = torch.float32, requires_grad = True)

W2 = torch.tensor([[2.0],
                   [-1.0]], dtype=torch.float32, requires_grad=True)

b2 = torch.tensor([[0.5]], dtype=torch.float32, requires_grad=True)

# 학습 설정


print("---학습 시작---")
