In [3]:
import torch

# 데이터 정의
x_data = torch.tensor([[1.0], [2.0], [3.0]])
y_data = torch.tensor([[3.0], [6.0], [9.0]])

W = torch.randn(1, requires_grad=True)
b = torch.randn(1, requires_grad=True)

# 학습률 설정
learning_rate = 0.1

# 학습 루프
for step in range(1001):
    # 선형 모델 계산: h = x * W + b
    h = x_data * W + b

    # 비용 함수: 평균 제곱 오차 (MSE)
    cost = torch.mean((h - y_data) ** 2)

    # 그래디언트 초기화 → 역전파 → 파라미터 수동 업데이트
    cost.backward()

    with torch.no_grad():
        W -= learning_rate * W.grad
        b -= learning_rate * b.grad
        W.grad.zero_()
        b.grad.zero_()

    # 100 step마다 출력
    if step % 100 == 0:
        print(f"Step {step:4d} | Cost: {cost.item():.4f} | W: {W.item():.4f} | b: {b.item():.4f}")

# 최종 예측 결과 출력
print("\n예측 결과:")
print((x_data * W + b).detach().numpy())


Step    0 | Cost: 0.5532 | W: 2.6613 | b: 0.8472
Step  100 | Cost: 0.0008 | W: 2.9678 | b: 0.0732
Step  200 | Cost: 0.0000 | W: 2.9972 | b: 0.0064
Step  300 | Cost: 0.0000 | W: 2.9998 | b: 0.0006
Step  400 | Cost: 0.0000 | W: 3.0000 | b: 0.0000
Step  500 | Cost: 0.0000 | W: 3.0000 | b: 0.0000
Step  600 | Cost: 0.0000 | W: 3.0000 | b: 0.0000
Step  700 | Cost: 0.0000 | W: 3.0000 | b: 0.0000
Step  800 | Cost: 0.0000 | W: 3.0000 | b: 0.0000
Step  900 | Cost: 0.0000 | W: 3.0000 | b: 0.0000
Step 1000 | Cost: 0.0000 | W: 3.0000 | b: 0.0000

예측 결과:
[[3.]
 [6.]
 [9.]]
