구현해볼 내용
공부 시간에 따른 성적 예측 모델
$$ H(x) = Wx + b $$
$$ cost(W, b) = \frac{1}{m} \sum^m_{i=1} \left( H(x^{(i)}) - y^{(i)} \right)^2 $$
- H(x)$: 주어진 $x$ 값에 대해 예측을 어떻게 할 것인가  

- cost(W, b)$: $H(x)$ 가 $y$ 를 얼마나 잘 예측했는가

In [1]:

import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

In [2]:
# 데이터 X,Y 선언부분
x_train = torch.FloatTensor([[1], [2], [3]])
y_train = torch.FloatTensor([[1], [2], [3]])

##weight 와 bias 초기화 부분.
- 0으로 초기화 시킴
- requires_grad 옵션 -> Ture 설정 시, 학습할 것이라고 명시

In [3]:
# weight 와 bias 초기화 부분.
W = torch.zeros(1,requires_grad=True)
b = torch.zeros(1,requires_grad=True)

# 가설 설정 
hypothesis = x_train * W + b

Cost
$$ cost(W, b) = \frac{1}{m} \sum^m_{i=1} \left( H(x^{(i)}) - y^{(i)} \right)^2 $$
Mean Square Error(MSE) 라고 함

In [5]:
# cost function
cost = torch.mean((hypothesis - y_train) ** 2)

# optimizer 선언부. 
# W,b 는 학습할 tensor 들,  ir -> learning rate 를 의마함
optimizer = optim.SGD([W,b],lr= 0.01)

epochs = 1000

 # cost function
cost = torch.mean((hypothesis - y_train) ** 2)

optimizer.zero_grad()       # grad 초기화
cost.backward()             # grad 계산
optimizer.step()            # grad 적용 및 개선

# 코드 전체 학습 부분

In [7]:
x_train = torch.FloatTensor([[1], [2], [3]])
y_train = torch.FloatTensor([[1], [2], [3]])
# 모델 초기화
W = torch.zeros(1, requires_grad=True)
b = torch.zeros(1, requires_grad=True)
# optimizer 설정
optimizer = optim.SGD([W, b], lr=0.01)

epochs = 1000
for epoch in range(epochs + 1):
    
    # H(x) 계산
    hypothesis = x_train * W + b
    
    # cost 계산
    cost = torch.mean((hypothesis - y_train) ** 2)

    optimizer.zero_grad()
    cost.backward()
    optimizer.step()

    # 100번마다 로그 출력
    if epoch % 100 == 0:
        print('Epoch {:4d}/{} W: {:.3f}, b: {:.3f} Cost: {:.6f}'.format(
            epoch, epochs, W.item(), b.item(), cost.item()
        ))

Epoch    0/1000 W: 0.093, b: 0.040 Cost: 4.666667
Epoch  100/1000 W: 0.873, b: 0.289 Cost: 0.012043
Epoch  200/1000 W: 0.900, b: 0.227 Cost: 0.007442
Epoch  300/1000 W: 0.921, b: 0.179 Cost: 0.004598
Epoch  400/1000 W: 0.938, b: 0.140 Cost: 0.002842
Epoch  500/1000 W: 0.951, b: 0.110 Cost: 0.001756
Epoch  600/1000 W: 0.962, b: 0.087 Cost: 0.001085
Epoch  700/1000 W: 0.970, b: 0.068 Cost: 0.000670
Epoch  800/1000 W: 0.976, b: 0.054 Cost: 0.000414
Epoch  900/1000 W: 0.981, b: 0.042 Cost: 0.000256
Epoch 1000/1000 W: 0.985, b: 0.033 Cost: 0.000158


#nn.module 사용하기
**pytorh 에서 사용하는 모델은 nn.Module을 상속하여 만든다.**
- 모델의 __init__에서는 사용할 레이어들을 정의
- forward 는 어떻게 입력값에서 출력값을 계산하는지 알려줌

In [8]:
class LinearRegressionModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.linear = nn.Linear(1, 1)

    def forward(self, x):
        return self.linear(x)

# 전체 코드

In [9]:
# 데이터
x_train = torch.FloatTensor([[1], [2], [3]])
y_train = torch.FloatTensor([[1], [2], [3]])
# 모델 초기화
model = LinearRegressionModel()
# optimizer 설정
optimizer = optim.SGD(model.parameters(), lr=0.01)

nb_epochs = 1000
for epoch in range(nb_epochs + 1):
    
    # H(x) 계산
    prediction = model(x_train)
    
    # cost 계산
    cost = F.mse_loss(prediction, y_train)
    
    # cost로 H(x) 개선
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()
    
    # 100번마다 로그 출력
    if epoch % 100 == 0:
        params = list(model.parameters())
        W = params[0].item()
        b = params[1].item()
        print('Epoch {:4d}/{} W: {:.3f}, b: {:.3f} Cost: {:.6f}'.format(
            epoch, nb_epochs, W, b, cost.item()
        ))

Epoch    0/1000 W: 0.222, b: -0.137 Cost: 4.131519
Epoch  100/1000 W: 0.941, b: 0.135 Cost: 0.002626
Epoch  200/1000 W: 0.953, b: 0.106 Cost: 0.001623
Epoch  300/1000 W: 0.963, b: 0.083 Cost: 0.001003
Epoch  400/1000 W: 0.971, b: 0.066 Cost: 0.000620
Epoch  500/1000 W: 0.977, b: 0.052 Cost: 0.000383
Epoch  600/1000 W: 0.982, b: 0.041 Cost: 0.000237
Epoch  700/1000 W: 0.986, b: 0.032 Cost: 0.000146
Epoch  800/1000 W: 0.989, b: 0.025 Cost: 0.000090
Epoch  900/1000 W: 0.991, b: 0.020 Cost: 0.000056
Epoch 1000/1000 W: 0.993, b: 0.015 Cost: 0.000034
