# Linear Regression

## 1. Import Required Libraries

In [1]:
import numpy as np
import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.init as init
from torch.autograd import Variable

## 2. Generate Data

In [2]:
num_data = 1000 #데이터 1000개
num_epochs = 1000 #epoch 1000번

noise = init.normal_(torch.FloatTensor(num_data, 1), std=1) 
#표준편차가 1의, num_data x 1 size의 FloatTensor 생성. 정규분포
x = init.uniform_(torch.Tensor(num_data, 1), -10, 10)
#-10은 균등 분포 최소 값, 10은 균등 분포 최대 값. 균등분포는 모든 요소 확률 같음

#nn.init에서 변수값을 다양한 방식으로 생성 해주는 함수들이 있다. 
#normal, uniform 의 이름이 각각 normal_, uniform_으로 변경되었다.

y = 2*x + 3 #구하려는 값
y_noise = 2*x + 3 + noise #실제 데이터로 주어지는 식은 noise가 끼어 있어 제대로 된 방정식을 구해야 한다.

## 3. Model & Optimizer

In [3]:
class Model(nn.Module):
    def __init__(self, input_dim=1, output_dim=1):
        super(Model, self).__init__()
        self.fc = nn.Linear(input_dim, output_dim) #Linear 모델 (in_features, out_features, bias=True)

    def forward(self, x):
        return self.fc(x)

model = Model() #가중치와 편향은 자동으로 초기화 된다. 사용자가 직접 정의해 줄 수도 있다.
#model.fc.weight, model.fc.bias로 접근 가능하다.

## 4. Train

In [4]:
l_rate = 0.01
criterion = nn.MSELoss() #손실함수
optimizer = optim.SGD(model.parameters(), lr=l_rate) #parameters() 메서드로 해당 객체(모델)의 모든 파라미터를 가져온다.

for i in range(num_epochs):
    optimizer.zero_grad() #optimiser.step으로 업데이트된 그라디언트 값들을 초기화해 줘야 한다.
    #이 코드가 없으면, 그라디언트 값들이 누적되어서 제대로 학습되지 않는다.
    outputs = model.forward(x) #학습
    loss = criterion(outputs, y_noise) #예측한 값과, 정답
    loss.backward() #역전파 해 준다.
    optimizer.step() #변수 업데이트 
    
    if i % 50 == 0:
        print('epoch {}, \tloss {}'.format(i, loss)) #50번 마다 손실 출력
        
#원래는 Tensor 값인 x, y를 Variable로 변환해서 traininig 해야 했지만, 4.0 부터는 Tensor 그대로 넣어도 된다.

epoch 0, 	loss 201.7200164794922
epoch 50, 	loss 2.1498210430145264
epoch 100, 	loss 1.2593387365341187
epoch 150, 	loss 1.140467643737793
epoch 200, 	loss 1.1245994567871094
epoch 250, 	loss 1.1224812269210815
epoch 300, 	loss 1.122198462486267
epoch 350, 	loss 1.1221606731414795
epoch 400, 	loss 1.1221556663513184
epoch 450, 	loss 1.122154951095581
epoch 500, 	loss 1.122154951095581
epoch 550, 	loss 1.1221548318862915
epoch 600, 	loss 1.1221548318862915
epoch 650, 	loss 1.122154951095581
epoch 700, 	loss 1.122154951095581
epoch 750, 	loss 1.122154951095581
epoch 800, 	loss 1.122154951095581
epoch 850, 	loss 1.122154951095581
epoch 900, 	loss 1.122154951095581
epoch 950, 	loss 1.122154951095581


In [5]:
param_list = list(model.parameters())
print(param_list[0].data, param_list[1].data)
#결과값이 실제 값인 2, 3에 근접하게 나온다.

tensor([[1.9985]]) tensor([2.9984])
