# PyTorch로 시작하는 딥러닝 입문

## 2장 : Linear Regression

https://wikidocs.net/60036

# 2-4 Class Implementation

이전 장에서는 단순선형회귀 모델을 library를 사용하여 구현하였습니다.

In [1]:
import torch
import torch.nn as nn
import torch.nn.functional as F



In [2]:
# 모델을 선언 및 초기화. 단순 선형 회귀이므로 input_dim=1, output_dim=1.
model = nn.Linear(1,1)

이를 class로 구현하면 다음과 같습니다.

In [3]:
class MultivariateLinearRegressionModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.linear = nn.Linear(3, 1) # 다중 선형 회귀이므로 input_dim=3, output_dim=1.

    def forward(self, x):
        return self.linear(x)

In [4]:
model = MultivariateLinearRegressionModel()

## Univariate Linear Regression Model

In [5]:
# 데이터
x_train = torch.FloatTensor([[1], [2], [3]])
y_train = torch.FloatTensor([[2], [4], [6]])

In [6]:
class LinearRegressionModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.linear = nn.Linear(1, 1)

    def forward(self, x):
        return self.linear(x)

In [7]:
model = LinearRegressionModel()

In [8]:
# optimizer 설정. 경사 하강법 SGD를 사용하고 learning rate를 의미하는 lr은 0.01
optimizer = torch.optim.SGD(model.parameters(), lr=0.01) 

In [9]:
# 전체 훈련 데이터에 대해 경사 하강법을 2,000회 반복
nb_epochs = 2000
for epoch in range(nb_epochs+1):

    # H(x) 계산
    prediction = model(x_train)

    # cost 계산
    cost = F.mse_loss(prediction, y_train) # <== 파이토치에서 제공하는 평균 제곱 오차 함수

    # cost로 H(x) 개선하는 부분
    # gradient를 0으로 초기화
    optimizer.zero_grad()
    # 비용 함수를 미분하여 gradient 계산
    cost.backward() # backward 연산
    # W와 b를 업데이트
    optimizer.step()

    if epoch % 100 == 0:
    # 100번마다 로그 출력
      print('Epoch {:4d}/{} Cost: {:.6f}'.format(
          epoch, nb_epochs, cost.item()
      ))

Epoch    0/2000 Cost: 3.235710
Epoch  100/2000 Cost: 0.117913
Epoch  200/2000 Cost: 0.072863
Epoch  300/2000 Cost: 0.045025
Epoch  400/2000 Cost: 0.027823
Epoch  500/2000 Cost: 0.017193
Epoch  600/2000 Cost: 0.010624
Epoch  700/2000 Cost: 0.006565
Epoch  800/2000 Cost: 0.004057
Epoch  900/2000 Cost: 0.002507
Epoch 1000/2000 Cost: 0.001549
Epoch 1100/2000 Cost: 0.000957
Epoch 1200/2000 Cost: 0.000592
Epoch 1300/2000 Cost: 0.000366
Epoch 1400/2000 Cost: 0.000226
Epoch 1500/2000 Cost: 0.000140
Epoch 1600/2000 Cost: 0.000086
Epoch 1700/2000 Cost: 0.000053
Epoch 1800/2000 Cost: 0.000033
Epoch 1900/2000 Cost: 0.000020
Epoch 2000/2000 Cost: 0.000013


In [10]:
print(list(model.parameters()))

[Parameter containing:
tensor([[1.9959]], requires_grad=True), Parameter containing:
tensor([0.0093], requires_grad=True)]


## Multivariate Linear Model

In [11]:
# 데이터
x_train = torch.FloatTensor([[73, 80, 75],
                             [93, 88, 93],
                             [89, 91, 90],
                             [96, 98, 100],
                             [73, 66, 70]])
y_train = torch.FloatTensor([[152], [185], [180], [196], [142]])

In [12]:
class MultivariateLinearRegressionModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.linear = nn.Linear(3, 1) # 다중 선형 회귀이므로 input_dim=3, output_dim=1.

    def forward(self, x):
        return self.linear(x)

In [13]:
model = MultivariateLinearRegressionModel()

In [14]:
optimizer = torch.optim.SGD(model.parameters(), lr=1e-5) 

In [15]:
nb_epochs = 2000
for epoch in range(nb_epochs+1):

    # H(x) 계산
    prediction = model(x_train)
    # model(x_train)은 model.forward(x_train)와 동일함.

    # cost 계산
    cost = F.mse_loss(prediction, y_train) # <== 파이토치에서 제공하는 평균 제곱 오차 함수

    # cost로 H(x) 개선하는 부분
    # gradient를 0으로 초기화
    optimizer.zero_grad()
    # 비용 함수를 미분하여 gradient 계산
    cost.backward()
    # W와 b를 업데이트
    optimizer.step()

    if epoch % 100 == 0:
    # 100번마다 로그 출력
      print('Epoch {:4d}/{} Cost: {:.6f}'.format(
          epoch, nb_epochs, cost.item()
      ))

Epoch    0/2000 Cost: 30255.337891
Epoch  100/2000 Cost: 10.199368
Epoch  200/2000 Cost: 9.670970
Epoch  300/2000 Cost: 9.170458
Epoch  400/2000 Cost: 8.696280
Epoch  500/2000 Cost: 8.247166
Epoch  600/2000 Cost: 7.821729
Epoch  700/2000 Cost: 7.418700
Epoch  800/2000 Cost: 7.036956
Epoch  900/2000 Cost: 6.675336
Epoch 1000/2000 Cost: 6.332810
Epoch 1100/2000 Cost: 6.008299
Epoch 1200/2000 Cost: 5.700940
Epoch 1300/2000 Cost: 5.409776
Epoch 1400/2000 Cost: 5.133981
Epoch 1500/2000 Cost: 4.872685
Epoch 1600/2000 Cost: 4.625251
Epoch 1700/2000 Cost: 4.390803
Epoch 1800/2000 Cost: 4.168709
Epoch 1900/2000 Cost: 3.958354
Epoch 2000/2000 Cost: 3.759071


# 2-5 Mini Batch and Data Load

이번 장에서는 데이터를 로드하는 방법과 미니 배치 경사 하강법에 대해 학습합니다.

## Mini Batch and Batch Size

데이터의 샘플 개수는 5개입니다. 전체 데이터를 하나의 행렬로 선언하여 전체 데이터에 대해서 경사 하강법을 수행하여 학습할 수 있습니다. 그러나 데이터의 개수가 많으면 경사 하강법을 수행하는 것은 매우 느릴 뿐만 아니라 많은 계산이 필요하기에 전체 데이터를 더 적은 단위로 나누어서 해당 단위로 학습하는 개념이 바로 'Mini Batch'입니다.

## Iteration

![](https://wikidocs.net/images/page/36033/batchandepochiteration.PNG)

위의 그림은 epoch와 iteration의 관계를 보여줍니다.

iteration은 한 번의 epoch 내에서 이루어지는 W와 b의 업데이트 횟수입니다. 전체 데이터가 2000개일 때 배치 크기를 200으로 한다면 iteration의 총 개수는 10개이며, 이는 한번의 epoch 당 매개 변수 업데이트가 총 10번이 이루어짐을 의미합니다.

In [16]:
from torch.utils.data import TensorDataset # 텐서데이터셋
from torch.utils.data import DataLoader # 데이터로더

In [17]:
x_train  =  torch.FloatTensor([[73,  80,  75], 
                               [93,  88,  93], 
                               [89,  91,  90], 
                               [96,  98,  100],   
                               [73,  66,  70]])  
y_train  =  torch.FloatTensor([[152],  [185],  [180],  [196],  [142]])

In [18]:
dataset = TensorDataset(x_train, y_train)

In [19]:
dataloader = DataLoader(dataset, batch_size=2, shuffle=True)

In [20]:
model = nn.Linear(3,1)
optimizer = torch.optim.SGD(model.parameters(), lr=1e-5) 

In [22]:
nb_epochs = 20
for epoch in range(nb_epochs + 1):
    for batch_idx, samples in enumerate(dataloader):
        # print(batch_idx)
        # print(samples)
        x_train, y_train = samples
        # H(x) 계산
        prediction = model(x_train)

        # cost 계산
        cost = F.mse_loss(prediction, y_train)

        # cost로 H(x) 계산
        optimizer.zero_grad()
        cost.backward()
        optimizer.step()

        print('Epoch {:4d}/{} Batch {}/{} Cost: {:.6f}'.format(
            epoch, nb_epochs, batch_idx+1, len(dataloader),
            cost.item()
        ))

Epoch    0/20 Batch 1/3 Cost: 25669.121094
Epoch    0/20 Batch 2/3 Cost: 11589.047852
Epoch    0/20 Batch 3/3 Cost: 1572.551025
Epoch    1/20 Batch 1/3 Cost: 987.094849
Epoch    1/20 Batch 2/3 Cost: 345.370544
Epoch    1/20 Batch 3/3 Cost: 112.507042
Epoch    2/20 Batch 1/3 Cost: 37.316460
Epoch    2/20 Batch 2/3 Cost: 15.557783
Epoch    2/20 Batch 3/3 Cost: 0.288372
Epoch    3/20 Batch 1/3 Cost: 9.087434
Epoch    3/20 Batch 2/3 Cost: 4.532706
Epoch    3/20 Batch 3/3 Cost: 4.698104
Epoch    4/20 Batch 1/3 Cost: 7.589594
Epoch    4/20 Batch 2/3 Cost: 3.975832
Epoch    4/20 Batch 3/3 Cost: 5.150841
Epoch    5/20 Batch 1/3 Cost: 5.165402
Epoch    5/20 Batch 2/3 Cost: 6.083657
Epoch    5/20 Batch 3/3 Cost: 5.436021
Epoch    6/20 Batch 1/3 Cost: 5.072534
Epoch    6/20 Batch 2/3 Cost: 7.467512
Epoch    6/20 Batch 3/3 Cost: 1.840523
Epoch    7/20 Batch 1/3 Cost: 6.919503
Epoch    7/20 Batch 2/3 Cost: 3.790645
Epoch    7/20 Batch 3/3 Cost: 5.449834
Epoch    8/20 Batch 1/3 Cost: 5.039405
Epoch 

In [23]:
# 임의의 입력 [73, 80, 75]를 선언
new_var =  torch.FloatTensor([[73, 80, 75]]) 
# 입력한 값 [73, 80, 75]에 대해서 예측값 y를 리턴받아서 pred_y에 저장
pred_y = model(new_var) 
print("훈련 후 입력이 73, 80, 75일 때의 예측값 :", pred_y) 

훈련 후 입력이 73, 80, 75일 때의 예측값 : tensor([[153.8058]], grad_fn=<AddmmBackward0>)


# 2-6 Custom Dataset

Custom Dataset을 만들 때 필요한 뼈대는 다음과 같습니다.
- __init__(self)
- __len__(self)
- __getitem__(self,idx)

In [None]:
class CustomDataset(torch.utils.data.Dataset): 
    def __init__(self):
    #데이터셋의 전처리를 해주는 부분

    def __len__(self):
    #데이터셋의 길이. 즉, 총 샘플의 수를 적어주는 부분

    def __getitem__(self, idx): 
    #데이터셋에서 특정 1개의 샘플을 가져오는 함수

In [24]:
from torch.utils.data import Dataset
from torch.utils.data import DataLoader

In [25]:
# Dataset 상속
class CustomDataset(Dataset): 
    def __init__(self):
        self.x_data = [[73, 80, 75],
                   [93, 88, 93],
                   [89, 91, 90],
                   [96, 98, 100],
                   [73, 66, 70]]
        self.y_data = [[152], [185], [180], [196], [142]]

  # 총 데이터의 개수를 리턴
    def __len__(self): 
        return len(self.x_data)

  # 인덱스를 입력받아 그에 맵핑되는 입출력 데이터를 파이토치의 Tensor 형태로 리턴
    def __getitem__(self, idx): 
        x = torch.FloatTensor(self.x_data[idx])
        y = torch.FloatTensor(self.y_data[idx])
        return x, y

In [26]:
dataset = CustomDataset()
dataloader = DataLoader(dataset, batch_size=2, shuffle=True)

In [27]:
model = torch.nn.Linear(3,1)
optimizer = torch.optim.SGD(model.parameters(), lr=1e-5) 

In [28]:
nb_epochs = 20
for epoch in range(nb_epochs + 1):
    for batch_idx, samples in enumerate(dataloader):
        # print(batch_idx)
        # print(samples)
        x_train, y_train = samples
        # H(x) 계산
        prediction = model(x_train)

        # cost 계산
        cost = F.mse_loss(prediction, y_train)

        # cost로 H(x) 계산
        optimizer.zero_grad()
        cost.backward()
        optimizer.step()

        print('Epoch {:4d}/{} Batch {}/{} Cost: {:.6f}'.format(
            epoch, nb_epochs, batch_idx+1, len(dataloader),
            cost.item()
        ))

Epoch    0/20 Batch 1/3 Cost: 54910.296875
Epoch    0/20 Batch 2/3 Cost: 17123.638672
Epoch    0/20 Batch 3/3 Cost: 6263.274902
Epoch    1/20 Batch 1/3 Cost: 1475.178589
Epoch    1/20 Batch 2/3 Cost: 739.200256
Epoch    1/20 Batch 3/3 Cost: 54.084068
Epoch    2/20 Batch 1/3 Cost: 41.328583
Epoch    2/20 Batch 2/3 Cost: 37.951141
Epoch    2/20 Batch 3/3 Cost: 30.595739
Epoch    3/20 Batch 1/3 Cost: 4.381040
Epoch    3/20 Batch 2/3 Cost: 8.683412
Epoch    3/20 Batch 3/3 Cost: 3.241110
Epoch    4/20 Batch 1/3 Cost: 8.190666
Epoch    4/20 Batch 2/3 Cost: 5.888869
Epoch    4/20 Batch 3/3 Cost: 2.526730
Epoch    5/20 Batch 1/3 Cost: 5.523765
Epoch    5/20 Batch 2/3 Cost: 3.203250
Epoch    5/20 Batch 3/3 Cost: 17.217131
Epoch    6/20 Batch 1/3 Cost: 6.739715
Epoch    6/20 Batch 2/3 Cost: 4.840462
Epoch    6/20 Batch 3/3 Cost: 11.832987
Epoch    7/20 Batch 1/3 Cost: 9.487991
Epoch    7/20 Batch 2/3 Cost: 4.223427
Epoch    7/20 Batch 3/3 Cost: 10.913296
Epoch    8/20 Batch 1/3 Cost: 11.016167
E

In [29]:
# 임의의 입력 [73, 80, 75]를 선언
new_var =  torch.FloatTensor([[73, 80, 75]]) 
# 입력한 값 [73, 80, 75]에 대해서 예측값 y를 리턴받아서 pred_y에 저장
pred_y = model(new_var) 
print("훈련 후 입력이 73, 80, 75일 때의 예측값 :", pred_y) 

훈련 후 입력이 73, 80, 75일 때의 예측값 : tensor([[154.0621]], grad_fn=<AddmmBackward0>)
