In [1]:
import torch
import torch.nn as nn
import torch.nn.functional as F

from torch.utils.data import TensorDataset # 텐서데이터셋
from torch.utils.data import DataLoader # 데이터로더

x_train  =  torch.FloatTensor([[73,  80,  75], 
                               [93,  88,  93], 
                               [89,  91,  90], 
                               [96,  98,  100],   
                               [73,  66,  70]])  
y_train  =  torch.FloatTensor([[152],  [185],  [180],  [196],  [142]])


dataset = TensorDataset(x_train, y_train)
dataloader = DataLoader(dataset, batch_size=2, shuffle=True)
model = nn.Linear(3,1)
optimizer = torch.optim.SGD(model.parameters(), lr=1e-5) 

nb_epochs = 20
for epoch in range(nb_epochs + 1):
    for batch_idx, samples in enumerate(dataloader):
        # print(batch_idx)
        # print(samples)
        x_train, y_train = samples
        # H(x) 계산
        prediction = model(x_train)

        # cost 계산
        cost = F.mse_loss(prediction, y_train)

        # cost로 H(x) 계산
        optimizer.zero_grad()
        cost.backward()
        optimizer.step()

        print('Epoch {:4d}/{} Batch {}/{} Cost: {:.6f}'.format(
        epoch, nb_epochs, batch_idx+1, len(dataloader),
        cost.item()
        ))

Epoch    0/20 Batch 1/3 Cost: 13733.040039
Epoch    0/20 Batch 2/3 Cost: 9919.441406
Epoch    0/20 Batch 3/3 Cost: 2511.637695
Epoch    1/20 Batch 1/3 Cost: 337.573883
Epoch    1/20 Batch 2/3 Cost: 259.616760
Epoch    1/20 Batch 3/3 Cost: 20.213762
Epoch    2/20 Batch 1/3 Cost: 2.269041
Epoch    2/20 Batch 2/3 Cost: 32.336998
Epoch    2/20 Batch 3/3 Cost: 18.946589
Epoch    3/20 Batch 1/3 Cost: 12.611603
Epoch    3/20 Batch 2/3 Cost: 17.382507
Epoch    3/20 Batch 3/3 Cost: 6.383765
Epoch    4/20 Batch 1/3 Cost: 18.330069
Epoch    4/20 Batch 2/3 Cost: 7.698470
Epoch    4/20 Batch 3/3 Cost: 1.519842
Epoch    5/20 Batch 1/3 Cost: 21.336020
Epoch    5/20 Batch 2/3 Cost: 14.641094
Epoch    5/20 Batch 3/3 Cost: 0.524793
Epoch    6/20 Batch 1/3 Cost: 23.397800
Epoch    6/20 Batch 2/3 Cost: 13.471424
Epoch    6/20 Batch 3/3 Cost: 0.408350
Epoch    7/20 Batch 1/3 Cost: 8.478343
Epoch    7/20 Batch 2/3 Cost: 16.768883
Epoch    7/20 Batch 3/3 Cost: 1.940421
Epoch    8/20 Batch 1/3 Cost: 2.435824


그런데 torch.utils.data.Dataset을 상속받아 직접 커스텀 데이터셋(Custom Dataset)을 만드는 경우도 있습니다. torch.utils.data.Dataset은 파이토치에서 데이터셋을 제공하는 추상 클래스입니다. Dataset을 상속받아 다음 메소드들을 오버라이드 하여 커스텀 데이터셋을 만들어보겠습니다.

커스텀 데이터셋을 만들 때, 일단 가장 기본적인 뼈대는 아래와 같습니다. 여기서 필요한 기본적인 define은 3개입니다.


In [4]:
from torch.utils.data import Dataset
from torch.utils.data import DataLoader
# Dataset 상속
class CustomDataset(Dataset): 
    def __init__(self):
        self.x_data = [[73, 80, 75],
                       [93, 88, 93],
                       [89, 91, 90],
                       [96, 98, 100],
                       [73, 66, 70]]
        self.y_data = [[152], [185], [180], [196], [142]]

    # 총 데이터의 개수를 리턴
    def __len__(self): 
        return len(self.x_data)

    # 인덱스를 입력받아 그에 맵핑되는 입출력 데이터를 파이토치의 Tensor 형태로 리턴
    def __getitem__(self, idx): 
        x = torch.FloatTensor(self.x_data[idx])
        y = torch.FloatTensor(self.y_data[idx])
        return x, y

In [5]:
dataset = CustomDataset()
dataloader = DataLoader(dataset, batch_size=2, shuffle=True)

In [6]:
model = torch.nn.Linear(3,1)
optimizer = torch.optim.SGD(model.parameters(), lr=1e-5) 

In [7]:
nb_epochs = 20
for epoch in range(nb_epochs + 1):
    for batch_idx, samples in enumerate(dataloader):
        # print(batch_idx)
        # print(samples)
        x_train, y_train = samples
        # H(x) 계산
        prediction = model(x_train)

        # cost 계산
        cost = F.mse_loss(prediction, y_train)

        # cost로 H(x) 계산
        optimizer.zero_grad()
        cost.backward()
        optimizer.step()

        print('Epoch {:4d}/{} Batch {}/{} Cost: {:.6f}'.format(
            epoch, nb_epochs, batch_idx+1, len(dataloader),
            cost.item()
            ))

Epoch    0/20 Batch 1/3 Cost: 82313.851562
Epoch    0/20 Batch 2/3 Cost: 14804.573242
Epoch    0/20 Batch 3/3 Cost: 3770.150391
Epoch    1/20 Batch 1/3 Cost: 2357.720703
Epoch    1/20 Batch 2/3 Cost: 875.120911
Epoch    1/20 Batch 3/3 Cost: 210.651993
Epoch    2/20 Batch 1/3 Cost: 93.159332
Epoch    2/20 Batch 2/3 Cost: 27.276926
Epoch    2/20 Batch 3/3 Cost: 0.393013
Epoch    3/20 Batch 1/3 Cost: 0.721254
Epoch    3/20 Batch 2/3 Cost: 13.352104
Epoch    3/20 Batch 3/3 Cost: 12.394835
Epoch    4/20 Batch 1/3 Cost: 4.056162
Epoch    4/20 Batch 2/3 Cost: 6.100291
Epoch    4/20 Batch 3/3 Cost: 14.676980
Epoch    5/20 Batch 1/3 Cost: 8.788025
Epoch    5/20 Batch 2/3 Cost: 3.827166
Epoch    5/20 Batch 3/3 Cost: 4.773014
Epoch    6/20 Batch 1/3 Cost: 7.683258
Epoch    6/20 Batch 2/3 Cost: 5.986654
Epoch    6/20 Batch 3/3 Cost: 2.297767
Epoch    7/20 Batch 1/3 Cost: 9.423034
Epoch    7/20 Batch 2/3 Cost: 4.449766
Epoch    7/20 Batch 3/3 Cost: 2.552018
Epoch    8/20 Batch 1/3 Cost: 1.857221
Ep

In [8]:
# 임의의 입력 [73, 80, 75]를 선언
new_var =  torch.FloatTensor([[73, 80, 75]]) 
# 입력한 값 [73, 80, 75]에 대해서 예측값 y를 리턴받아서 pred_y에 저장
pred_y = model(new_var) 
print("훈련 후 입력이 73, 80, 75일 때의 예측값 :", pred_y) 

훈련 후 입력이 73, 80, 75일 때의 예측값 : tensor([[153.6048]], grad_fn=<AddmmBackward>)
