# 1.선형 회귀(Linear Regression)

## 4. 파이토치로 선형 회귀 구현하기

### 1. 기본 셋팅

In [1]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

In [2]:
# 현재 실습하고 있는 파이썬 코드를 재실행해도 다음에도 같은 결과가 나오도록 랜덤 시드(random seed)를 줍니다.
torch.manual_seed(1)

<torch._C.Generator at 0x2173a4896d0>

### 2. 변수 선언

In [3]:
x_train = torch.FloatTensor([[1], [2], [3]])
y_train = torch.FloatTensor([[2], [4], [6]])

In [4]:
print(x_train)
print(x_train.shape)

tensor([[1.],
        [2.],
        [3.]])
torch.Size([3, 1])


In [5]:
print(y_train)
print(y_train.shape)

tensor([[2.],
        [4.],
        [6.]])
torch.Size([3, 1])


### 3. 가중치와 편향의 초기화

In [6]:
# 가중치 W를 0으로 초기화하고 학습을 통해 값이 변경되는 변수임을 명시함.
W = torch.zeros(1, requires_grad=True) 
# 가중치 W를 출력
print(W) 

tensor([0.], requires_grad=True)


In [7]:
b = torch.zeros(1, requires_grad=True)
print(b)

tensor([0.], requires_grad=True)


### 4. 가설 세우기

In [8]:
hypothesis = x_train * W + b
print(hypothesis)

tensor([[0.],
        [0.],
        [0.]], grad_fn=<AddBackward0>)


### 5. 비용 함수 선언하기

In [9]:
cost = torch.mean((hypothesis - y_train) ** 2)
print(cost)

tensor(18.6667, grad_fn=<MeanBackward0>)


### 6. 경사 하강법 구현하기

In [10]:
optimizer = optim.SGD([W, b], lr = 0.01)

In [11]:
optimizer.zero_grad() # gradient를 0으로 초기화
cost.backward() # 미분 구하기
optimizer.step() # W, b를 update

### 7. 전체 코드

In [12]:
x_train = torch.FloatTensor([[1], [2], [3]])
y_train = torch.FloatTensor([[2], [4], [6]])

W = torch.zeros(1, requires_grad=True) 
b = torch.zeros(1, requires_grad=True)

optimizer = optim.SGD([W, b], lr = 0.01)

nb_epochs = 2000
for epoch in range(nb_epochs+1):
    h = x_train * W + b
    cost = torch.mean((y_train - h) ** 2)

    optimizer.zero_grad()
    cost.backward()
    optimizer.step()

    if epoch % 100 == 0:
         print('Epoch {:4d}/{} W: {:.3f}, b: {:.3f} Cost: {:.6f}'.format(
            epoch, nb_epochs, W.item(), b.item(), cost.item()
        ))
    

Epoch    0/2000 W: 0.187, b: 0.080 Cost: 18.666666
Epoch  100/2000 W: 1.746, b: 0.578 Cost: 0.048171
Epoch  200/2000 W: 1.800, b: 0.454 Cost: 0.029767
Epoch  300/2000 W: 1.843, b: 0.357 Cost: 0.018394
Epoch  400/2000 W: 1.876, b: 0.281 Cost: 0.011366
Epoch  500/2000 W: 1.903, b: 0.221 Cost: 0.007024
Epoch  600/2000 W: 1.924, b: 0.174 Cost: 0.004340
Epoch  700/2000 W: 1.940, b: 0.136 Cost: 0.002682
Epoch  800/2000 W: 1.953, b: 0.107 Cost: 0.001657
Epoch  900/2000 W: 1.963, b: 0.084 Cost: 0.001024
Epoch 1000/2000 W: 1.971, b: 0.066 Cost: 0.000633
Epoch 1100/2000 W: 1.977, b: 0.052 Cost: 0.000391
Epoch 1200/2000 W: 1.982, b: 0.041 Cost: 0.000242
Epoch 1300/2000 W: 1.986, b: 0.032 Cost: 0.000149
Epoch 1400/2000 W: 1.989, b: 0.025 Cost: 0.000092
Epoch 1500/2000 W: 1.991, b: 0.020 Cost: 0.000057
Epoch 1600/2000 W: 1.993, b: 0.016 Cost: 0.000035
Epoch 1700/2000 W: 1.995, b: 0.012 Cost: 0.000022
Epoch 1800/2000 W: 1.996, b: 0.010 Cost: 0.000013
Epoch 1900/2000 W: 1.997, b: 0.008 Cost: 0.000008

## 5. optimizer.zero_grad()가 필요한 이유

파이토치는 미분을 통해 얻은 기울기를 이전에 계산된 기울기 값에 누적시키는 특징이 있습니다

In [13]:
import torch
w = torch.tensor(2.0, requires_grad=True)

nb_epochs = 20
for epoch in range(nb_epochs + 1):

  z = 2*w

  z.backward()
  print('수식을 w로 미분한 값 : {}'.format(w.grad))


수식을 w로 미분한 값 : 2.0
수식을 w로 미분한 값 : 4.0
수식을 w로 미분한 값 : 6.0
수식을 w로 미분한 값 : 8.0
수식을 w로 미분한 값 : 10.0
수식을 w로 미분한 값 : 12.0
수식을 w로 미분한 값 : 14.0
수식을 w로 미분한 값 : 16.0
수식을 w로 미분한 값 : 18.0
수식을 w로 미분한 값 : 20.0
수식을 w로 미분한 값 : 22.0
수식을 w로 미분한 값 : 24.0
수식을 w로 미분한 값 : 26.0
수식을 w로 미분한 값 : 28.0
수식을 w로 미분한 값 : 30.0
수식을 w로 미분한 값 : 32.0
수식을 w로 미분한 값 : 34.0
수식을 w로 미분한 값 : 36.0
수식을 w로 미분한 값 : 38.0
수식을 w로 미분한 값 : 40.0
수식을 w로 미분한 값 : 42.0


# 2. 자동 미분 (Autograd)

autograd을 사용하려면
1. 미분할 텐서(변수) 선언할 때 requires_grad = True을 해야하고
2. 2. backward()를 할 최종 output이 scalar 형태여야 한다.

In [21]:
w = torch.tensor(2.0, requires_grad=True) 
# w 텐서에 대한 기울기를 저장하겠다는 의미로
# w.grad 에 기울기가 저장된다.

In [22]:
y = w ** 2
z = 2*y + 5 # z 함수 정의

In [23]:
z.backward() # z 함수를 w에 대해 미분값을 구한다. requires_grad=True한 값을 구하게 되는 것
print(f'수식을 w로 미분한 값: {w.grad}') # #가 속한 수식을 w로 미분한 값이 저장되었음

수식을 w로 미분한 값: 8.0


# 3. 다중 선형 회귀 (Multivariable Linear regression)

## 4.행렬 연산을 고려하여 파이토치로 구현하기

In [26]:
x_train  =  torch.FloatTensor([[73,  80,  75], 
                               [93,  88,  93], 
                               [89,  91,  80], 
                               [96,  98,  100],   
                               [73,  66,  70]])  
y_train  =  torch.FloatTensor([[152],  [185],  [180],  [196],  [142]])

In [25]:
print(x_train.shape)
print(y_train.shape)

torch.Size([5, 3])
torch.Size([5, 1])


In [28]:
# 가중치와 편향 선언
W = torch.zeros((3, 1), requires_grad=True) # 데이터 feature 개수만큼 weight 선언
b = torch.zeros(1, requires_grad=True)

In [29]:
x_train  =  torch.FloatTensor([[73,  80,  75], 
                               [93,  88,  93], 
                               [89,  91,  80], 
                               [96,  98,  100],   
                               [73,  66,  70]])  
y_train  =  torch.FloatTensor([[152],  [185],  [180],  [196],  [142]])

W = torch.zeros((3, 1), requires_grad=True) 
b = torch.zeros(1, requires_grad=True)

optimizer = optim.SGD([W, b], lr = 1e-5)
nb_epochs = 20

for epoch in range(nb_epochs+1):
    h = x_train.matmul(W) + b
    cost = torch.mean((h - y_train) ** 2 )

    optimizer.zero_grad()
    cost.backward()
    optimizer.step()
    print('Epoch {:4d}/{} hypothesis: {} Cost: {:.6f}'.format(
        epoch, nb_epochs, hypothesis.squeeze().detach(), cost.item()
    ))

Epoch    0/20 hypothesis: tensor([0., 0., 0.]) Cost: 29661.800781
Epoch    1/20 hypothesis: tensor([0., 0., 0.]) Cost: 9537.694336
Epoch    2/20 hypothesis: tensor([0., 0., 0.]) Cost: 3069.590088
Epoch    3/20 hypothesis: tensor([0., 0., 0.]) Cost: 990.670898
Epoch    4/20 hypothesis: tensor([0., 0., 0.]) Cost: 322.482086
Epoch    5/20 hypothesis: tensor([0., 0., 0.]) Cost: 107.717064
Epoch    6/20 hypothesis: tensor([0., 0., 0.]) Cost: 38.687496
Epoch    7/20 hypothesis: tensor([0., 0., 0.]) Cost: 16.499043
Epoch    8/20 hypothesis: tensor([0., 0., 0.]) Cost: 9.365656
Epoch    9/20 hypothesis: tensor([0., 0., 0.]) Cost: 7.071114
Epoch   10/20 hypothesis: tensor([0., 0., 0.]) Cost: 6.331847
Epoch   11/20 hypothesis: tensor([0., 0., 0.]) Cost: 6.092532
Epoch   12/20 hypothesis: tensor([0., 0., 0.]) Cost: 6.013817
Epoch   13/20 hypothesis: tensor([0., 0., 0.]) Cost: 5.986785
Epoch   14/20 hypothesis: tensor([0., 0., 0.]) Cost: 5.976325
Epoch   15/20 hypothesis: tensor([0., 0., 0.]) Cost:

# 4. nn.Module로 구현하는 선형 회귀

### 1. 단순 선형 회귀 구현하기

In [4]:
import torch
import torch.nn as nn
import torch.nn.functional as F

In [5]:
torch.manual_seed(1)

<torch._C.Generator at 0x27a98f76c10>

In [18]:
x_train = torch.FloatTensor([[1], [2], [3]])
y_train = torch.FloatTensor([[2], [4], [6]])

# input_dim = 1, output_dim = 1
model = nn.Linear(1, 1)

In [19]:
print(list(model.parameters())) # 첫 번째 값이 W, 두 번째 값이 b

[Parameter containing:
tensor([[-0.1939]], requires_grad=True), Parameter containing:
tensor([0.4694], requires_grad=True)]


In [20]:
optimizer = torch.optim.SGD(model.parameters(), lr = 0.01)

In [21]:
nb_epochs = 2000
for epoch in range(nb_epochs + 1):
    pred = model(x_train)
    cost = F.mse_loss(pred, y_train)

    optimizer.zero_grad()
    cost.backward() # loss 함수로부터 미분값을 구해야 하므로 cost에 backward 연산을 한다.
    optimizer.step()

    if epoch % 100 == 0:
        print('Epoch {:4d}/{} Cost: {:.6f}'.format(
          epoch, nb_epochs, cost.item()
      ))

Epoch    0/2000 Cost: 18.562185
Epoch  100/2000 Cost: 0.128051
Epoch  200/2000 Cost: 0.079128
Epoch  300/2000 Cost: 0.048896
Epoch  400/2000 Cost: 0.030215
Epoch  500/2000 Cost: 0.018671
Epoch  600/2000 Cost: 0.011538
Epoch  700/2000 Cost: 0.007129
Epoch  800/2000 Cost: 0.004406
Epoch  900/2000 Cost: 0.002722
Epoch 1000/2000 Cost: 0.001682
Epoch 1100/2000 Cost: 0.001040
Epoch 1200/2000 Cost: 0.000642
Epoch 1300/2000 Cost: 0.000397
Epoch 1400/2000 Cost: 0.000245
Epoch 1500/2000 Cost: 0.000152
Epoch 1600/2000 Cost: 0.000094
Epoch 1700/2000 Cost: 0.000058
Epoch 1800/2000 Cost: 0.000036
Epoch 1900/2000 Cost: 0.000022
Epoch 2000/2000 Cost: 0.000014


In [23]:
new_var = torch.FloatTensor([[4.0]])
pred_y = model(new_var)
print("훈련 후 입력이 4일 때의 예측값 :", pred_y)

훈련 후 입력이 4일 때의 예측값 : tensor([[7.9926]], grad_fn=<AddmmBackward0>)


In [24]:
print(list(model.parameters())) 
# W의 값이 2에 가깝고, b의 값이 0에 가까움

[Parameter containing:
tensor([[1.9957]], requires_grad=True), Parameter containing:
tensor([0.0097], requires_grad=True)]


### 2. 다중 선형 회귀 구현하기

In [26]:
import torch
import torch.nn as nn
import torch.nn.functional as F

In [27]:
torch.manual_seed(1)

<torch._C.Generator at 0x27a98f76c10>

In [35]:
# 데이터
x_train = torch.FloatTensor([[73, 80, 75],
                             [93, 88, 93],
                             [89, 91, 90],
                             [96, 98, 100],
                             [73, 66, 70]])
y_train = torch.FloatTensor([[152], [185], [180], [196], [142]])

In [36]:
model = nn.Linear(3, 1) # input_dim=3, output_dim=1

In [37]:
print(list(model.parameters()))

[Parameter containing:
tensor([[ 0.0803, -0.0707,  0.1601]], requires_grad=True), Parameter containing:
tensor([0.0285], requires_grad=True)]


In [38]:
optimizer = torch.optim.SGD(model.parameters(), lr=1e-5)

In [39]:
nb_epochs - 2000

for epoch in range(nb_epochs+1):
    pred = model(x_train)
    cost = F.mse_loss(pred, y_train)

    optimizer.zero_grad()
    cost.backward()
    optimizer.step()

    if epoch % 100 == 0:
    # 100번마다 로그 출력
      print('Epoch {:4d}/{} Cost: {:.6f}'.format(
          epoch, nb_epochs, cost.item()
      ))

Epoch    0/2000 Cost: 24821.373047
Epoch  100/2000 Cost: 0.849148
Epoch  200/2000 Cost: 0.825597
Epoch  300/2000 Cost: 0.803225
Epoch  400/2000 Cost: 0.781968
Epoch  500/2000 Cost: 0.761779
Epoch  600/2000 Cost: 0.742587
Epoch  700/2000 Cost: 0.724357
Epoch  800/2000 Cost: 0.707025
Epoch  900/2000 Cost: 0.690548
Epoch 1000/2000 Cost: 0.674883
Epoch 1100/2000 Cost: 0.659985
Epoch 1200/2000 Cost: 0.645810
Epoch 1300/2000 Cost: 0.632342
Epoch 1400/2000 Cost: 0.619514
Epoch 1500/2000 Cost: 0.607307
Epoch 1600/2000 Cost: 0.595689
Epoch 1700/2000 Cost: 0.584616
Epoch 1800/2000 Cost: 0.574081
Epoch 1900/2000 Cost: 0.564045
Epoch 2000/2000 Cost: 0.554474


In [41]:
# 임의의 입력 [73, 80, 75]를 선언
new_var =  torch.FloatTensor([[73, 80, 75]]) 
# 입력한 값 [73, 80, 75]에 대해서 예측값 y를 리턴받아서 pred_y에 저장
pred_y = model(new_var) 
print("훈련 후 입력이 73, 80, 75일 때의 예측값 :", pred_y) 

훈련 후 입력이 73, 80, 75일 때의 예측값 : tensor([[151.6526]], grad_fn=<AddmmBackward0>)


In [42]:
print(list(model.parameters()))

[Parameter containing:
tensor([[0.7497, 0.4868, 0.7725]], requires_grad=True), Parameter containing:
tensor([0.0386], requires_grad=True)]


# 5. 클래스로 파이토치 모델 구현하기

## 1. 모델을 클래스로 구현하기

In [43]:
model = nn.Linear(1, 1)

In [46]:
class LinearRegressionModel(nn.Module): # nn.Module 을 상속
    def __init__(self):
        super().__init__() # 부모 클래스인 nn.Module의 속성들을 불러옴
        self.linear = nn.Linear(1, 1)
    def forward(self, x):
        return self.linear(x)

In [47]:
model = LinearRegressionModel()

In [49]:
model = nn.Linear(3, 1)

In [50]:
class MultivariateLinearRegressionModel(nn.Module): # nn.Module 을 상속
    def __init__(self):
        super().__init__() # 부모 클래스인 nn.Module의 속성들을 불러옴
        self.linear = nn.Linear(3, 1) # fature가 3개인 데이터이고 output은 1개인 회귀모델
    def forward(self, x):
        return self.linear(x)

In [51]:
model = MultivariateLinearRegressionModel()

## 2. 단순 선형 회귀 클래스로 구현하기

In [53]:
import torch
import torch.nn as nn
import torch.nn.functional as F

In [54]:
torch.manual_seed(1)

<torch._C.Generator at 0x27a98f76c10>

In [55]:
x_train = torch.FloatTensor([[1], [2], [3]])
y_train = torch.FloatTensor([[2], [4], [6]])

In [63]:
class LinearRegressionModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.linear = nn.Linear(1, 1)
    def forward(self, x):
        return self.linear(x)

In [64]:
model = LinearRegressionModel()

In [65]:
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

In [67]:
nb_epochs = 2000
for epoch in range(nb_epochs+1):
    pred = model(x_train)
    cost = F.mse_loss(pred, y_train)

    # gradient를 0으로 초기화
    optimizer.zero_grad()
    # 비용 함수를 미분하여 gradient 계산
    cost.backward()
    # W와 b를 업데이트
    optimizer.step()

    if epoch % 100 == 0:
    # 100번마다 로그 출력
      print('Epoch {:4d}/{} Cost: {:.6f}'.format(
          epoch, nb_epochs, cost.item()
      ))

Epoch    0/2000 Cost: 0.000014
Epoch  100/2000 Cost: 0.000008
Epoch  200/2000 Cost: 0.000005
Epoch  300/2000 Cost: 0.000003
Epoch  400/2000 Cost: 0.000002
Epoch  500/2000 Cost: 0.000001
Epoch  600/2000 Cost: 0.000001
Epoch  700/2000 Cost: 0.000000
Epoch  800/2000 Cost: 0.000000
Epoch  900/2000 Cost: 0.000000
Epoch 1000/2000 Cost: 0.000000
Epoch 1100/2000 Cost: 0.000000
Epoch 1200/2000 Cost: 0.000000
Epoch 1300/2000 Cost: 0.000000
Epoch 1400/2000 Cost: 0.000000
Epoch 1500/2000 Cost: 0.000000
Epoch 1600/2000 Cost: 0.000000
Epoch 1700/2000 Cost: 0.000000
Epoch 1800/2000 Cost: 0.000000
Epoch 1900/2000 Cost: 0.000000
Epoch 2000/2000 Cost: 0.000000


## 3. 다중 선형 회귀 클래스로 구현하기

In [68]:
import torch
import torch.nn as nn
import torch.nn.functional as F

In [69]:
torch.manual_seed(1)

<torch._C.Generator at 0x27a98f76c10>

In [71]:
# 데이터
x_train = torch.FloatTensor([[73, 80, 75],
                             [93, 88, 93],
                             [89, 91, 90],
                             [96, 98, 100],
                             [73, 66, 70]])
y_train = torch.FloatTensor([[152], [185], [180], [196], [142]])

In [72]:
class MultivariateLinearRegressionModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.linear = nn.Linear(3, 1)

    def forward(self, x):
        return self.linear(x)


In [73]:
model = MultivariateLinearRegressionModel()

In [74]:
optimizer = torch.optim.SGD(model.parameters(), lr=1e-5)

In [76]:
nb_epochs = 2000
for epoch in range(nb_epochs + 1):
    pred = model.forward(x_train)
    cost = F.mse_loss(pred, y_train)

    optimizer.zero_grad()
    cost.backward()
    optimizer.step()

    if epoch % 100 == 0:
    # 100번마다 로그 출력
      print('Epoch {:4d}/{} Cost: {:.6f}'.format(
          epoch, nb_epochs, cost.item()
      ))


Epoch    0/2000 Cost: 31667.599609
Epoch  100/2000 Cost: 0.225993
Epoch  200/2000 Cost: 0.223911
Epoch  300/2000 Cost: 0.221941
Epoch  400/2000 Cost: 0.220059
Epoch  500/2000 Cost: 0.218271
Epoch  600/2000 Cost: 0.216575
Epoch  700/2000 Cost: 0.214950
Epoch  800/2000 Cost: 0.213413
Epoch  900/2000 Cost: 0.211952
Epoch 1000/2000 Cost: 0.210559
Epoch 1100/2000 Cost: 0.209230
Epoch 1200/2000 Cost: 0.207967
Epoch 1300/2000 Cost: 0.206762
Epoch 1400/2000 Cost: 0.205618
Epoch 1500/2000 Cost: 0.204529
Epoch 1600/2000 Cost: 0.203481
Epoch 1700/2000 Cost: 0.202486
Epoch 1800/2000 Cost: 0.201539
Epoch 1900/2000 Cost: 0.200634
Epoch 2000/2000 Cost: 0.199770


# 6. mini batch and data load

## 3. 데이터 로드하기(Data Load)

In [123]:
import torch
import torch.nn as nn
import torch.nn.functional as F

In [124]:
from torch.utils.data import TensorDataset
from torch.utils.data import DataLoader

In [125]:
x_train  =  torch.FloatTensor([[73,  80,  75], 
                               [93,  88,  93], 
                               [89,  91,  90], 
                               [96,  98,  100],   
                               [73,  66,  70]])  
y_train  =  torch.FloatTensor([[152],  [185],  [180],  [196],  [142]])

In [126]:
dataset = TensorDataset(x_train, y_train)

In [127]:
dataloader = DataLoader(dataset, batch_size=2, shuffle=True) 
# TensorDataset으로 파이토치의 데이터 셋을 먼저 만들고 나서 DataLoader를 사용할 수 있다.
# batch_size를 설정해 미니 배치의 크기를 설정한다. 보통 2의 제곱수로 사용
# 그리고 모델이 순서를 외울 수도 있으니 shuffle을 사용해서 epoch 마다 데이터를 섞어 준다.

In [131]:
model = nn.Linear(3, 1)
optimizer = torch.optim.SGD(model.parameters(), lr=1e-5)

In [132]:
nb_epochs = 20
for epoch in range(nb_epochs+1):
    for batch_idx, samples in enumerate(dataloader):
        # print(batch_idx)
        # print(samples)
        x_train, y_train = samples
        # print(len(x_train))
        pred = model(x_train) # 배치로 들어가도 잘 계산해줌
        cost = F.mse_loss(pred, y_train)

        optimizer.zero_grad()
        cost.backward()
        optimizer.step()

        print('Epoch {:4d}/{} Batch {}/{} Cost: {:.6f}'.format(
            epoch, nb_epochs, batch_idx+1, len(dataloader), cost.item()))

# dataloader를 사용하면 데이터하고 라벨이 묶여져서 나옴

Epoch    0/20 Batch 1/3 Cost: 7761.881836
Epoch    0/20 Batch 2/3 Cost: 5664.168945
Epoch    0/20 Batch 3/3 Cost: 1622.372559
Epoch    1/20 Batch 1/3 Cost: 251.180710
Epoch    1/20 Batch 2/3 Cost: 65.123856
Epoch    1/20 Batch 3/3 Cost: 34.578045
Epoch    2/20 Batch 1/3 Cost: 11.471296
Epoch    2/20 Batch 2/3 Cost: 0.460203
Epoch    2/20 Batch 3/3 Cost: 10.230608
Epoch    3/20 Batch 1/3 Cost: 3.953969
Epoch    3/20 Batch 2/3 Cost: 3.473601
Epoch    3/20 Batch 3/3 Cost: 8.707434
Epoch    4/20 Batch 1/3 Cost: 8.175498
Epoch    4/20 Batch 2/3 Cost: 3.441955
Epoch    4/20 Batch 3/3 Cost: 5.132642
Epoch    5/20 Batch 1/3 Cost: 7.066340
Epoch    5/20 Batch 2/3 Cost: 3.582833
Epoch    5/20 Batch 3/3 Cost: 6.347807
Epoch    6/20 Batch 1/3 Cost: 4.335005
Epoch    6/20 Batch 2/3 Cost: 6.324486
Epoch    6/20 Batch 3/3 Cost: 0.933870
Epoch    7/20 Batch 1/3 Cost: 2.911813
Epoch    7/20 Batch 2/3 Cost: 5.324221
Epoch    7/20 Batch 3/3 Cost: 9.607294
Epoch    8/20 Batch 1/3 Cost: 2.368210
Epoch    8

In [92]:
# 임의의 입력 [73, 80, 75]를 선언
new_var =  torch.FloatTensor([[73, 80, 75]]) 
# 입력한 값 [73, 80, 75]에 대해서 예측값 y를 리턴받아서 pred_y에 저장
pred_y = model(new_var) 
print("훈련 후 입력이 73, 80, 75일 때의 예측값 :", pred_y) 

훈련 후 입력이 73, 80, 75일 때의 예측값 : tensor([[151.3689]], grad_fn=<AddmmBackward0>)


# 7. Custom Dataset

## 1. custom dataset

In [93]:
class CustomDataset(torch.utils.data.Dataset): 
  def __init__(self):
  데이터셋의 전처리를 해주는 부분

  def __len__(self):
  데이터셋의 길이. 즉, 총 샘플의 수를 적어주는 부분

  def __getitem__(self, idx): 
  데이터셋에서 특정 1개의 샘플을 가져오는 함수

IndentationError: expected an indented block after function definition on line 2 (2187119077.py, line 3)

## 2. 커스텀 데이터셋(Custom Dataset)으로 선형 회귀 구현하기

In [94]:
import torch
import torch.nn.functional as F
from torch.utils.data import Dataset
from torch.utils.data import DataLoader

In [100]:
class CustomDataset(Dataset):
    def __init__(self):
        self.x_data = [[73, 80, 75],
                   [93, 88, 93],
                   [89, 91, 90],
                   [96, 98, 100],
                   [73, 66, 70]]
        self.y_data = [[152], [185], [180], [196], [142]]
    def __len__(self):
        return len(self.x_data)

    def __getitem__(self, idx):
        x = torch.FloatTensor(self.x_data[idx])
        y = torch.FloatTensor(self.y_data[idx])
        return x, y

In [101]:
dataset = CustomDataset()
dataloader = DataLoader(dataset, batch_size=2, shuffle=True)

In [102]:
model = torch.nn.Linear(3, 1)
optimizer = torch.optim.SGD(model.parameters(), lr=1e-5)

In [103]:
nb_epochs = 20
for epoch in range(nb_epochs+1):
    for idx, batch in enumerate(dataloader):
        x, y = batch
        pred = model(x)
        cost = F.mse_loss(pred, y)

        optimizer.zero_grad()
        cost.backward()
        optimizer.step()
        
        print('Epoch {:4d}/{} Batch {}/{} Cost: {:.6f}'.format(
        epoch, nb_epochs, batch_idx+1, len(dataloader),
        cost.item()
        ))


Epoch    0/20 Batch 3/3 Cost: 5576.881348
Epoch    0/20 Batch 3/3 Cost: 1094.447754
Epoch    0/20 Batch 3/3 Cost: 265.588135
Epoch    1/20 Batch 3/3 Cost: 135.388229
Epoch    1/20 Batch 3/3 Cost: 74.801147
Epoch    1/20 Batch 3/3 Cost: 29.130114
Epoch    2/20 Batch 3/3 Cost: 5.268149
Epoch    2/20 Batch 3/3 Cost: 4.836893
Epoch    2/20 Batch 3/3 Cost: 0.347430
Epoch    3/20 Batch 3/3 Cost: 6.045506
Epoch    3/20 Batch 3/3 Cost: 2.811426
Epoch    3/20 Batch 3/3 Cost: 0.133708
Epoch    4/20 Batch 3/3 Cost: 4.438363
Epoch    4/20 Batch 3/3 Cost: 1.438310
Epoch    4/20 Batch 3/3 Cost: 0.872224
Epoch    5/20 Batch 3/3 Cost: 3.842663
Epoch    5/20 Batch 3/3 Cost: 1.330946
Epoch    5/20 Batch 3/3 Cost: 3.675620
Epoch    6/20 Batch 3/3 Cost: 1.001568
Epoch    6/20 Batch 3/3 Cost: 3.032052
Epoch    6/20 Batch 3/3 Cost: 4.115198
Epoch    7/20 Batch 3/3 Cost: 2.267543
Epoch    7/20 Batch 3/3 Cost: 3.700738
Epoch    7/20 Batch 3/3 Cost: 0.541011
Epoch    8/20 Batch 3/3 Cost: 4.737659
Epoch    8/20

In [104]:
# 임의의 입력 [73, 80, 75]를 선언
new_var =  torch.FloatTensor([[73, 80, 75]]) 
# 입력한 값 [73, 80, 75]에 대해서 예측값 y를 리턴받아서 pred_y에 저장
pred_y = model(new_var) 
print("훈련 후 입력이 73, 80, 75일 때의 예측값 :", pred_y) 


훈련 후 입력이 73, 80, 75일 때의 예측값 : tensor([[152.1021]], grad_fn=<AddmmBackward0>)


# 8. 벡터와 행렬 연산 복습하기

In [105]:
import numpy as np

## 2. Tensor

In [106]:
d = np.array(5)
print('텐서의 차원 :',d.ndim)
print('텐서의 크기(shape) :',d.shape)

텐서의 차원 : 0
텐서의 크기(shape) : ()


In [107]:
d = np.array([1, 2, 3, 4])
print('텐서의 차원 :',d.ndim)
print('텐서의 크기(shape) :',d.shape)

텐서의 차원 : 1
텐서의 크기(shape) : (4,)


In [108]:
d = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])
print('텐서의 차원 :',d.ndim)
print('텐서의 크기(shape) :',d.shape)

텐서의 차원 : 2
텐서의 크기(shape) : (3, 4)


In [109]:
d = np.array([
    [[1, 2, 3, 4, 5], 
     [6, 7, 8, 9, 10], 
     [11, 12, 13, 14, 15]],
    [[16, 17, 18, 19, 20], 
     [21, 22, 23, 24, 25], 
     [26, 27, 28, 29, 30]]
])
print('텐서의 차원 :',d.ndim)
print('텐서의 크기(shape) :',d.shape)

텐서의 차원 : 3
텐서의 크기(shape) : (2, 3, 5)


## 3. 벡터와 행렬의 연산

In [113]:
a = np.array([8, 4, 5])
b = np.array([1, 2, 3])
print(f'a+b:\n{a+b}')
print(f'a-b:\n{a-b}')

a+b:
[9 6 8]
a-b:
[7 2 2]


In [112]:
a = np.array([[10, 20, 30, 40],[50, 60, 70, 80]])
b = np.array([[5, 6, 7, 8], [1, 2, 3, 4]])
print(f'a+b:\n{a+b}')
print(f'a-b:\n{a-b}')

a+b:
[[15 26 37 48]
 [51 62 73 84]]
a-b:
[[ 5 14 23 32]
 [49 58 67 76]]


In [120]:
a = np.array([1, 2, 3])
b = np.array([4, 5, 6]) 
# a, b 모두 행 벡터이나 자동으로 b를 열벡터로 바꿔서 벡터의 내적 연산을 한다.
print(f'a.dot(b):\n{a.dot(b)}')

a.dot(b):
32


In [116]:
a = np.array([[1, 3], [2, 4]])
b = np.array([[5, 7], [6, 8]])
print('두 행렬의 행렬곱 :')
print(np.matmul(a, b))

두 행렬의 행렬곱 :
[[23 31]
 [34 46]]


In [119]:
print('두 행렬의 원소곱 :')
print(f'a*b:\n{a*b}') # 같은 위치의 원소끼리 곱한다

두 행렬의 원소곱 :
a*b:
[[ 5 21]
 [12 32]]
