In [24]:
'''
공부한 시간             2  2  2  3  4  4
학원에서 공부한 시간    0  1  2  1  1  2
과외로 공부한 시간      0  0  1  1  2  2
점수                   50 60 65 70 75 85

일반 선형 회귀 : H = Wx + b
다중 선형 회귀 : H = W1x1 + W2x2 + w3x3 + b
'''

import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

In [25]:
x1_train = torch.FloatTensor([[2], [2], [2], [3], [4], [4]])
x2_train = torch.FloatTensor([[0], [1], [2], [1], [1], [2]])
x3_train = torch.FloatTensor([[0], [0], [1], [1], [2], [2]])
y_train = torch.FloatTensor([[50], [60], [65], [70], [75], [85]])

In [26]:
W1 = torch.zeros(1, requires_grad=True)
W2 = torch.zeros(1, requires_grad=True)
W3 = torch.zeros(1, requires_grad=True)
b = torch.zeros(1, requires_grad=True)

In [27]:
optimizer = optim.SGD([W1, W2, W3, b], lr=1e-5)
tot_epochs = 100000

for epoch in range(1, tot_epochs+1):
    H = x1_train*W1 + x2_train*W2 + x3_train*W3 + b
    cost = torch.mean((H - y_train) ** 2)

    optimizer.zero_grad()
    cost.backward()
    optimizer.step()

    if epoch % 1000 == 0:
        print('Epoch {:4d}/{} W1:{:.3f} W2:{:.3f} W3:{:.3f} b:{:.3f} Cost:{:.6f}'.format(epoch, tot_epochs, \
            W1.item(), W2.item(), W3.item(), b.item(), cost.item()))

Epoch 1000/100000 W1:3.537 W2:1.491 W3:1.329 b:1.201 Cost:2877.384521
Epoch 2000/100000 W1:6.286 W2:2.654 W3:2.339 b:2.150 Cost:1787.713501
Epoch 3000/100000 W1:8.425 W2:3.564 W3:3.102 b:2.902 Cost:1129.312134
Epoch 4000/100000 W1:10.088 W2:4.275 W3:3.673 b:3.502 Cost:731.253967
Epoch 5000/100000 W1:11.382 W2:4.834 W3:4.094 b:3.982 Cost:490.365387
Epoch 6000/100000 W1:12.389 W2:5.273 W3:4.400 b:4.371 Cost:344.359711
Epoch 7000/100000 W1:13.174 W2:5.619 W3:4.616 b:4.687 Cost:255.638123
Epoch 8000/100000 W1:13.785 W2:5.893 W3:4.763 b:4.948 Cost:201.503922
Epoch 9000/100000 W1:14.262 W2:6.112 W3:4.855 b:5.165 Cost:168.256287
Epoch 10000/100000 W1:14.634 W2:6.286 W3:4.906 b:5.349 Cost:147.624023
Epoch 11000/100000 W1:14.925 W2:6.427 W3:4.925 b:5.505 Cost:134.613876
Epoch 12000/100000 W1:15.153 W2:6.542 W3:4.918 b:5.642 Cost:126.211769
Epoch 13000/100000 W1:15.331 W2:6.636 W3:4.892 b:5.762 Cost:120.598236
Epoch 14000/100000 W1:15.472 W2:6.715 W3:4.851 b:5.869 Cost:116.674614
Epoch 15000/100

In [28]:
x_train = torch.FloatTensor([[2, 0, 0], [2, 1, 0], [2, 2, 1], [3, 1, 1], [4, 1, 2], [4, 2, 2]])
y_train = torch.FloatTensor([[50], [60], [65], [70], [75], [85]])

In [29]:
print(x_train.shape)
print(y_train.shape)

torch.Size([6, 3])
torch.Size([6, 1])


In [30]:
W = torch.zeros((3, 1), requires_grad=True)
b = torch.zeros(1, requires_grad=True)

optimizer = optim.SGD([W, b], lr=1e-5)

tot_epochs = 100000

# x_train: torch.Size([6, 3])
# W: torch.Size([3, 1])
# ([6, 3])([3, 1])

for epoch in range(1, tot_epochs+1):

    H = x_train.matmul(W) + b
    cost = torch.mean((H - y_train) ** 2)

    optimizer.zero_grad()
    cost.backward()
    optimizer.step()

    if epoch % 1000 == 0:
        print('Epoch {:4d}/{} H:{} Cost:{:.6f}'.format(epoch, tot_epochs, H.squeeze().detach(), cost.item()))

Epoch 1000/100000 H:tensor([ 8.2672,  9.7566, 12.5737, 14.6179, 19.4792, 20.9686]) Cost:2877.384521
Epoch 2000/100000 H:tensor([14.7168, 17.3700, 22.3616, 25.9923, 34.6146, 37.2678]) Cost:1787.713501
Epoch 3000/100000 H:tensor([19.7469, 23.3096, 29.9737, 34.8338, 46.3579, 49.9207]) Cost:1129.312134
Epoch 4000/100000 H:tensor([23.6738, 27.9485, 35.8955, 41.7073, 55.4660, 59.7407]) Cost:731.253967
Epoch 5000/100000 H:tensor([26.7436, 31.5767, 40.5039, 47.0517, 62.5266, 67.3597]) Cost:490.365387
Epoch 6000/100000 H:tensor([29.1473, 34.4195, 44.0918, 51.2080, 67.9965, 73.2687]) Cost:344.359772
Epoch 7000/100000 H:tensor([31.0333, 36.6520, 46.8868, 54.4413, 72.2306, 77.8493]) Cost:255.638123
Epoch 8000/100000 H:tensor([32.5170, 38.4100, 49.0658, 56.9573, 75.5046, 81.3977]) Cost:201.503922
Epoch 9000/100000 H:tensor([33.6879, 39.7994, 50.7661, 58.9161, 78.0328, 84.1443]) Cost:168.256287
Epoch 10000/100000 H:tensor([34.6157, 40.9020, 52.0944, 60.4418, 79.9816, 86.2679]) Cost:147.624039
Epoch 

### 배치

* 전체 데이터를 작은 단위로 나눠서 해당 단위로 학습하는 개념
* 배치 학습을 하게 되면 배치만큼만 가져가서 배치에 대한 비용(cost)를 계산하고 경사하강법을 수행
* 배치를 가져가서 경사 하강하강법을 수행하고 마지막 배치까지 이를 반복
* 전체 데이터에 대한 학습이 모두 끝나면 1에폭이 끝나게 됨
* 배치 크기(batch size)는 보통 2의 제곱수를 사용(CPU와 GPU의 메모리가 2의 배수이므로 배치 크기가 2의 제곱수일 경우 데이터의 송수신이 효율적임)

In [31]:
x_train = torch.FloatTensor([[2, 0, 0], [2, 1, 0], [2, 2, 1], [3, 1, 1], [4, 1, 2], [4, 2, 2]])
y_train = torch.FloatTensor([[50], [60], [65], [70], [75], [85]])

### 데이터로더

* 데이터를 좀 더 쉽게 나눌 수 있도록 데이터셋과 데이터로더를 파이토치 및 텐서플로우에서 제공
* 배치학습, 데이터사용, 병렬처리 등을 간단하게 수행

In [32]:
from torch.utils.data import TensorDataset
from torch.utils.data import DataLoader

In [33]:
# batch_size = 2 : 각 minbatch의 크기(한 번에 배치 안에 있는 샘플 사이즈)
# shuffle = True : Epoch마다 데이터셋을 섞어 데이터가 학습되는 순서를 바꿈. True 권장. 데이터가 쏠리는 것을 방지

dataset = TensorDataset(x_train, y_train) # 데이터셋을 만들어줌
dataloader = DataLoader(dataset, batch_size=2, shuffle=True)

In [34]:
model = nn.Linear(3, 1) # 3개 입력 받아서 1개 출력하겠다는 의미
optimizer = torch.optim.SGD(model.parameters(), lr=1e-5)

In [35]:
epoch_count = 5000
# len(dataloader) : 한 epoch 당 minbatch 계수
# 데이터셋 전체 길이를 batch라고 한다면 batch_size를 2로 하면 총 3개의 데이터가 나오는데 3개 중 하나를 미니배치라고 함

for epoch in range(epoch_count + 1):
    for batch_idx, datas in enumerate(dataloader):
        x_train, y_train = datas
        H = model(x_train)
        cost = F.mse_loss(H, y_train)

        optimizer.zero_grad()
        cost.backward()
        optimizer.step()

        print('Epoch:{:4d}/{} Batch:{}/{} Cost:{:.6f}'.format(epoch, epoch_count, batch_idx+1, len(dataloader), cost.item()))

[1;30;43m스트리밍 출력 내용이 길어서 마지막 5000줄이 삭제되었습니다.[0m
Epoch:3334/5000 Batch:2/3 Cost:92.225906
Epoch:3334/5000 Batch:3/3 Cost:158.021271
Epoch:3335/5000 Batch:1/3 Cost:188.701752
Epoch:3335/5000 Batch:2/3 Cost:135.272552
Epoch:3335/5000 Batch:3/3 Cost:129.761383
Epoch:3336/5000 Batch:1/3 Cost:205.196304
Epoch:3336/5000 Batch:2/3 Cost:16.738264
Epoch:3336/5000 Batch:3/3 Cost:231.684006
Epoch:3337/5000 Batch:1/3 Cost:129.749847
Epoch:3337/5000 Batch:2/3 Cost:44.832542
Epoch:3337/5000 Batch:3/3 Cost:278.877106
Epoch:3338/5000 Batch:1/3 Cost:278.799622
Epoch:3338/5000 Batch:2/3 Cost:16.813768
Epoch:3338/5000 Batch:3/3 Cost:157.726517
Epoch:3339/5000 Batch:1/3 Cost:114.755714
Epoch:3339/5000 Batch:2/3 Cost:203.477859
Epoch:3339/5000 Batch:3/3 Cost:134.935516
Epoch:3340/5000 Batch:1/3 Cost:16.858492
Epoch:3340/5000 Batch:2/3 Cost:278.620605
Epoch:3340/5000 Batch:3/3 Cost:157.579529
Epoch:3341/5000 Batch:1/3 Cost:157.537888
Epoch:3341/5000 Batch:2/3 Cost:188.384079
Epoch:3341/5000 Batch:3/3 Cost:

In [36]:
val = torch.FloatTensor([[5, 2, 3]])
pred = model(val)
print('학습 후 입력이 5, 2, 3 일 때 예측값: ', pred)

학습 후 입력이 5, 2, 3 일 때 예측값:  tensor([[112.2409]], grad_fn=<AddmmBackward0>)


In [37]:
print(list(model.parameters()))

[Parameter containing:
tensor([[15.7747,  6.2253,  5.0323]], requires_grad=True), Parameter containing:
tensor([5.8199], requires_grad=True)]
