<a href="https://colab.research.google.com/github/qw-4735/PyTorch/blob/main/%ED%81%B4%EB%9E%98%EC%8A%A4%EC%97%90%EC%84%9C_%ED%8C%8C%EC%9D%B4%ED%86%A0%EC%B9%98_%EB%AA%A8%EB%8D%B8_%EA%B5%AC%ED%98%84%ED%95%98%EA%B8%B0.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

### nn.Module로 구현하는 선형회귀
- 파이토치에서는 선형 회귀 모델이 nn.Linear()라는 함수로, 평균제곱오차가 nn.functional.mse_loss()라는 함수로 구현되어져 있다.

In [None]:
import torch.nn as nn
model = nn.Linear(input_dim, output_dim)

In [None]:
import torch.nn.functional as F
cost = F.mse_loss(prediction, y_train)

### 클래스로 파이토치 모델 구현하기
- 파이토치는 대부분 모델을 생성할 때 클래스(Class)를 사용

In [None]:
model = nn.Linear(1,1)   # 단순 선형 회귀

In [None]:
class LinearRegressionModel(nn.Module) :   # torch.nn.Module을 상속받는 파이썬 클래스
  def __init__(self):    # 모델의 구조와 동작을 정의하는 생성자를 정의 (파이썬에서 객체가 갖는 속성값을 초기화하는 역할로, 객체가 생성될 때 자동으로 호출)
    super().__init__()   # super()함수를 부르면 여기서 만든 클래스는 nn.Module 클래스의 속성들을 가지고 초기화 됨
    self.linear = nn.Linear(1,1)

  def forward(self,x):   # 모델이 학습데이터를 입력받아서 forward 연산을 진행시키는 함수
    return self.linear(x)  

In [None]:
model = LinearRegressionModel()

### 미니 배치와 데이터 로드 (Mini Batch and Data Load)

1. Mini Batch and Batch Size
- 미니 배치 : 전체 데이터를 더 작은 단위로 나누어서 해당 단위로 학습하는 개념
- batch size : 미니 배치의 크기 (배치 크기는 보통 2의 제곱수를 사용)
- 에포크(Epoch) : 전체 훈련 데이터가 학습에 한 번 사용된 주기

2. 이터레이션 (Iteration)
- 이터레이션 : 한 번의 에포크 내에서 이루어지는 매개변수인 가중치 W와 b의 업데이트 횟수
ex) 전체 데이터가 2,000일 때 배치 크기를 200으로 한다면 이터레이션의 수는 총 10개

3. 데이터 로드하기
- 파이토치에서는 데이터를 좀 더 쉽게 다룰 수 있도록 유용한 도구로서 데이터셋(Dataset)과 데이터로더(DataLoader)를 제공한다. 

이를 사용하면 미니 배치 학습, 데이터 셔플(shuffle), 병렬 처리까지 간단히 수행할 수 있다. 

기본적인 사용 방법은 Dataset을 정의하고, 이를 DataLoader에 전달하는 것.

In [3]:
import torch
import torch.nn as nn
import torch.nn.functional as F


In [4]:
from torch.utils.data import TensorDataset
from torch.utils.data import DataLoader

In [5]:
x_train  =  torch.FloatTensor([[73,  80,  75], 
                               [93,  88,  93], 
                               [89,  91,  90], 
                               [96,  98,  100],   
                               [73,  66,  70]])  
y_train  =  torch.FloatTensor([[152],  [185],  [180],  [196],  [142]])

In [6]:
dataset = TensorDataset(x_train, y_train)

In [8]:
dataloader = DataLoader(dataset, batch_size=2, shuffle = True)  # DataLoader(데이터셋, 미니배치의 크기) 
# shuffle=True : epoch마다 데이터셋을 섞어 데이터가 학습되는 순서를 바꿈

In [10]:
# 모델과 옵티마이저 설계
model = nn.Linear(3,1)
optimizer = torch.optim.SGD(model.parameters(), lr=1e-5)

In [11]:
nb_epochs = 20
for epoch in range(nb_epochs + 1):
  for batch_idx, samples  in enumerate(dataloader):
    x_train, y_train = samples
    prediction = model(x_train)
    cost = F.mse_loss(prediction, y_train)
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()

    print('Epoch {:4d}/{} Batch {}/{} Cost: {:.6f}'.format(
        epoch, nb_epochs, batch_idx+1, len(dataloader),
        cost.item()
        ))

Epoch    0/20 Batch 1/3 Cost: 40856.156250
Epoch    0/20 Batch 2/3 Cost: 13911.839844
Epoch    0/20 Batch 3/3 Cost: 4780.193848
Epoch    1/20 Batch 1/3 Cost: 1408.240234
Epoch    1/20 Batch 2/3 Cost: 320.917358
Epoch    1/20 Batch 3/3 Cost: 45.990734
Epoch    2/20 Batch 1/3 Cost: 62.987236
Epoch    2/20 Batch 2/3 Cost: 20.992451
Epoch    2/20 Batch 3/3 Cost: 1.042558
Epoch    3/20 Batch 1/3 Cost: 12.427022
Epoch    3/20 Batch 2/3 Cost: 4.798541
Epoch    3/20 Batch 3/3 Cost: 2.606469
Epoch    4/20 Batch 1/3 Cost: 10.151554
Epoch    4/20 Batch 2/3 Cost: 4.474984
Epoch    4/20 Batch 3/3 Cost: 1.023451
Epoch    5/20 Batch 1/3 Cost: 4.103814
Epoch    5/20 Batch 2/3 Cost: 8.454391
Epoch    5/20 Batch 3/3 Cost: 5.175667
Epoch    6/20 Batch 1/3 Cost: 4.909663
Epoch    6/20 Batch 2/3 Cost: 8.668618
Epoch    6/20 Batch 3/3 Cost: 4.662255
Epoch    7/20 Batch 1/3 Cost: 9.739295
Epoch    7/20 Batch 2/3 Cost: 2.972342
Epoch    7/20 Batch 3/3 Cost: 10.194913
Epoch    8/20 Batch 1/3 Cost: 6.068103
Epo

In [13]:
# 임의의 값을 넣어 예측값 확인
new_var = torch.FloatTensor([[73, 80,75]])
pred_y = model(new_var)  # 입력 값에 대한 예측값을 리턴받어 pred_y에 저장
print("훈련 후 입력이 73,80,75 일 때의 예측값 :", pred_y)

훈련 후 입력이 73,80,75 일 때의 예측값 : tensor([[154.6161]], grad_fn=<AddmmBackward0>)
