# 1. 데이터 정의

## 1.1. Tensor Data 정의
* 파이토치 기본 데이터 타입은 Tensor이므로 모든 데이터는 먼저 텐서로 생성시켜야함

In [3]:
import torch

x_train=torch.Tensor([1,2,3,4,5,6]).view(6,1)
y_train=torch.Tensor([3,4,5,6,7,8]).view(6,1)

## 1.2. DataSet/DataLoader 데이터 정의
* 파이토치에서는 데이터를 좀 더 쉽게 다룰 수 있도록 TensorDataset과 DataLoader를 제공함.
* 이를 사용하면 미니배치 학습 데이터 셔플(shuffle), 멀티 프로세싱 등을 간단하게 수정할 수 있음

In [5]:
import torch
from torch.utils.data import TensorDataset
from torch.utils.data import DataLoader


x_train=torch.Tensor([1,2,3,4,5,6]).view(6,1)
y_train=torch.Tensor([3,4,5,6,7,8]).view(6,1)

dataset=TensorDataset(x_train,y_train) #텐서 데이터 생성

dataloader=DataLoader(dataset, batch_size=32,shuffle=True)

# 2.신경망 모델 구축
* Pytorch에서 신경망 모델은 nn.Module을 상속받는 클래스를 생성하여 정의하는 것이 일반적임
* 클래스 __init__함수에서 신경말 모델을 구성하는 다양항 계층 등을 정의하고
* forward함수에서 신경망에 데이터를 어떻게 전달할지, 즉 포워드를 수행하고 결과값을 리턴함

## 2.1 모델 클래스 정의 (Layers+forward정의)

In [8]:
import torch
from torch import nn

class MyNeuralNetwork(nn.Module):

    #신경망 모델을 구성하는 계층 정의
    #입력데이터 1개 출력 데이터 1개
    def __init__(self):
        super().__init__()
        self.flatten=nn.Flatten()
        self.linear_relu_stack= nn.Sequential(
           nn.Linear(1,1)
        )

    # 피드포워드를 수행하고 결과값을 리턴함
    def forward(self,x):
        x=self.flatten(x)
        logits=self.linear_relu_stack(x)

        return logits



## 2.2 피드포워드/손실함수/모델 파라미터 최적화
* 모델을 학습하려면 피드 포워드 계산 값과 정답의 차이인 오차(loss)를 계산하는 손실함수(loss function)와 옵티마이저(optimizer)가 필요함
* 각 학습 단계에서 모델은 학습 데이터셋에 대한 예측을 수행하고, 오차(loss)를 역전파하여 모델의 파라미터를 최적화 시킴

In [10]:
import torch 
from torch import nn

model=MyNeuralNetwork()

# 손실함수 정의
#일반적인 회귀regression 데이터에서는 nn.MSELoss()를,
#분류 classifiacion 데이터에서는 nn.CrossEntropyLoss()를 사용

loss_function = nn.MSELoss()

# 옵티마이저 정의
# 옵티마이저에도 확률적 경사하강법 이외에도, ADAM, FMSProp 등의 다양한 옵티마이저가 있음

optimizer=torch.optim.SGD(model.parameters(),lr=1e-2)

In [11]:
# 반복적인 학습을 진행, for문을 통해 학습 중간 과정을 출력
nums_epochs =2000

for epoch in range(nums_epochs+1):

    prediction=model(x_train) #모델에 데이터를 전달하면 model class의 forward()함수가 자동으로 진행
    loss=loss_function(prediction,y_train) #피드포워드 계산 값과 정답값의 오차를 계산

    #역전파 코드 
    optimizer.zero_grad()
    loss.backward() 
    optimizer.step()

    if epoch%100==0:
        loss_val=loss.item()
        print('epoch=',epoch,'current loss=',loss_val)

epoch= 0 current loss= 32.52552795410156
epoch= 100 current loss= 0.5413830280303955
epoch= 200 current loss= 0.2605785131454468
epoch= 300 current loss= 0.12542152404785156
epoch= 400 current loss= 0.060367897152900696
epoch= 500 current loss= 0.02905631624162197
epoch= 600 current loss= 0.013985454104840755
epoch= 700 current loss= 0.006731476169079542
epoch= 800 current loss= 0.003239987650886178
epoch= 900 current loss= 0.0015594608848914504
epoch= 1000 current loss= 0.0007506075198762119
epoch= 1100 current loss= 0.00036127775092609227
epoch= 1200 current loss= 0.0001738895516609773
epoch= 1300 current loss= 8.369737770408392e-05
epoch= 1400 current loss= 4.028180774184875e-05
epoch= 1500 current loss= 1.9388991859159432e-05
epoch= 1600 current loss= 9.332107765658293e-06
epoch= 1700 current loss= 4.49232129540178e-06
epoch= 1800 current loss= 2.1626240140903974e-06
epoch= 1900 current loss= 1.0411837365609244e-06
epoch= 2000 current loss= 5.01161991905974e-07


In [23]:
x_test=torch.Tensor([-3.1,-3.0,1.2,-2.5]).view(4,1)

pred=model(x_test)
pred

tensor([[-1.1028],
        [-1.0027],
        [ 3.1988],
        [-0.5025]], grad_fn=<AddmmBackward0>)