## 데이터 작업하기
파이토치(PyTorch)에는 데이터 작업을 위한 기본 요소 두가지인 torch.utils.data.DataLoader 와 torch.utils.data.Dataset 가 있습니다.


`Dataset` 은 샘플과 정답(label)을 저장하고, `DataLoader` 는 Dataset 을 반복 가능한 객체(iterable)로 감쌉니다.

In [2]:
import torch
from torch import nn 
from torch.utils.data import DataLoader
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda, Compose
import matplotlib.pyplot as plt

PyTorch는 `TorchText`, `TorchVision` 및 `TorchAudio` 와 같이 `도메인 특화 라이브러리를 데이터셋과 함께 제공`하고 있습니다. 이 튜토리얼에서는 TorchVision 데이터셋을 사용하도록 하겠습니다.

torchvision.datasets 모듈은 CIFAR, COCO 등과 같은 다양한 실제 비전(vision) 데이터에 대한 Dataset(전체 목록은 여기)을 포함하고 있습니다. 이 튜토리얼에서는 `FasionMNIST 데이터셋`을 사용합니다.

모든 TorchVision Dataset 은 샘플과 정답을 각각 변경하기 위한 `transform` 과 `target_transform` 의 두 인자를 포함합니다.

In [5]:
# 공개 데이터셋에서 학습 데이터를 내려받습니다.
training_data = datasets.FashionMNIST(
    root = "data",
    train = True,
    download=True,
    transform = ToTensor(),
)

#공개 데이터셋에서 테스트 데이터를 내려받습니다.
test_data = datasets.FashionMNIST(
    root = "data",
    train = False, 
    download = True,
    transform = ToTensor(),
)

In [9]:
print(len(training_data))
print(len(test_data))

60000
10000


`Dataset` 을 `DataLoader 의 인자로 전달`합니다.

이는 데이터셋을 `반복 가능한 객체(iterable)`로 감싸고, 자동화된 `배치(batch)`, `샘플링(sampling)`, `섞기(shuffle)` 및 `다중 프로세스로 데이터 불러오기(multiprocess data loading)`를 지원합니다.

여기서는 배치 크기(batch size)를 64로 정의합니다. 즉, 데이터로더(dataloader) 객체의 각 요소는 64개의 특징(feature)과 정답(label)을 묶음(batch)으로 반환합니다.

In [15]:
batch_size = 64

# 데이터로더를 생성합니다.
train_dataloader = DataLoader(training_data, batch_size=batch_size)
test_dataloader = DataLoader(test_data, batch_size = batch_size)

In [24]:
# for X, y in test_dataloader : 
#    print("Shape of X [N, C, H, W] : ", X.shape)
#    print("Shape of y: " , y.shape, y.dtype)
    
# Shape of X [N, C, H, W] :  torch.Size([64, 1, 28, 28])
# Shape of y:  torch.Size([64]) torch.int64

------------------------------------------

## 모델 만들기

신경망 모델은 `nn.Module` 을 상속받는 클래스(class)를 생성하여 정의합니다. 

`__init__` 함수에서 `신경망의 계층(layer)들을 정의`하고 
`forward` 함수에서 `신경망에 데이터를 어떻게 전달할지 지정`합니다.
가능한 경우 GPU로 신경망을 이동시켜 연산을 가속(accelerate)합니다.

In [14]:
# 학습에 사용할 CPU나 GPU 장치를 얻습니다.
device = "cuda" if torch.cuda.is_available() else "cpu"
print("Using {} device".format(device))

Using cpu device


super() : 자식 클래스에서 부모클래스의 내용을 사용하고 싶을경우 사용  

PyTorch의 `Module`은 Tensor를 Input으로 받아 무언가 처리하고 처리 결과 Tensor를 Output로 내보내 주는 Container입니다.

통상적으로는 torch.nn에 있는 여러 Module을 조합해서 새로운 Module을 만들고 싶을 때 PyTorch의 Module을 직접 정의해서 사용합니다. 여러 Module들을 조합해 서 새로운 Module을 만들어 주는 특별한 기능이 없는 단순한 Container로 보이지만 여러가지 잘 보이지 않는 중요한 기능을 가지고 있습니다.

Moduel : https://teamdable.github.io/techblog/PyTorch-Module

In [17]:
#모델을 정의합니다
class NeuralNetwork(nn.Module) :
    def __init__(self):
        super(NeuralNetwork, self).__init__()
        self.flatten = nn.Flatten()
        self.linear_relu_stack = nn.Sequential(
            nn.Linear(28*28, 512),
            nn.ReLU(),
            nn.Linear(512,512),
            nn.ReLU(),
            nn.Linear(512,10),
            nn.ReLU()
        )
        
    def forward(self, x) :
        x = self.flatten(x)
        logits = self.linear_relu_stack(x)
        return logits

NeuralNetwork 의 `인스턴스(instance)를 생성`하고 이를 `device 로 이동`한 뒤, `구조(structure)를 출력`합니다.

In [18]:
model = NeuralNetwork().to(device)
print(model)

NeuralNetwork(
  (flatten): Flatten()
  (linear_relu_stack): Sequential(
    (0): Linear(in_features=784, out_features=512, bias=True)
    (1): ReLU()
    (2): Linear(in_features=512, out_features=512, bias=True)
    (3): ReLU()
    (4): Linear(in_features=512, out_features=10, bias=True)
    (5): ReLU()
  )
)


모델을 사용하기 위해 입력 데이터를 전달합니다.

이는 일부 `백그라운드 연산들` 과 함께 모델의 `forward 를 실행`합니다. **model.forward() 를 직접 호출하지 마세요!**

module.py : https://github.com/pytorch/pytorch/blob/270111b7b611d174967ed204776985cefca9c144/torch/nn/modules/module.py#L866

모델에 입력을 호출하면 각 분류(class)에 대한 원시(raw) 예측값이 있는 `10-차원 텐서`가 반환됩니다. 원시 예측값을 `nn.Softmax 모듈의 인스턴스에 통과시켜 예측 확률을 얻습니다.`

In [20]:
X = torch.rand(1,28,28, device = device)
logits = model(X)

In [21]:
logits

tensor([[0.0000, 0.0187, 0.0000, 0.1061, 0.0385, 0.0945, 0.1011, 0.0703, 0.0000,
         0.0172]], grad_fn=<ReluBackward0>)

In [22]:
pred_probab = nn.Softmax(dim=1)(logits)
y_pred = pred_probab.argmax(1)
print(f"Predicted class: {y_pred}")

Predicted class: tensor([3])


----------------------------

## 모델 매개변수 최적화하기

모델을 학습하려면 `손실 함수(loss function)` 와 `옵티마이저(optimizer)` 가 필요합니다.