# 빠른 시작. Quick Start
기계학습의 일반적인 작업들을 위한 API를 실행시켜본다.<br>더 자세히 알기 위해서는 각 장(section)의 링크를 참고.

## 데이터 작업
PyTorch에는 데이터 작업을 위한 기본 요소 두 가지인<br>
`torch.utils.data.DataLoader`<br>
`torch.utils.data.Dataset`<br>
이 있다.

`Dataset`은 샘플과 정답을 저장하고, `DataLoader`는 `Dataset`을 반복 가능한(iterable) 객체로 감싼다.

In [3]:
import torch
from torch import nn
from torch.utils.data import DataLoader
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda, Compose
import matplotlib.pyplot as plt

Matplotlib is building the font cache; this may take a moment.


PyTorch는 **TorchText**, **TorchVision**, **TorchAudio**와 같이 도메인 특화 라이브러리를 데이터셋과 함께 제공하고 있다. 이 튜토리얼에서는 TorchVision 데이터셋을 사용한다.

`torchvision.datasets` 모듈은 **CIFAR**, **COCO** 등과 같은 다양한 실제 비전(vision) 데이터에 대한 Dataset을 포함하고 있다. 이 튜토리얼에서는 FasionMNIST 데이터셋을 사용한다. 모든 TorchVision Dataset은 샘플과 정답을 변경하기 위한 `transform`과 `target_transform` 두 인자를 포함한다.
</p>

In [None]:
# 공개 데이터셋에서 학습 데이터를 내려받는다.
training_data = datasets.FashionMNIST(
    root='data',
    train=True,
    download=True,
    transform=ToTensor(),
)

# 공개 데이터셋에서 테스트 데이터를 내려받는다.
test_data = datasets.FashionMNIST(
    root='data',
    train=False,
    download=True,
    transform=ToTensor(),
)

<p>

데이터셋을 `DataLoader`의 인자로 전달한다. 이는 데이터셋을 반복 가능한 객체(iterable)로 감싸고, 자동화된 배치(batch), 샘플링(sampling), 섞기(shuffle) 및 다중 프로세스로 데이터 불러오기(multiprocess data loading)를 지원한다.
</p>
<p>

본 코드에서 배치 크기(batch size)를 64로 정의했다. 이는 데이터로더(dataloader) 객체의 각 요소가 64개의 특징(feature)과 정답(label)을 묶음(batch)로 반환함을 의미한다.
</p>

In [None]:
batch_size = 64

# 데이터 로더를 생성한다
train_dataloader = DataLoader(training_data, batch_size=batch_size)
test.dataloader = DataLoader(test_data, batch_size=batch_size)

for x, y in test_dataloader:
    print("shape of X [N, C, H, W]: ", X.shape)
    print("shape of y: ", y.shape, y.dtype)
    break