In [1]:
# Fashion_MNIST 샘플은 PIL 이미지 형식이며 레이블은 정수
# 학습을 위해서 feature로는 정규화된 텐서
# 레이블은 원핫 인코딩된 텐서
# 이러한 변환을 위해 ToTensor와 Lambda를 사용
import torch
from torchvision import datasets, transforms
from torchvision.transforms import ToTensor, Lambda

ds = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor(),
    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))
)

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-images-idx3-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-images-idx3-ubyte.gz to data\FashionMNIST\raw\train-images-idx3-ubyte.gz


100%|██████████| 26421880/26421880 [00:06<00:00, 4162474.05it/s]


Extracting data\FashionMNIST\raw\train-images-idx3-ubyte.gz to data\FashionMNIST\raw

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-labels-idx1-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-labels-idx1-ubyte.gz to data\FashionMNIST\raw\train-labels-idx1-ubyte.gz


100%|██████████| 29515/29515 [00:00<00:00, 105822.43it/s]


Extracting data\FashionMNIST\raw\train-labels-idx1-ubyte.gz to data\FashionMNIST\raw

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-images-idx3-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-images-idx3-ubyte.gz to data\FashionMNIST\raw\t10k-images-idx3-ubyte.gz


100%|██████████| 4422102/4422102 [00:02<00:00, 1735538.91it/s]


Extracting data\FashionMNIST\raw\t10k-images-idx3-ubyte.gz to data\FashionMNIST\raw

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-labels-idx1-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-labels-idx1-ubyte.gz to data\FashionMNIST\raw\t10k-labels-idx1-ubyte.gz


100%|██████████| 5148/5148 [00:00<00:00, 5147145.89it/s]

Extracting data\FashionMNIST\raw\t10k-labels-idx1-ubyte.gz to data\FashionMNIST\raw





###  ToTensor()
* ToTensor는 PIL 이미지 또는 NumPy ndarray을 FloatTensor로 변환하고 이미지의 픽셀 밝기 값을 [0., 1.] 범위에서 스케일링합니다.

### 람다 트랜스폼
* 람다 트랜스폼은 사용자 정의 람다 함수를 적용합니다.

In [2]:
# 크기 10(데이터 세트의 레이블 수)의 제로 텐서를 생성
# 레이블 y에 지정된 대로 인덱스에 value=1을 할당하는 scatter_를 호출
target_transform = Lambda(lambda y: torch.zeros(
    10, dtype=torch.float).scatter_(dim=0, index=torch.tensor(y), value=1))

### Compose
* Compose를 통해서 여러 트랜스폼을 함께 구성할 수 있습니다.

In [3]:
transforms.Compose([
    transforms.CenterCrop(10),
    transforms.PILToTensor(),
    transforms.ConvertImageDtype(torch.float),
])

Compose(
    CenterCrop(size=(10, 10))
    PILToTensor()
    ConvertImageDtype()
)

* Compose를 활용한 트랜스폼은 torchscript를 지원하지 않습니다.
*  변환을 스크립트화하려면 아래와 같이 torch.nn.sequential을 사용하세요.

In [4]:
transforms = torch.nn.Sequential(
    transforms.CenterCrop(10),
    transforms.Normalize((0.485, 0.456, 0.406), (0.229, 0.224, 0.225)),
)
scripted_transforms = torch.jit.script(transforms)

* torch.nn.sequential은 스크립트화가 가능한 변환만 사용해야 합니다.