# 변형 (Transform)

- 데이터는 항상 전처리된 상태로 제공되지 않음
- **변형(Transform)**을 해서 데이터를 조작하고 학습에 적합하게 만들어야 함
- `transform`: feature를 변경
- `target_transform`: label을 변경

In [1]:
import torch
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

ds = datasets.FashionMNIST(
    root='data',
    train=True,
    download=True,
    transform=ToTensor(),
    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y),
                                                                                  value=1))
)

# FashionMNIST의 feature는 PIL Image 형식 / label은 integer
# feature: Tensor
# label: one-hot encoded Tensor

## ToTensor()
- `ToTensor`는 PIL Image나 Numpy `ndarray`를 `FloatTensor`로 변환
- 이미지 픽셀의 크기 값을 [0., 1.] 범위로 scaling

## Lambda Transform

- 사용자 정의 람다 함수 적용
- integer를 one-hot encoding

In [2]:
target_transform = Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))

# y는 크기가 10인 영 텐서 -> scatter_ -> y에 해당하는 인덱스에 value=1 할당