## TRANSFORMS

데이터는 항상 머신 러닝 알고리즘의 훈련에 알맞게 가공된 형태로 제공되지는 않기 때문에 훈련에 적합하게 만들 필요가 있다

In [1]:
import torch
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

ds = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor(),
    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))
)

## ToTensor()

- ToTensor는 이미지를 텐서로 변환하여 딥 러닝 모델에 입력으로 사용할 수 있도록 한다
- PIL 이미지나 NumPy ndarray 형태의 이미지를 텐서로 변환하면, 이미지의 모양(shape)은 유지되면서도 이미지 데이터가 텐서로 표현된다
- ToTensor는 이미지의 픽셀 강도 값을 [0., 1.] 범위로 스케일링한다
    - 일반적으로 이미지의 픽셀 값은 [0, 255] 범위이다


## Lambda Transforms

- Lambda Transform은 사용자가 정의한 람다 함수를 적용한다
- 아래의 예시로 원핫 인코딩을 하기 위한 람다 함수를 생성하였다

In [2]:
target_transform = Lambda(lambda y: torch.zeros(
    10, dtype=torch.float).scatter_(dim=0, index=torch.tensor(y), value=1))

# torch.zeros(10, dtype=torch.float) : 크기가 10인 0행렬을 생성
# scatter_(dim=0, index=torch.tensor(y) : dim은 값을 할당할 차원, index는 값을 할당할 위치를 지정하는 인덱스 텐서(위의 경우에는 원핫 인코딩 중 1의 값을 지정할 인덱스를 의미)
# value는 원핫 인코딩이므로 1값을 입력해야 한다