# 3. Transform

> data가 항상 머신러닝에 적합한 형태로 제공되지는 않는다.  
따라서 **transform을 통해 data를 조작하고 학습에 적합하게 만들어야 한다.**

>모든 Torchvision의 dataset들은 변형 로직을 갖는, callable를 받는 parameter 두 개를 갖는다.  
하나는 **feature를 변경하기 위한** `transform`, 나머지 하나는, **label을 변경하기 위한** `target_transform`이다.  
`torchvision.transforms` 모듈은 주로 사용하는 몇가지 transform을 제공한다.

>FashionMNIST의 feature는 PIL Image 형식이며, label은 integer다.  
**학습을 하려면 normalize된 tensor 형태의 feature와 one-hot으로 encode된 tensor 형태의 label이 필요하다.**  
이러한 transformation을 하기 위해 `ToTensor`와 `Lambda`를 사용한다.

In [2]:
import torch
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

ds = datasets.FashionMNIST(
    root='data',
    train=True,
    download=True,
    transform=ToTensor(),
    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))
)

## ToTensor()

> ToTensor는 PIL Image나 Numpy의 `ndarray`를 `FloatTensor`로 변환하고,  
image의 pixel의 크기(intensity) 값을 [0., 1.] 범위로 비례하여 조정(scale)한다.

## Lambda Transforms

> Lambda Transforms는 사용자 정의 람다(lambda) 함수를 적용한다.  
여기에서는 정수를 one-hot으로 encode된 tensor로 바꾸는 함수를 정의한다.

>이 함수는 먼저 (dataset label의 개수인) 크기 10짜리 zero tensor를 만들고,  
`scatter_`를 호출하여 주어진 정답 `y`에 해당하는 index에 `value=1`을 할당한다.