# 변형(Transform)

데이터가 항상 머신러닝 알고리즘 학습에 필요한 최종 처리가 된 형태를 제공하지 않는다.  
변형을 해서 데이터를 조작하고 학습에 적합하게 만든다.  
모든 torchvision 데이터셋들은 변형로직을 갖는, 호출 가능한 객체(callable)를 받는 매개변수 두개(특징(feature)을 변경하기 위한 transform과 정답을 변경하기 위한 target_transform)를 갖는다.   
torchvision.transforms 모듈은 주로 사용하는 몇 가지 변형을 제공한다.  

FashionMNIST 특징은 PIL 이미지 형식이며, 정답은 정수이다. 학습을 하려면 정규화된 텐서 형태의 특징과 원핫으로 부호화된 텐서 형태의 정답이 필요하다.  
이러한 변형을 하기 위해 ToTensor와 Lambda를 사용한다.

In [2]:
import torch
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

ds = datasets.FashionMNIST(
    root = 'data',
    train = True,
    download = True,
    transform = ToTensor(),
    target_transform = Lambda(lambda y : torch.zeros(10, dtype = torch.float).scatter_(0, torch.tensor(y), value = 1))
)

## ToTensor()
ToTensor는 PIL image나 넘파이 ndarray를 FloatTensor로 변환하고,  
이미지의 픽셀의 크기 값을 [0.,1.] 범위로 비례하여 조정

## Lambda 변형(Transform)
Lambda 변형은 사용자 정의 람다함수를 적용한다. 
여기에서는 정수를 원핫으로 부호화된 텐서로 바꾸는 함수를 정의한다.
이 함수는 먼저(데이터셋 정답의 개수인) 크기 10짜리 영 텐서를 만들고,  
scatter_를 호출하여 주어진 정답 y에 해당하는 인덱스에 value =1 을 할당

In [4]:
target_transform = Lambda(lambda y: torch.zeros(
    10, dtype = torch.float).scatter_(dim = 0, index = torch.tensor(y), value = 1))