# 변형(Transform)
- 데이터가 항상 ML 알고리즘 학습에 필요한 최종 처리된 정리상태로 제공되지 않는다.
- 변형(Transform)을 통해서 데이터를 조작하고 학습을 적합하게 만들어보자.
- 모든 TorchVision  데이터셋들은 변형 로직을 갖는, 호출 가능한 객체(callable)를 받는 매개변수 2개(특징 변경을 위한 `transform`과 정답 변경을 위한 `target_transform`) 을 갖는다.
- `torchvision.transforms`는 몇가지 변형을 제공한다.

- FashionMNIST 특징은 PIL형식이며, 정답은 정수이다. 학습을 하려면 정수화(normalize)된 텐서 형태의 특징과 원-핫으로 부호화된 텐서 형태의 정답을 가져야한다.
- 이러한 변형을 위해 `ToTensor`와 `Lambda`를 사용한다.

In [1]:
import torch
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

ds = datasets.FashionMNIST(
    root = "data",
    train = True,
    download = True,
    transform = ToTensor(),
    target_transform= Lambda(lambda y: torch.zeros(10, dtype = torch.float).scatter(0, torch.tensor(y), value =1 ))
)

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-images-idx3-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-images-idx3-ubyte.gz to data\FashionMNIST\raw\train-images-idx3-ubyte.gz


100%|██████████| 26421880/26421880 [00:04<00:00, 6509338.51it/s] 


Extracting data\FashionMNIST\raw\train-images-idx3-ubyte.gz to data\FashionMNIST\raw

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-labels-idx1-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-labels-idx1-ubyte.gz to data\FashionMNIST\raw\train-labels-idx1-ubyte.gz


100%|██████████| 29515/29515 [00:00<00:00, 107024.19it/s]


Extracting data\FashionMNIST\raw\train-labels-idx1-ubyte.gz to data\FashionMNIST\raw

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-images-idx3-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-images-idx3-ubyte.gz to data\FashionMNIST\raw\t10k-images-idx3-ubyte.gz


100%|██████████| 4422102/4422102 [00:04<00:00, 936014.63it/s] 


Extracting data\FashionMNIST\raw\t10k-images-idx3-ubyte.gz to data\FashionMNIST\raw

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-labels-idx1-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-labels-idx1-ubyte.gz to data\FashionMNIST\raw\t10k-labels-idx1-ubyte.gz


100%|██████████| 5148/5148 [00:00<00:00, 5166852.59it/s]

Extracting data\FashionMNIST\raw\t10k-labels-idx1-ubyte.gz to data\FashionMNIST\raw






## ToTensor()
- `ToTensor()`는 PIL Image나 Numpy `ndarray`를 `FloatTensor`로 변환하고, 이미지의 픽셀의 크기(intensity) 값을 [0., 1.] 범위로 비례하여 조정(scale)한다.

## Lambda 변형
- 람다 변형은 사용자 정의 람다함수를 적용한다. 여기에서 정수를 원-핫으로 부호화된 텐서로 바꾸는 함수를 정의한다.
- 이 함수는 먼저 크기 10(레이블 개수)짜리 zero 텐서를 만들고 scatter_를 호출하여 정답 y 에 해당하는 인덱스 에 value 1을 할당한다.

In [2]:
target_transform = Lambda(
    lambda y: torch.zeros(10, dtype = torch.float).scatter_(dim = 0, index = torch.tensor(y), value = 1))

In [7]:
lambda y: torch.zeros(10, dtype = torch.float).scatter_(dim = 0, index = torch.tensor(y), value = 1)

<function __main__.<lambda>(y)>

## Ref

[transform APi](https://pytorch.org/vision/stable/transforms.html)