In [1]:
import torch
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

# Transforms

데이터가 항상 머신러닝 알고리즘 학습에 필요한 최종 처리가 된 형태로 제공되지는 않습니다. 

**transform**(변형)을 해서 데이터를 조작하고 학습에 적합하게 만듭니다.

<br>

모든 `TorchVision` 데이터셋들은 

변형 로직을 갖고, 호출 가능한 객체(callable)를 받는 매개변수 두개
* `transform` : **feature** 를 변경하기 위해
* `target_transform` : **label** 을 변경하기 위해 
를 갖습니다 

<br>

`torchvision.transforms` 모듈은 주로 사용하는 몇가지 transform을 제공합니다.

FashionMNIST feature는 PIL Image 형식이며, label은 정수(integer)입니다. 

> 학습을 하려면 ***정규화(normalize)된 텐서 형태의 feature*** 와 ***one-hot encode 된 텐서 형태의 label***이 필요합니다. 

<br>

<h4> 이러한 변형(transformation)을 하기 위해 ToTensor 와 Lambda 를 사용합니다.

In [2]:
# FashionMNIST train dataset을 호출합니다.

ds = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor(),
    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))

)

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-images-idx3-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-images-idx3-ubyte.gz to data/FashionMNIST/raw/train-images-idx3-ubyte.gz


  0%|          | 0/26421880 [00:00<?, ?it/s]

Extracting data/FashionMNIST/raw/train-images-idx3-ubyte.gz to data/FashionMNIST/raw

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-labels-idx1-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-labels-idx1-ubyte.gz to data/FashionMNIST/raw/train-labels-idx1-ubyte.gz


  0%|          | 0/29515 [00:00<?, ?it/s]

Extracting data/FashionMNIST/raw/train-labels-idx1-ubyte.gz to data/FashionMNIST/raw

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-images-idx3-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-images-idx3-ubyte.gz to data/FashionMNIST/raw/t10k-images-idx3-ubyte.gz


  0%|          | 0/4422102 [00:00<?, ?it/s]

Extracting data/FashionMNIST/raw/t10k-images-idx3-ubyte.gz to data/FashionMNIST/raw

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-labels-idx1-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-labels-idx1-ubyte.gz to data/FashionMNIST/raw/t10k-labels-idx1-ubyte.gz


  0%|          | 0/5148 [00:00<?, ?it/s]

Extracting data/FashionMNIST/raw/t10k-labels-idx1-ubyte.gz to data/FashionMNIST/raw



In [5]:
ds

Dataset FashionMNIST
    Number of datapoints: 60000
    Root location: data
    Split: Train
    StandardTransform
Transform: ToTensor()
Target transform: Lambda()

In [14]:
len(ds[0]) # ds의 1 element는 tesor화 된 이미지데이터, one-hot encoding 된 라벨 tensor 2가지로 구성되었다.

2

In [15]:
ds[0] # 직접 확인해보자

(tensor([[[0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000,
           0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000,
           0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000,
           0.0000, 0.0000, 0.0000, 0.0000],
          [0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000,
           0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000,
           0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000,
           0.0000, 0.0000, 0.0000, 0.0000],
          [0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000,
           0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000,
           0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000,
           0.0000, 0.0000, 0.0000, 0.0000],
          [0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000,
           0.0000, 0.0000, 0.0000, 0.0000, 0.0039, 0.0000, 0.0000, 0.0510,
           0.2863, 0.0000, 0.0000, 0.0039, 

# ToTensor()

`ToTensor` 는 **PIL Image** 나 **NumPy ndarray** 를 **FloatTensor** 로 변환하고, 

이미지의 픽셀의 크기(intensity) 값을 [0., 1.] 범위로 비례하여 조정(scale)합니다.

# Lambda Transforms

Lambda Transforms 는 사용자 정의 람다(lambda) 함수를 적용합니다.<br>
여기에서는 정수를 원-핫으로 부호화된 텐서로 바꾸는 함수를 정의합니다. 

> 이 함수는 먼저 크기 10짜리 **zero tensor**(데이터셋 정답의 개수인) 를 만들고,<br>
`scatter_` 를 호출하여 주어진 정답 y 에 해당하는 인덱스에 value=1 을 할당합니다.

In [3]:
# label 10개이므로 size 10인 zero tensor를 scatter_ 하는 Lambda를 target_transform 으로 생성했다.

target_transform = Lambda(lambda y: torch.zeros(
    10, dtype=torch.float).scatter_(dim=0, index=torch.tensor(y), value=1))


In [4]:
target_transform  # Lambda() 객체임을 확인

Lambda()