# Transforms
Data does not always come in its final processed form that is required for training machine learning algorithms.
We use transforms to perform some manipulation of the data and make it suitable for training.

All TorchVision datasets have two parameters - `transform` to modify the features and `target_transform` to modify the labels - that accept callables containing the transformation logic.
The [tochvision.transforms](https://pytorch.org/vision/stable/transforms.html) module offeres several commonly-used transforms out of the box.

The FashionMNIST features are in PIL Image format, and the labels are integers.
For training, we need the features as normalized tensors, and the labels as one-hot encoded tensors.
To make these transformations, we use `ToTensor` and `Lambda`.

データは常に機械学習アルゴリズムのために必要な，最終的に整形された形をしているわけではない．
transformsを使うことで，データの操作を行い，訓練に適したデータにすることができる．

TorchVisionデータセットは全て，二つのパラメータ`transform`と`target_transform`を持っていて，変換ロジックを含んだ呼び出し可能オブジェクトを受け入れる．．
`transform`は特徴量を変換し，`target_transform`はラベルを変換する．
torchvision.transformsモジュールは，すぐに使うことができる一般的に用いられている変換方法を提供できる．

FashionMNISTの特徴量(入力)はPIL Imageフォーマットであり，ラベルは数値である．
訓練のために，特徴量は標準化されたtensorが，ラベルはワンホットエンコードされたtensorが必要である．
これらを変換するために，`ToTensor`と`Lambda`を用いる．

#### 補足
PIL Image

Python Image Libraryのことであり，Pythonのインタプリタで画像を処理するためのライブラリである．
様々なファイル形式をサポートし，効率的な内部表現，強力な画像処理機能がある．
その後，Pillowに移植された．詳細は[Pillowのウェブサイト]．(https://pillow.readthedocs.io/en/stable/index.html#)．

ワンホットエンコード

カテゴリ変数があった場合，例えばlabel1, label2, label3とあるとする．
この時，以下のテーブルのように表記することを指す．

|category|label1|label2|label3|
|--------|------|------|------|
|label1  |1     |0     |0     |
|lebal2  |0     |1     |0     |
|label3  |0     |0     |1     |

In [1]:
import torch
import torchvision
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda
print(torchvision.__version__)
df = datasets.FashionMNIST(
    root='data',
    train=True,
    download=True,
    transform=ToTensor(),
    target_transform=Lambda(
        lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))
)

0.9.1


## ToTensor()
[ToTensor](https://pytorch.org/vision/stable/transforms.html#torchvision.transforms.ToTensor) converts a PIL image or NumPy `ndarray` into a `FloatTensor`, and scales the image's pixel intensity values in the range\[0., 1.\]

ToTensorはPIL画像やNumPyの`ndarray`を`FlaotTensor`に変換し，画像のピクセル強度値を\[0., 1.\]の範囲でスケーリングする．

## Lambda Transforms
Lambda transforms apply any user-defined lambda function.
Here, we define a function to turn the integer into a one-hot encoded tensor.
It first creates a zero tensor of size 10 (the number of labels in our dataset) and calls 
[scatter_](https://pytorch.org/docs/stable/tensors.html#torch.Tensor.scatter_) which assigns a `value=1` on the index as given by the label `y`.

Lambda変換はユーザが定義したlambda関数を適用する．
ここでは，数値をワンホットエンコードされたtensorに変換する関数を定義した．
サイズ10のtensorを0で初期化し，ラベル`y`に応じたインデックスに`value=1`を適応する`scatter_`関数を呼び出した．

In [2]:
target_transform = Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(dim=0, index=torch.tensor(y), value=1))

In [3]:
label1 = 0
label3 = 2
t = Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(dim=0, index=torch.tensor(y), value=1))
print(t(label1))
print(t(label3))

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
tensor([0., 0., 1., 0., 0., 0., 0., 0., 0., 0.])
