「PyTorch入門  3. Transform」
===============================================================
【原題】TRANSFORMS

【原著】
[Suraj Subramanian](https://github.com/suraj813)、[Seth Juarez](https://github.com/sethjuarez/) 、[Cassie Breviu](https://github.com/cassieview/) 、[Dmitry Soshnikov](https://soshnikov.com/)、[Ari Bornstein](https://github.com/aribornstein/) 


【元URL】https://pytorch.org/tutorials/beginner/basics/transforms_tutorial.html

【翻訳】電通国際情報サービスISID AIトランスフォーメーションセンター　小川 雄太郎

【日付】2021年03月20日

【チュトーリアル概要】

本チュートリアルでは、PyTorchのデータ変換処理であるTransformについて解説を行います。

---


Transforms
===================

機械学習アルゴリズムの学習に必要な、最終的な処理が施された形でデータが手に入るとは限りません。

そこで**transform**を使用してデータに何らかの処理を行い、学習に適した形へと変換します。



TorchVisionの全データセットには、特徴量（データ）を変換処理するための``transform``と、ラベルを変換処理するための``target_transform``という2つのパラメータがあります。

さらに、変換ロジックを記載した callable を受け取ります。



[`torchvision.transforms`](https://pytorch.org/docs/stable/torchvision/transforms.html)モジュールは、一般的に頻繁に使用される変換を提供しています。


FashionMNISTデータセットの特徴量はPIL形式の画像であり、ラベルはint型です。

訓練では、正規化された特徴量テンソルと、ワンホットエンコーディングされたラベルテンソルが必要となります。

これらのデータを作るために、``ToTensor`` と ``Lambda``を使用します。



In [1]:
%load_ext lab_black

In [2]:
%matplotlib inline

In [3]:
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

ds = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor(),
    target_transform=Lambda(
        lambda y: torch.zeros(10, dtype=torch.float).scatter_(
            0, torch.tensor(y), value=1
        )
    ),
)

---



ToTensor()
-------------------------------

[`ToTensor`](https://pytorch.org/docs/stable/torchvision/transforms.html#torchvision.transforms.ToTensor)はPIL形式の画像、もしくはNumpyの``ndarray``を、``FloatTensor``に変換します。

<br>
加えて、画像の場合にはピクセルごとの値を [0., 1.]の範囲に変換します。




Lambda Transforms
-------------------------------

Lambda transformsは、ユーザーが定義した関数を実行するPython関数です。

本チュートリアルではint型のデータを、ワンホットエンコーディングしたテンソルへと変換しています。

<br>

最初に大きさ10のゼロテンソルを作成し（10はクラス数に対応）、[`scatter_`](https://pytorch.org/docs/stable/tensors.html#torch.Tensor.scatter_) を用いて、ラベル``y``の値のindexのみ1のワンホットエンコーディングに変換しています。



In [4]:
target_transform = Lambda(
    lambda y: torch.zeros(10, dtype=torch.float).scatter_(
        dim=0, index=torch.tensor(y), value=1
    )
)

--------------




さらなる詳細
--------------
以下のページも参考ください。


- [`torchvision.transforms API`](https://pytorch.org/vision/stable/transforms.html)



以上。