In [4]:
%matplotlib inline

# Transforms

數據並不總是以其所需的最終處理形式出現
訓練機器學習算法。我們使用 **transforms** 來執行一些
處理數據並使其適合訓練。

所有 TorchVision 數據集都有兩個參數（`transform` 以修改特徵和
`target_transform` 修改標籤）接受包含轉換邏輯的可調用對象。
[torchvision.transforms](https://pytorch.org/vision/stable/transforms.html) 模塊提供
幾種常用的開箱即用轉換。

FashionMNIST 特徵採用 PIL Image 格式，標籤為整數。
對於訓練，我們需要將特徵作為歸一化張量，將標籤作為單熱編碼張量。
為了進行這些轉換，我們使用了 `ToTensor` 和 `Lambda`。

In [5]:
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

ds = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor(),
    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))
)

## ToTensor()

[ToTensor](https://pytorch.org/vision/stable/transforms.html#torchvision.transforms.ToTensor)
將 PIL 圖像或 NumPy `ndarray` 轉換為 `FloatTensor` 並在 \[0., 1.\] 範圍內縮放圖像的像素強度值

## Lambda 變換

Lambda 轉換適用於任何用戶定義的 lambda 函數。在這裡，我們定義一個函數
將整數轉換為單熱編碼張量。
它首先創建一個大小為 10（我們數據集中的標籤數量）的零張量並調用
[scatter](https://pytorch.org/docs/stable/tensors.html#torch.Tensor.scatter_) 分配一個
標籤“y”給出的索引上的“value=1”。

In [6]:
target_transform = Lambda(lambda y: torch.zeros(
    10, dtype=torch.float).scatter_(dim=0, index=torch.tensor(y), value=1))

--------------




In [7]:
print(target_transform)

Lambda()
