In [4]:
# For tips on running notebooks in Google Colab, see
# https://pytorch.org/tutorials/beginner/colab
%matplotlib inline



# Transforms

数据并不总是以训练机器学习算法所需的最终处理形式出现。我们使用转换来对数据执行一些操作并使其适合训练。

所有 TorchVision 数据集都有两个参数
- transform修改特征
- target_transform修改标签接受包含转换逻辑的可调用对象。

torchvision.transforms模块提供了几种开箱即用的常用转换。

FashionMNIST特征采用PIL图像格式，标签为整数。对于训练，我们需要将特征作为归一化张量，
将标签作为单热编码张量。为了进行这些转换，我们使用ToTensor和Lambda。


In [5]:
import torch
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

ds = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor(),
    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))
)

## ToTensor()

[ToTensor](https://pytorch.org/vision/stable/transforms.html#torchvision.transforms.ToTensor)
ToTensor 将 PIL 图像或 NumPy 转换ndarray为FloatTensor. 并在 [0., 1.] 范围内缩放图像的像素强度值


## Lambda Transforms

Lambda 转换应用任何用户定义的 lambda 函数。
在这里，我们定义一个函数将整数转换为 one-hot 编码张量。
它首先创建一个大小为 10（数据集中标签的数量）的零张量，并调用[scatter_](https://pytorch.org/docs/stable/generated/torch.Tensor.scatter_.html)  scatter_value=1 ，它在 label 给定的索引上分配 a y。


In [6]:
target_transform = Lambda(lambda y: torch.zeros(
    10, dtype=torch.float).scatter_(dim=0, index=torch.tensor(y), value=1))
print(target_transform)

Lambda()


--------------




### Further Reading
- [torchvision.transforms API](https://pytorch.org/vision/stable/transforms.html)

