In [4]:
%matplotlib inline

# Transforms

数据并不总是以其所需的最终处理形式出现
训练机器学习算法。 我们使用 **transforms** 来执行一些
处理数据并使其适合训练。

所有 TorchVision 数据集都有两个参数（`transform` 以修改特征和
`target_transform` 修改标签）接受包含转换逻辑的可调用对象。
[torchvision.transforms](https://pytorch.org/vision/stable/transforms.html) 模块提供
几种常用的开箱即用转换。

FashionMNIST 特征采用 PIL Image 格式，标签为整数。
对于训练，我们需要将特征作为归一化张量，将标签作为单热编码张量。
为了进行这些转换，我们使用了 `ToTensor` 和 `Lambda`。

In [5]:
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

ds = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor(),
    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))
)

## ToTensor()

[ToTensor](https://pytorch.org/vision/stable/transforms.html#torchvision.transforms.ToTensor)
将 PIL 图像或 NumPy `ndarray` 转换为 `FloatTensor` 并在 \[0., 1.\] 范围内缩放图像的像素强度值

## Lambda 变换

Lambda 转换适用于任何用户定义的 lambda 函数。 在这里，我们定义一个函数
将整数转换为单热编码张量。
它首先创建一个大小为 10（我们数据集中的标签数量）的零张量并调用
[scatter](https://pytorch.org/docs/stable/tensors.html#torch.Tensor.scatter_) 分配一个
标签“y”给出的索引上的“value=1”。

In [6]:
target_transform = Lambda(lambda y: torch.zeros(
    10, dtype=torch.float).scatter_(dim=0, index=torch.tensor(y), value=1))

--------------




In [7]:
print(target_transform)

Lambda()
