# TRANSFORMS

数据并不总是以机器学算法要求的处理过的最终形式出现。我们使用**transforms**来对数据进行一些操作使它符合训练。

所有TorchVision数据集都有两个参数`transform`来处理特征以及`target_transform`来处理标签它们接受包含转换逻辑的可调用参数[torchvision.transforms](https://pytorch.org/vision/stable/transforms.html)模块提供了几个常用的转换，开箱即用。

FashionMNIST的特征是PIL图像格式，而标签是整数。对于训练，我们需要将特征作为归一化的张量，将标签作为独热编码的张量。为了进行这些转换，我们使用`ToTensor`和`Lambda`。

In [1]:
import torch
import torchvision
from torchvision.transforms import ToTensor, Lambda

In [17]:
ds = torchvision.datasets.FashionMNIST(
    root="../../../data",
    train=True,
    download=False,
    transform=ToTensor(),
    target_transform=Lambda(lambda y: torch.zero(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))
)

## ToTensor()

[ToTensor](https://pytorch.org/vision/stable/transforms.html#torchvision.transforms.ToTensor)将一个PIL图或者NumPy的`ndarray`转化为`FloatTensor`，并且将图片的像素密度值在\[0., 1.\]区间缩放。

## Lambda Transforms

Lambda变换应用任意一个用户定义的lambda函数。这里我们定义一个函数来将整型转换为一个one-hot编码的张量。它首先创建一个大小为10（数据集中标签类别的数量）的全零张量，并且调用[scatter_](https://pytorch.org/docs/stable/generated/torch.Tensor.scatter_.html)指定下标为给定标签`y`的值为1 `value=1`。

In [14]:
print(ds)

Dataset FashionMNIST
    Number of datapoints: 60000
    Root location: ../../../data
    Split: Train
    StandardTransform
Transform: ToTensor()
Target transform: Lambda()
