# TRANSFORMS

数据并不总是以训练机器学习算法所需的最终处理形式出现。我们使用转换来执行数据的一些操作，使其适合于训练。

所有的 TorchVision 数据集有两个参数- `transform` 去更新特征以及 `target_transform` 去更新标签并接受一个包含转换逻辑的回调。`torchvision.transforms` 模块提供了几种常用的开箱即用的转换。

FashionMNIST特征是 PIL 图片格式，标签是整数。对于训练，我们需要特征作为归一化张量，标签作为独热编码张量。为了做这些变换，我们用 `ToTensor` 和 `Lambda`。

In [1]:
import torch 
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

ds = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor(),
    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))
)

## ToTensor()

ToTensor 将 PIL 图片或者 Numpy 的 `ndarray` 转换为 `FloatTensor`。并且将图片像素密度缩放至[0., 1.]

## Lambda 变换

Lambda 变换提供任意用户定义的 lambda 函数。这里，我们定义一个函数将整数转换为独热编码的张亮。它首先创建了一个大小为 10 的 0 张量并调用scatter_，它在标号y所给出的索引上赋值=1。

In [2]:
target_transform = Lambda(lambda y: torch.zeros(
    10, dtype=torch.float).scatter_(dim=0, index=torch.tensor(y), value=1))