<a href="https://github.com/xuehangcang/DeepLearning/blob/main/docs/PyTorch/%E5%9F%BA%E7%A1%80%E7%9F%A5%E8%AF%86/4.变换.ipynb" download=""><svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" width="110" height="20" role="img" aria-label="jupyter: notebook"><title>jupyter: notebook</title><linearGradient id="s" x2="0" y2="100%"><stop offset="0" stop-color="#bbb" stop-opacity=".1"/><stop offset="1" stop-opacity=".1"/></linearGradient><clipPath id="r"><rect width="110" height="20" rx="3" fill="#fff"/></clipPath><g clip-path="url(#r)"><rect width="49" height="20" fill="#555"/><rect x="49" width="61" height="20" fill="#fe7d37"/><rect width="110" height="20" fill="url(#s)"/></g><g fill="#fff" text-anchor="middle" font-family="Verdana,Geneva,DejaVu Sans,sans-serif" text-rendering="geometricPrecision" font-size="110"><text aria-hidden="true" x="255" y="150" fill="#010101" fill-opacity=".3" transform="scale(.1)" textLength="390">jupyter</text><text x="255" y="140" transform="scale(.1)" fill="#fff" textLength="390">jupyter</text><text aria-hidden="true" x="785" y="150" fill="#010101" fill-opacity=".3" transform="scale(.1)" textLength="510">notebook</text><text x="785" y="140" transform="scale(.1)" fill="#fff" textLength="510">notebook</text></g></svg></a>

## 4.1 变换

数据并不总是以最终处理好的形式出现，而这种形式是机器学习算法所需的。我们使用 `transforms` 来对数据执行一些操作，使其适合训练。

所有的 TorchVision 数据集都有两个参数 `transform` 用于修改特征，`target_transform` 用于修改标签。

这些参数接受包含变换逻辑的可调用函数。`torchvision.transforms` 模块提供了几个常用的变换。

FashionMNIST 的特征是 PIL 图像格式，标签是整数。

为了训练，我们需要将特征转换为归一化张量，将标签转换为独热编码张量。 为了进行这些变换，我们使用`ToTensor` 和`Lambda`。

In [9]:
import torch
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

ds = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor(),
    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))
)

In [10]:
for i in range(10):
    sample = ds[i]
    print(i, sample[0].shape, sample[1])

0 torch.Size([1, 28, 28]) tensor([0., 0., 0., 0., 0., 0., 0., 0., 0., 1.])
1 torch.Size([1, 28, 28]) tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
2 torch.Size([1, 28, 28]) tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
3 torch.Size([1, 28, 28]) tensor([0., 0., 0., 1., 0., 0., 0., 0., 0., 0.])
4 torch.Size([1, 28, 28]) tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
5 torch.Size([1, 28, 28]) tensor([0., 0., 1., 0., 0., 0., 0., 0., 0., 0.])
6 torch.Size([1, 28, 28]) tensor([0., 0., 0., 0., 0., 0., 0., 1., 0., 0.])
7 torch.Size([1, 28, 28]) tensor([0., 0., 1., 0., 0., 0., 0., 0., 0., 0.])
8 torch.Size([1, 28, 28]) tensor([0., 0., 0., 0., 0., 1., 0., 0., 0., 0.])
9 torch.Size([1, 28, 28]) tensor([0., 0., 0., 0., 0., 1., 0., 0., 0., 0.])


## 4.2 ToTensor()

`ToTensor` 函数将 PIL 图像或 NumPy 数组转换为 `FloatTensor` 。并将图像的像素强度值缩放到 [0., 1.] 范围内。


## 4.3 Lambda Transforms

Lambda 转换应用用户定义的任何 lambda 函数。

这里，我们定义了一个函数将整数转换为 one-hot 编码的张量。

首先创建一个大小为10的零张量（数据集中标签的数量），然后调用`scatter_`，它将`value=1` 分配给标签`y` 所给出的索引。

In [11]:
target_transform = Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(dim=0, index=torch.tensor(y), value=1))

In [12]:
target_transform(3)

tensor([0., 0., 0., 1., 0., 0., 0., 0., 0., 0.])