<a href="https://colab.research.google.com/github/cheffjiu/pytorch-tutorials-zh/blob/main/transforms_tutorial.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# For tips on running notebooks in Google Colab, see
# https://pytorch.org/tutorials/beginner/colab
%matplotlib inline

[Learn the Basics](https://github.com/cheffjiu/pytorch-tutorials-zh/blob/main/intro.ipynb) \|\|
[Quickstart](https://github.com/cheffjiu/pytorch-tutorials-zh/blob/main/quickstart_tutorial.ipynb) \|\|
[Tensors](https://github.com/cheffjiu/pytorch-tutorials-zh/blob/main/tensorqs_tutorial.ipynb) \|\| [Datasets &
DataLoaders](https://github.com/cheffjiu/pytorch-tutorials-zh/blob/main/data_tutorial.ipynb) \|\| **Transforms** \|\| [Build
Model](https://github.com/cheffjiu/pytorch-tutorials-zh/blob/main/buildmodel_tutorial.ipynb) \|\|
[Autograd](https://github.com/cheffjiu/pytorch-tutorials-zh/blob/main/autogradqs_tutorial.ipynb) \|\|
[Optimization](https://github.com/cheffjiu/pytorch-tutorials-zh/blob/main/optimization_tutorial.ipynb) \|\| [Save & Load
Model](https://github.com/cheffjiu/pytorch-tutorials-zh/blob/main/saveloadrun_tutorial.ipynb)

Transforms
==========

数据并不总是以训练机器学习算法所需的最终处理形式出现。我们使用**transforms**对数据进行一些处理，使其适合训练。

所有TorchVision数据集都有两个参数 `transform`用于修改特征，`target_transform`用于修改标签 - 它们接受包含变换逻辑的可调用对象。[torchvision.transforms](https://pytorch.org/vision/stable/transforms.html)模块提供了一些现成的常用变换。
FashionMNIST的特征采用PIL图像格式，标签为整数。对于训练，我们需要将特征转换为归一化张量，将标签转换为独热编码(one-hot)张量。为了进行这些转换，我们使用`ToTensor`和`Lambda`。


In [None]:
import torch
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

ds = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor(),
    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))
)

ToTensor()
==========

[ToTensor](https://pytorch.org/vision/stable/transforms.html#torchvision.transforms.ToTensor)将PIL图像或NumPy `ndarray`转换为`FloatTensor`，并将图像的像素值缩放到范围[0., 1.]


Lambda Transforms
=================

Lambda变换可以应用任何用户定义的Lambda函数。在这里，我们定义一个函数，将整数转换为独热编码张量。它首先创建一个大小为10的零张量（我们数据集中标签的数量），然后调用[scatter\_](https://pytorch.org/docs/stable/generated/torch.Tensor.scatter_.html)，该函数会在标签`y`指定的索引位置上赋值`value=1`。

In [None]:
target_transform = Lambda(lambda y: torch.zeros(
    10, dtype=torch.float).scatter_(dim=0, index=torch.tensor(y), value=1))

------------------------------------------------------------------------


Further Reading
===============

-   [torchvision.transforms
    API](https://pytorch.org/vision/stable/transforms.html)
