# CH04-Transformers

数据并不总是以训练机器学习算法所需的最终处理形式出现。我们使用转换来对数据进行一些操作并使其适合训练。

所有 TorchVision 数据集都有两个参数:

+ transform，修改特征

+ target_transform，修改标签（接受包含转换逻辑的可调用对象）。

torchvision.transforms模块提供了几种常用的数据转换：

+ ToTensor()

+ Lambda

+ CenterCrop()
    
+ Normalize()

使用多个转换：
```
transformer.Compose([
    transforms.ToTensor(),
    transforms.CenterCrop(10),
    transforms.Normalize((0.485, 0.456, 0.406), (0.229, 0.224, 0.225)),
    
])
```

更多关于`TORCHVISION.TRANSFORMS`：https://pytorch.org/vision/stable/transforms.html


FashionMNIST 特征采用 PIL Image 格式，标签为整数。对于训练，我们需要将特征作为归一化张量，将标签作为单热编码张量。为了进行这些转换，我们使用ToTensor和Lambda。

In [4]:
import torch
import torchvision

from torchvision import datasets,transforms
from torchvision.transforms import ToTensor, Lambda

ds = datasets.FashionMNIST(
    root="data",
    train=True,
    download=False,
    # 转换feature
    transform=ToTensor(),
    # 转换label
    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))
)

小结：

+ `torchvision.transforms`包含许多数据转换函数

+ `transformer`转换样本特征

+ `target_transformer`转换样本标签