# Transforms

Data往往不是来自最后处理好直接用来train机器学习算法的形式，我们使用<kbd>transforms</kbd>执行一些有关data的操作，让它适合去训练。

所有的TorchVision的datasets都有两个parameters-<kbd>transform</kbd>用来转换feature和<kbd>target_transform</kbd>用来转换label-可以随时接收有关transformation的logic。<kbd>torchvision.transforms</kbd>模块提供了几个随时可以使用的transforms。

FashionMNIST feature是PIL(Python Image Library) Image format,label是整型的，训练时，我们需要feature是normalized tensors，以及label是one-hot encoded tensors，为了完成这些transformation，我们使用<kbd>ToTensor</kbd>和<kbd>Lambda</kbd>方法。

In [1]:
import torch
from torchvision import datasets
from torchvision.transforms import ToTensor,Lambda

ds = datasets.FashionMNIST(
    root = "data",
    train = True,
    download = True,
    transform = ToTensor(),
    target_transform = Lambda(lambda y : torch.zeros(10,dtype=torch.float).scatter_(0,torch.tensor(y),value=1) )
)

  return torch.from_numpy(parsed.astype(m[2], copy=False)).view(*s)


## ToTensor()
<kbd>ToTensor</kbd> 方法将一张PIL image或者NumPy ndarray 转变为一个FloatTensor。然后缩放image 像素灰度值(pixel intensity value)到0.0-1.0的范围。

## Lambda Transform
Lambda Transform使用用户定义的lambda function。这里我们定义了一个将一个integer转换为one-hot encoded tensor。它首先创建了一个size是10(因为dataset中的label有10种)的zero tensor，然后调用scatter\_方法，这个方法可以根据提供的label y将tensor中对应index的value设置为1。
```python
target_transform = Lambda(lambda y: torch.zeros(
    10, dtype=torch.float).scatter_(dim=0, index=torch.tensor(y), value=1))

```
## 扩展阅读
[torchvision.transforms.API](https://pytorch.org/vision/stable/transforms.html)