# 转换器的意义
在加载数据集的过程中，有时候数据集的形式并不满足我门需要的最终的训练格式，因此，需要对原始数据进行处理。这也就是在自定义Dataset时候需要考虑的问题。如在PyTorch的视觉库中，我们一般采用
+ `Lambda`： 内置函数
+ `ToTensor`：转换函数

两个函数来完成格式的转换。

拿上面的图像的例子来说，因为是一个多分类问题，最终转化的成的是概率问题，计算分成每种类型的概率。而最终的标签仅仅是一个数字，所以我们需要将数字转化成`one-hot`矩阵来满足最终的计算需求，也就需要用到lambda函数。

In [None]:
import torch
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

ds = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor(),  # 数据集转化成tensor形式
    # 先生成一个标签长度大小的零矩阵，然后使用.scatter_就地将第i个数字标记为1，i也就是类别
    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1)) 
)


+ ToTensor: 将numpy数组或者PIL图像转化从FloatTensor形式，然后缩放图像的像素值
+ lambda 函数可以灵活使用，此处是 先生成一个标签长度大小的零矩阵，然后使用.scatter_就地将第i个数字标记为1，i也就是类别