如果希望从 Dataset 类中读取出来的图像数据是通过一个统一的图像处理得到的规格化的数据

可以在实例化 Dataset 类时指定一个 Compose 类型的图像处理流程

在 getitem 魔法方法中返回图像数据时，先调用 Compose 类进行图像处理，然后将处理后的图像返回即可

In [1]:
from torch.utils.data import Dataset
from PIL import Image
import os

In [None]:
class MyDataset(Dataset):
    # 构造函数，保存类内成员变量，供后续使用
    def __init__(self, root_dir, label, compose_trans=None):
        self.root_dir = root_dir
        self.label = label
        self.dir_path = os.path.join(self.root_dir, self.label)  # 路径拼接
        self.img_name_list = os.listdir(self.dir_path)           # 获取指定文件夹中所有文件名字符串序列

        # 保存图像处理流程
        self.compose_trans = compose_trans

    # 根据索引，获取一个样本数据及其标签
    def __getitem__(self, index):
        img_name = self.img_name_list[index]
        img_path = os.path.join(self.dir_path, img_name)
        img = Image.open(img_path)

        # 如果指定了图像处理流程，返回处理好后的图像
        if self.compose_trans:
            img = self.compose_trans(img)
        return img, self.label
    
    # 返回样本的数量
    def __len__(self):
        return len(self.img_name_list)