### DataLoader类

DataLoader 类用于从 Dataset 类中加载数据

要求 Dataset 类通过 getitem 魔法方法得到的图像数据都是 Tensor 类型，并且各个维度大小一致（相同的宽高，相同的通道数）

可以封装数据的加载方式

In [2]:
from torch.utils.data import Dataset, DataLoader
from PIL import Image
import os
from torchvision.transforms import ToTensor, Resize, Compose

class MyDataset(Dataset):
    # 构造函数，保存类内成员变量，供后续使用
    def __init__(self, root_dir, label, compose_trans=None):
        self.root_dir = root_dir
        self.label = label
        self.dir_path = os.path.join(self.root_dir, self.label)  # 路径拼接
        self.img_name_list = os.listdir(self.dir_path)           # 获取指定文件夹中所有文件名字符串序列

        # 保存图像处理流程
        self.compose_trans = compose_trans

    # 根据索引，获取一个样本数据及其标签
    def __getitem__(self, index):
        img_name = self.img_name_list[index]
        img_path = os.path.join(self.dir_path, img_name)
        img = Image.open(img_path)

        # 如果指定了图像处理流程，返回处理好后的图像
        if self.compose_trans:
            img = self.compose_trans(img)
        return img, self.label
    
    # 返回样本的数量
    def __len__(self):
        return len(self.img_name_list)


root_dir = 'C:\\Users\\Administrator\\Desktop\\pytorch_learning\\dataset\\train'
ant_label = 'ant'
bee_label = 'bee'
compose_trans = Compose([
    ToTensor(),
    Resize((300, 300))
])
ant_dataset = MyDataset(root_dir, ant_label, compose_trans)
bee_dataset = MyDataset(root_dir, bee_label, compose_trans)
train_dataset = ant_dataset + bee_dataset

<br>

### 实例化DataLoader

自定义数据集的加载方式:

- dataset，数据来源的 Dataset 类

- batch_size，每次加载读取的样本数量

- shuffle，进行多轮加载数据集时，对数据集的样本加载顺序是否相同

- drop_last，当最后一次加载数据集的样本数量少于 batch_size 时，是否要舍弃数据

`还有更多参数可以看官方文档`

In [3]:
loader = DataLoader(dataset=train_dataset, batch_size=4, shuffle=False, drop_last=False)

<br>

### 使用DataLoader类开始加载样本

In [12]:
for imgs, labels in loader:
    print(imgs.shape)        # 每次加载包含 4 个样本，每个样本有 3 个通道，像素为 300 * 300
    print(len(labels))       # 对应上面 4 个样本的标签 

torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Size([4, 3, 300, 300])
4
torch.Si