In [8]:
import torch
from torchvision import datasets
from torchvision.transforms import ToTensor
import matplotlib.pyplot as plt
from torch.utils.data import random_split
from torch.utils.data import DataLoader


### 划分验证集、测试集、训练集，并加入dataloader

In [9]:
# 从torchvision.datasets中加载FashionMNIST数据集
train_data = datasets.FashionMNIST(
    root='../data',  # 数据存储路径
    train=True,   # 使用训练集
    download=True,  # 如果数据不存在则下载
    transform=ToTensor()  # 将图像转换为张量
)
# 设定验证集比例
validation_split = 0.1
# 计算训练集和验证集的样本数
train_size = int((1 - validation_split) * len(train_data))
val_size = len(train_data) - train_size

# 使用random_split函数将数据集划分为训练集和验证集
train_dataset, val_dataset = random_split(
    train_data, 
    [train_size, val_size],
    generator=torch.Generator().manual_seed(42)  # 设置随机种子以确保可重复性
)


# 加载测试数据集
test_dataset = datasets.FashionMNIST(
    root='../data',  # 指定数据存储路径
    train=False,  # 使用测试集
    download=True,  # 如果数据不存在则下载
    transform=ToTensor()  # 将图像转换为张量
)


# 设置批次大小
batch_size = 64

# 创建数据加载器
train_loader = DataLoader(
    train_dataset,  # 训练数据集
    batch_size=batch_size,  # 每批次的样本数
    shuffle=True  # 随机打乱数据
)

val_loader = DataLoader(
    val_dataset,  # 验证数据集
    batch_size=batch_size,
    shuffle=False  # 验证集不需要打乱
)

test_loader = DataLoader(
    test_dataset,  # 测试数据集
    batch_size=batch_size,
    shuffle=False  # 测试集不需要打乱
)
