# FashionMNIST 数据集介绍

`FashionMNIST` 数据集是由 Zalando 提供的一个包含时尚商品图像的数据集，旨在为机器学习和计算机视觉任务提供一个简单的基准数据集。与经典的 MNIST 数据集类似，FashionMNIST 包含 10 个类别的图像，但这些图像是时尚产品（如衣物、鞋子等），而不是手写数字。每张图像的大小为 28x28 像素，灰度图像，共有 70,000 张样本（其中 60,000 张用于训练，10,000 张用于测试）。

## 类别标签及其中文翻译

以下是 `FashionMNIST` 数据集中的 10 个类别标签及其对应的中文翻译：

1. **T-shirt/top** - T恤/上衣
2. **Trouser** - 长裤
3. **Pullover** - 套头衫
4. **Dress** - 连衣裙
5. **Coat** - 外套
6. **Sandal** - 凉鞋
7. **Shirt** - 衬衫
8. **Sneaker** - 运动鞋
9. **Bag** - 包
10. **Ankle boot** - 短靴

这些标签代表了数据集中包含的各种时尚商品类别，每个类别的图像都是通过计算机视觉方法进行分类的目标。


In [None]:
# 导入必要的库
import os  # 用于操作文件和目录
import torch  # 用于PyTorch相关操作，尽管在本代码中未使用（可能未来有用）
from torchvision import datasets, transforms  # 用于数据集和数据变换
from PIL import Image  # 用于图像操作，特别是将Tensor转换为图像并保存
from torchvision.datasets import FashionMNIST  # 用于加载FashionMNIST数据集

# 定义数据集保存路径
data_dir = './FashionMNIST_images'  # 定义数据集的根目录
train_dir = os.path.join(data_dir, 'train')  # 训练集保存路径
test_dir = os.path.join(data_dir, 'test')  # 测试集保存路径

# 定义分类标签，FashionMNIST数据集有10个类别
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

# 创建文件夹结构
def create_folders(base_dir):
    """
    创建用于保存数据集的文件夹结构。将数据集分为训练集和测试集，并根据类别在每个集下创建子文件夹。
    """
    for split in ['train', 'test']:  # 对训练集和测试集分别操作
        split_dir = os.path.join(base_dir, split)  # 拼接路径
        os.makedirs(split_dir, exist_ok=True)  # 如果文件夹不存在则创建，存在则不做任何操作
        for class_name in class_names:  # 为每个类别创建一个文件夹
            class_dir = os.path.join(split_dir, class_name)  # 拼接类别文件夹路径
            os.makedirs(class_dir, exist_ok=True)  # 创建类别文件夹

# 保存图像到文件夹
def save_images(dataset, split='train'):
    """
    将数据集中的图像按类别保存到相应的文件夹。
    """
    for i, (image, label) in enumerate(dataset):  # 遍历数据集中的每个图像和标签
        class_name = class_names[label]  # 获取类别名称
        folder_path = os.path.join(data_dir, split, class_name)  # 拼接类别文件夹路径
        
        # 保存图片
        image = transforms.ToPILImage()(image)  # 将Tensor格式的图像转换为PIL图像，以便保存
        image.save(os.path.join(folder_path, f'{split}_{i}.png'))  # 保存为PNG格式，文件名为 "split_i.png"

# 下载FashionMNIST数据集并应用转换
transform = transforms.Compose([transforms.ToTensor()])  # 将图片转换为Tensor格式
train_dataset = FashionMNIST(root='./data', train=True, download=True, transform=transform)  # 下载并加载训练集
test_dataset = FashionMNIST(root='./data', train=False, download=True, transform=transform)  # 下载并加载测试集

# 创建用于保存数据集的文件夹结构
create_folders(data_dir)

# 将训练和测试数据保存到文件夹中
save_images(train_dataset, 'train')  # 保存训练集图像
save_images(test_dataset, 'test')  # 保存测试集图像

# 打印保存成功的信息
print("Images saved successfully.")
