# MyDataset 类技术文档

## 概述
MyDataset 类是一个用于图像分类任务的自定义数据集类，继承自 PyTorch 的 Dataset 类。该类主要用于加载和处理真假图片分类数据。

## 详细说明

### 类定义

#### 构造函数参数
- `root_dir` (str): 数据集根目录路径
- `label_dir` (str): 标签目录名称（如 "Real" 或 "Fake"）
- `transform` (可选): 图像预处理转换器，默认为 None

### 主要属性

In [None]:
self.root_dir    # 数据集根目录
self.label_dir   # 标签目录
self.path        # 完整的图片目录路径
self.image_path  # 目录下所有图片文件名列表
self.transform   # 图像转换器

### 核心方法
- `__getitem__(idx: int)`
    - 获取单个数据样本。
    - 功能：
        - 根据索引加载图片
        - 应用图像转换（如果有）
        - 根据目录名确定标签
        - 返回(图像, 标签)对
    - 标签规则：
        - Fake/fake: 0
        - Real/real: 1
        - 其他: 2

- `__len__()`
    - 返回数据集中样本总数。

## 使用示例

In [None]:
# 创建数据集实例
dataset = MyDataset(
    root_dir="path/to/dataset",
    label_dir="Real",
    transform=transforms.Compose([
        transforms.Resize((224, 224)),
        transforms.ToTensor()
    ])
)

# 获取单个样本
image, label = dataset[0]