## 1. Iterator
Iterator 是一种在不一次性将所有数据加载到内存中的情况下，通过按需生成数据逐步迭代访问集合元素的对象。

In [1]:
class MyIterator:
    def __init__(self, data):
        self.data = data
        self.index = 0

    def __iter__(self):
        # 返回迭代器对象，通常是 self
        return self

    def __next__(self):
        # 返回下一个元素，或者引发 StopIteration 异常
        if self.index < len(self.data):
            result = self.data[self.index]
            self.index += 1
            return result
        else:
            raise StopIteration

# 使用 MyIterator 类创建迭代器
my_iterator = MyIterator([1, 2, 3, 4])

# 使用 for 循环迭代对象
for element in my_iterator:
    print(element)

1
2
3
4


# 2. Dataloeader

DataLoader 是 PyTorch 中用于批量加载数据的工具，能够高效地按批次、打乱顺序、并行地从数据集加载数据以进行深度学习模型的训练和评估。

In [2]:
from torch.utils.data import Dataset, DataLoader

class MyDataset(Dataset):
    def __init__(self, data):
        self.data = data

    def __len__(self):
        return len(self.data)

    def __getitem__(self, index):
        return self.data[index]

# 创建 DataLoader
dataset = MyDataset([1, 2, 3, 4])
dataloader = DataLoader(dataset, batch_size=2, shuffle=True)

for batch in dataloader:
    print(batch)


tensor([4, 2])
tensor([3, 1])


| 特性          | Python 迭代器                  | PyTorch `DataLoader`         |
| ------------- | ------------------------------ | ---------------------------- |
| 适用场景      | 普通数据迭代                   | 深度学习数据加载              |
| 核心方法      | `__iter__`, `__next__`          | `__len__`, `__getitem__`      |
| 是否批处理    | 否                             | 是                            |
| 数据打乱      | 需手动实现                     | 支持自动打乱                  |
| 并行加载      | 否                             | 支持多进程并行                |
