### 学习数据加载（Dataset/DataLoader或tf.data.Dataset）构建MNIST数据集加载管道（Torch）

In [None]:
import torch
from torch.utils.data import DataLoader, Dataset
from torchvision import datasets, transforms


#### 1. 定义数据转换
使用`transforms`对数据进行预处理。

In [None]:
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.1307,), (0.3081,)) 
    #0.1307 和 0.3081，分别代表 MNIST 数据集中所有图像像素的均值和标准差。
    #它们是通过对整个 MNIST 训练数据集进行计算得到的。
])

#### 2. 加载MNIST数据集
使用`datasets.MNIST`加载训练和测试数据集。

In [None]:
train_dataset = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
test_dataset = datasets.MNIST(root='./data', train=False, download=True, transform=transform)

#### 3. 创建数据加载器
使用`DataLoader`创建训练和测试数据加载器。

In [None]:
train_loader = DataLoader(dataset=train_dataset, batch_size=64, shuffle=True)
test_loader = DataLoader(dataset=test_dataset, batch_size=1000, shuffle=False)

#### 4. 遍历数据
遍历数据加载器以获取批次数据。

In [None]:
for batch_idx, (data, target) in enumerate(train_loader):
    print(f'Batch {batch_idx}: data shape {data.shape}, target shape {target.shape}')
    if batch_idx == 0:
        break