* ## Dataloader 批训练
DataLoader是 torch 给你用来包装你的数据的工具. 所以将数据形式转换成 Tensor, 然后再放进这个包装器中. 使用 DataLoader 就是他有效地迭代数据。

In [5]:
import torch
torch.manual_seed(1)    # reproducible

BATCH_SIZE = 5      # 批训练的数据个数

x = torch.linspace(1, 10, 10)       # x data (torch tensor)
y = torch.linspace(10, 1, 10)       # y data (torch tensor)

# 先转换成 torch 能识别的 Dataset
torch_dataset = torch.utils.data.TensorDataset(x, y)

# 把 dataset 放入 DataLoader
loader = torch.utils.data.DataLoader(
    dataset=torch_dataset,      # torch TensorDataset format
    batch_size=BATCH_SIZE,      # mini batch size
    shuffle=True,               # 要不要打乱数据 (打乱比较好)
    num_workers=3,              # 多线程来读数据
)

for epoch in range(3):   # 训练所有整套数据 3 次
    for step, (batch_x, batch_y) in enumerate(loader):  # 每一步 loader 释放一小批数据用来学习, step = num_data/batch_size
        # 这里就是你训练的地方...

        # 打出来一些数据
        print('Epoch: ', epoch, '| Step: ', step, '| batch x: ',
              batch_x.numpy(), '| batch y: ', batch_y.numpy())


Epoch:0| Step:0| batch x:[ 5.  7. 10.  3.  4.]| batch y:[6. 4. 1. 8. 7.]
Epoch:0| Step:1| batch x:[2. 1. 8. 9. 6.]| batch y:[ 9. 10.  3.  2.  5.]
Epoch:1| Step:0| batch x:[ 4.  6.  7. 10.  8.]| batch y:[7. 5. 4. 1. 3.]
Epoch:1| Step:1| batch x:[5. 3. 2. 1. 9.]| batch y:[ 6.  8.  9. 10.  2.]
Epoch:2| Step:0| batch x:[ 4.  2.  5.  6. 10.]| batch y:[7. 9. 6. 5. 1.]
Epoch:2| Step:1| batch x:[3. 9. 1. 8. 7.]| batch y:[ 8.  2. 10.  3.  4.]


In [8]:
print(list(enumerate(loader)))

[(0, [tensor([5., 1., 3., 7., 6.]), tensor([ 6., 10.,  8.,  4.,  5.])]), (1, [tensor([10.,  9.,  8.,  2.,  4.]), tensor([1., 2., 3., 9., 7.])])]
