# 从零开始线性回归

In [11]:
import torch
from torch import nn, optim
from torch.utils import data
from d2l import torch as d2l

In [12]:
# 生成数据集
true_w = torch.tensor([2, -3.4])
true_b = 4.2
features, labels = d2l.synthetic_data(true_w, true_b, 1000)

In [13]:
def load_array(data_arrays, batch_size, is_train=True):
    """构造一个PyTorch数据迭代器"""
    dataset = data.TensorDataset(*data_arrays) # 将特征和标签组合,*表示将data_arrays中的元素分别作为参数传入
    return data.DataLoader(dataset, batch_size, shuffle=is_train) # 构造一个PyTorch数据迭代器

In [14]:
batch_size = 10
data_iter = load_array((features, labels), batch_size)

In [21]:
next(iter(data_iter)) # iter()函数用来生成迭代器，next()函数用来获取迭代器的下一个元素

TypeError: 'DataLoader' object is not an iterator

这个代码示例主要用于构造一个PyTorch数据迭代器，用于批量处理数据。我们逐步解释这个代码示例中的各个部分：

load_array函数接受三个参数：data_arrays（包含特征和标签的元组）、batch_size（批处理大小）和is_train（一个布尔值，表示是否需要在训练时打乱数据顺序）。

函数中首先使用torch.utils.data.TensorDataset类将特征和标签组合成一个数据集对象。*data_arrays表示将data_arrays中的元素分别作为参数传入。

接下来，使用torch.utils.data.DataLoader类创建一个数据迭代器。DataLoader类会将数据集对象、批处理大小和是否打乱数据顺序作为参数。DataLoader对象本身并不是一个迭代器，而是一个可迭代对象，可以用来生成迭代器。

batch_size = 10定义了每个批次的大小。

data_iter = load_array((features, labels), batch_size)调用load_array函数，创建一个DataLoader对象。这个对象可以生成批量数据迭代器。

next(iter(data_iter))这一行代码的目的是获取批量数据迭代器的下一个元素（一个批次的数据）。首先，iter(data_iter)调用了DataLoader对象的__iter__()方法，创建了一个新的迭代器。然后，next()函数从该迭代器中获取下一个元素。实际上，你可以在for循环中直接使用DataLoader对象，因为它是一个可迭代对象。这里使用next(iter(data_iter))只是为了展示如何手动获取一个批次的数据。

总结一下，这段代码的主要目的是创建一个PyTorch数据迭代器，用于批量处理数据。DataLoader对象本身不是一个迭代器，而是一个可迭代对象。当你需要访问数据迭代器的下一个元素时，可以通过调用iter()函数生成一个新的迭代器，然后使用next()函数获取下一个元素。在实际应用中，你通常会在for循环中直接使用DataLoader对象。

In [16]:
# 定义模型
net = nn.Sequential(nn.Linear(2, 1)) # nn.Linear()函数用来构造一个全连接层，2表示输入的特征数，1表示输出的特征数

In [17]:
net[0].weight.data.normal_(0, 0.01) # 初始化模型参数
net[0].bias.data.fill_(0)

tensor([0.])

In [18]:
loss = nn.MSELoss() # nn.MSELoss()函数用来构造一个均方误差损失函数

In [19]:
trainer = optim.SGD(net.parameters(), lr=0.03) # optim.SGD()函数用来构造一个随机梯度下降优化器

In [20]:
# 训练模型
num_epochs = 3
for epoch in range(num_epochs):
    for X, y in data_iter:
        l = loss(net(X), y) # 计算损失
        trainer.zero_grad() # 梯度清零
        l.backward() # 反向传播
        trainer.step() # 迭代模型参数
    l = loss(net(features), labels)
    print(f'epoch {epoch + 1}, loss {l:f}')

epoch 1, loss 0.000253
epoch 2, loss 0.000105
epoch 3, loss 0.000105
