In [1]:
import numpy as np
import torch
from torch.utils import data
from d2l import torch as d2l

true_w = torch.tensor([2, -3.4])
true_b = 4.2
features, labels = d2l.synthetic_data(true_w, true_b, 1000)

In [3]:
def load_array(data_arrays, batch_size, is_train=True):
    """构造一个PyTorch数据迭代器"""
    dataset = data.TensorDataset(*data_arrays)  # 创建一个数据集对象，*:解包参数，data_arrays=(features, labels)
    return data.DataLoader(dataset, batch_size, shuffle=is_train) # 创建一个数据加载器，dataset是上一步创建的数据集

batch_size = 10
data_iter = load_array((features, labels), batch_size)  # remind：data_iter是一个DataLoader对象，负责将数据集分成小批次，并在需要时提供这些批次

In [6]:
# 验证是否正常工作
next(iter(data_iter))# iter()用于从一个可迭代对象（这里是DataLoader）创建一个迭代器。next()用于从迭代器中获取下一个项目，这里是一个元组（features, labels）

[tensor([[-0.9912, -1.2268],
         [-1.4712,  1.1625],
         [-0.0169,  0.6459],
         [-0.1577, -0.6110],
         [-1.4047, -0.8467],
         [-0.4623, -1.1433],
         [-0.6722, -0.1065],
         [-1.0573,  2.1277],
         [-1.1552, -0.7636],
         [ 1.0036, -1.6129]]),
 tensor([[ 6.3754],
         [-2.6875],
         [ 1.9754],
         [ 5.9614],
         [ 4.2856],
         [ 7.1777],
         [ 3.2087],
         [-5.1578],
         [ 4.4554],
         [11.6840]])]

In [7]:
# Define model
"""
我们的模型net -> 是个Sequential类的实例
全连接层在Linear类中定义，将两个参数传递到nn.Linear中，第一个指定输入特征形状，第二个指定输出特征形状
"""
from torch import nn
net = nn.Sequential(nn.Linear(2, 1))

In [8]:
# Initialize parameters
net[0].weight.data.normal_(0, 0.01)  # net[0]选择网络中的第一个图层；使用weight.data方法访问参数；使用替换方法normal_重写参数值
net[0].bias.data.fill_(0)

tensor([0.])

In [10]:
# Define loss
loss = nn.MSELoss()  # mean squared error loss 平方L2范数

In [11]:
# Define optimize algorithm
trainer = torch.optim.SGD(net.parameters(), lr=0.03)

In [15]:
# train
"""
在每个epoch中：
    1. 计算损失
    2. 计算梯度
    3. 更新参数
"""
num_epochs = 3
for epoch in range(num_epochs):
    for X, y in data_iter:
        l = loss(net(X), y)  # 计算损失，得到一个标量（已经sum过了）
        trainer.zero_grad()  # 梯度清零
        l.backward()  # 计算梯度
        trainer.step()  # 更新参数
    l = loss(net(features), labels)  
    print(f'epoch {epoch + 1}, loss {l:f}')

epoch 1, loss 0.000103
epoch 2, loss 0.000102
epoch 3, loss 0.000102


In [18]:
w = net[0].weight.data
print('w的估计误差：', true_w - w.reshape(true_w.shape))
b = net[0].bias.data
print('b的估计误差：', true_b - b)

w的估计误差： tensor([3.6240e-05, 2.6822e-04])
b的估计误差： tensor([0.0004])
