In [1]:
import numpy as np
import torch
from torch.utils import data
from d2l import torch as d2l

In [2]:
true_w = torch.tensor([2, -3.4])
true_b = 4.2
features, labels = d2l.synthetic_data(true_w, true_b, 1000)

In [3]:
def load_array(data_arrays, batch_size, is_train=True):
    """构造一个Pytorch数据迭代器"""
    dataset = data.TensorDataset(*data_arrays) # * 表示传入的参数args是一个元组，** 表示传入的参数args是一个字典
    return data.DataLoader(dataset, batch_size, shuffle=is_train) # 这是一个数据加载器，用于加载数据并生成小批次供模型训练。

batch_size = 10
data_iter = load_array((features, labels), batch_size)

next(iter(data_iter))

[tensor([[ 0.3551,  1.7673],
         [-1.2251, -1.6617],
         [ 0.6565, -0.1224],
         [-1.6279, -1.2256],
         [-0.5363,  1.3034],
         [-2.3440,  1.3905],
         [-1.6693,  0.1119],
         [ 1.7608,  0.9719],
         [-1.0507,  1.1723],
         [-0.2266,  1.4051]]),
 tensor([[-1.1001],
         [ 7.3931],
         [ 5.9389],
         [ 5.1135],
         [-1.3003],
         [-5.2101],
         [ 0.4818],
         [ 4.4260],
         [-1.9013],
         [-1.0406]])]

In [4]:
import torch.nn as nn

In [5]:
net = nn.Sequential(nn.Linear(2, 1)) # (2,1)为输入输出维度

In [6]:
net[0].weight.data.normal_(0, 0.01) # 均值为0，标准差为0.01
net[0].bias.data.fill_(0)

tensor([0.])

In [7]:
loss = nn.MSELoss()

In [8]:
trainer = torch.optim.SGD(net.parameters(), lr=0.03) #随机梯度下降算法

In [9]:
num_epoch = 3
for epoch in range(num_epoch):
    for X, y in data_iter:
        '''
        在代码中，net(X) 返回了模型对输入数据 X 的预测结果，
        这是一个张量（tensor），通常是一个包含预测值的向量或矩阵，
        取决于模型的输出维度和小批次的大小。然后，这个预测结果与真实目标 y 一起传递给损失函数 loss，
        并由 loss 计算出一个标量值 l，表示整个小批次的损失。
        '''
        l = loss(net(X), y) # net(X) 表示将输入数据 X 通过模型前向传播，得到模型的预测结果
        trainer.zero_grad()
        l.backward()
        trainer.step() # 来更新模型的参数
    l = loss(net(features), labels)
    print(f'epoch {epoch + 1}, loss {l:f}')

epoch 1, loss 0.000218
epoch 2, loss 0.000103
epoch 3, loss 0.000104
