In [1]:
import numpy as np
import torch
from torch.utils import data
from d2l import torch as d2l

In [2]:
true_w = torch.tensor([2, -3.4])
true_b = 4.2
features, labels = d2l.synthetic_data(true_w, true_b, 1000)

In [3]:
batch_size = 10
data_iter = d2l.load_array((features, labels), batch_size)

In [4]:
next(iter(data_iter))

[tensor([[ 0.4937, -0.3232],
         [-0.2889,  1.3658],
         [-0.8844, -0.6261],
         [ 0.5489,  0.5875],
         [ 0.7929, -0.3901],
         [-2.6096,  0.6206],
         [-0.0626,  0.2885],
         [-0.4200,  0.4516],
         [-0.4300, -0.3877],
         [-0.0859,  0.2096]]),
 tensor([[ 6.2814],
         [-1.0332],
         [ 4.5664],
         [ 3.2972],
         [ 7.1202],
         [-3.1159],
         [ 3.1028],
         [ 1.8151],
         [ 4.6601],
         [ 3.3171]])]

In [5]:
#对于标准深度学习模型，我们可以使用框架的预定义好的层。
#这使我们只需关注使用哪些层来构造模型，而不必关注层的实现细节。
#我们首先定义一个模型变量net，它是一个Sequential类的实例。
#Sequential类将多个层串联在一起。 当给定输入数据时，
#Sequential实例将数据传入到第一层， 然后将第一层的输出作为第二层的输入，以此类推。 在下面的例子中，我们的模型只包含一个层，因此实际上不需要Sequential。
#但是由于以后几乎所有的模型都是多层的，在这里使用Sequential会让你熟悉“标准的流水线”。

# nn是神经网络的缩写
from torch import nn

net = nn.Sequential(nn.Linear(2, 1))

In [6]:
#在使用net之前，我们需要初始化模型参数。 如在线性回归模型中的权重和偏置。 深度学习框架通常有预定义的方法来初始化参数。
#在这里，我们指定每个权重参数应该从均值为0、标准差为0.01的正态分布中随机采样， 偏置参数将初始化为零。
net[0].weight.data.normal_(0, 0.01)
net[0].bias.data.fill_(0)

tensor([0.])

In [7]:
# 定义损失函数
loss = nn.MSELoss()

In [8]:
# 定义优化算法
trainer = torch.optim.SGD(net.parameters(), lr=0.03)

In [9]:
#训练
num_epochs = 3
for epoch in range(num_epochs):
    for X, y in data_iter:
        l = loss(net(X) ,y)
        trainer.zero_grad()
        l.backward()
        trainer.step()
    l = loss(net(features), labels)
    print(f'epoch {epoch + 1}, loss {l:f}')

epoch 1, loss 0.000236
epoch 2, loss 0.000103
epoch 3, loss 0.000103


In [None]:
w = net[0].weight.data
print('w的估计误差：', true_w - w.reshape(true_w.shape))
b = net[0].bias.data
print('b的估计误差：', true_b - b)

w的估计误差： tensor([-0.0011,  0.0003])
b的估计误差： tensor([0.0007])
