In [2]:
import torch

In [3]:
x_data = torch.Tensor([[1.0],[2.0],[3.0]])
y_data = torch.Tensor([[2.0],[4.0],[6.0]])

In [4]:
# 定义一个名为 LinearModel 的类，该类继承自 torch.nn.Module 类
class LinearModel(torch.nn.Module):

    # 构造函数，用于初始化模型的参数和结构
    def __init__(self):
        super(LinearModel, self).__init__()  # Just do it. :)
        # 定义一个名为 linear 的属性，其类型为 torch.nn.Linear，
        # 表示该模型包含一个线性层（只有一层）
        self.linear = torch.nn.Linear(1, 1)

    # 前向传播函数，用于计算输出结果
    def forward(self, x):
        # 计算预测值 y_pred，即将输入 x 通过线性层 linear 进行变换得到的输出
        y_pred = self.linear(x)
        # 返回预测值
        return y_pred


# 创建一个 LinearModel 的实例，并赋值给变量 model
model = LinearModel()


In [5]:
# 使用均方误差损失函数作为评价指标
criterion = torch.nn.MSELoss(size_average=False)

# 使用随机梯度下降优化算法来训练模型，设置学习率为0.01
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)





在 PyTorch 中，模型的参数通常通过 `torch.nn.Module` 模块的子类来定义。而该行代码中的 `model.parameters()` 是在获取这个模型所有可训练参数的迭代器。

具体地讲，当我们使用 `torch.nn` 模块来创建一个深度学习模型时，我们会在其构造函数中定义一些可训练参数，如全连接层的权重矩阵、卷积层的卷积核等等，这些参数默认会被设置为需要梯度更新（requires_grad=True）。在之后的训练中，我们通过梯度下降法来最小化损失函数，从而不断更新这些参数的数值。

因此，在训练前，我们需要获得这些可训练参数的引用，以便进行优化和反向传播计算。`model.parameters()` 就是获取当前模型中所有可训练参数的迭代器，返回一个包含所有参数的迭代器对象。这个迭代器可以被输入到任何期望模型参数作为输入的 PyTorch 优化器中，如 Stochastic Gradient Descent (SGD) 等。在每一轮训练中，优化器都能够根据损失函数计算梯度并将其应用于对应的参数上，以更新参数值。

因此， `model.parameters()` 的作用是提供模型中所有可训练参数的迭代器，以便于优化器进行参数更新。

In [12]:
# 循环训练模型，共迭代100个epoch
for epoch in range(1000):
    # 前向传播计算预测值y_pred
    y_pred = model(x_data)
    # 计算预测值y_pred和真实值y_data之间的损失loss
    loss = criterion(y_pred, y_data)
    # 打印当前epoch数和损失loss
    print(epoch, loss)

    # 梯度清零，防止上一次迭代的梯度对本次迭代造成干扰
    optimizer.zero_grad()
    # 反向传播求解梯度
    loss.backward()
    # 更新参数
    optimizer.step()

print('w =', model.linear.weight.item())
print('b =', model.linear.bias.item())


0 tensor(4.0927e-12, grad_fn=<MseLossBackward0>)
1 tensor(4.0927e-12, grad_fn=<MseLossBackward0>)
2 tensor(4.0927e-12, grad_fn=<MseLossBackward0>)
3 tensor(4.0927e-12, grad_fn=<MseLossBackward0>)
4 tensor(4.0927e-12, grad_fn=<MseLossBackward0>)
5 tensor(4.0927e-12, grad_fn=<MseLossBackward0>)
6 tensor(4.0927e-12, grad_fn=<MseLossBackward0>)
7 tensor(4.0927e-12, grad_fn=<MseLossBackward0>)
8 tensor(4.0927e-12, grad_fn=<MseLossBackward0>)
9 tensor(4.0927e-12, grad_fn=<MseLossBackward0>)
10 tensor(4.0927e-12, grad_fn=<MseLossBackward0>)
11 tensor(4.0927e-12, grad_fn=<MseLossBackward0>)
12 tensor(4.0927e-12, grad_fn=<MseLossBackward0>)
13 tensor(4.0927e-12, grad_fn=<MseLossBackward0>)
14 tensor(4.0927e-12, grad_fn=<MseLossBackward0>)
15 tensor(4.0927e-12, grad_fn=<MseLossBackward0>)
16 tensor(4.0927e-12, grad_fn=<MseLossBackward0>)
17 tensor(4.0927e-12, grad_fn=<MseLossBackward0>)
18 tensor(4.0927e-12, grad_fn=<MseLossBackward0>)
19 tensor(4.0927e-12, grad_fn=<MseLossBackward0>)
20 tensor(

In [13]:
x_test = torch.Tensor([4.0])
y_test = model(x_test)
print('y_pred = ', y_test.data)


y_pred =  tensor([8.0000])
