1.import torch.nn as nn：

torch.nn 是 PyTorch 用于构建神经网络的模块。
nn 包含了各种网络层（如 Linear）、损失函数（如 MSELoss）和其他构建模型所需的工具。
通过 nn，我们可以更高效地定义神经网络结构。

2.import torch.nn.functional as F：

torch.nn.functional 提供了许多常见的函数（如激活函数 ReLU，损失函数等。
这些函数不需要额外的参数封装，是一种函数式的接口。

3.import torch.optim as optim：

torch.optim 提供了用于优化模型的算法（如梯度下降优化器 SGD）。
优化器负责根据损失函数的梯度来调整模型参数。

In [None]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
import matplotlib.pyplot as plt
import numpy as np
import os
os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"

In [None]:
torch.manual_seed(1)

In [None]:
x_train=torch.FloatTensor([[1],[2],[3]])
y_train=torch.FloatTensor([[1],[2],[3]])

In [None]:
plt.scatter(x_train,y_train)
xs=np.linspace(1,3,1000)#np.linspace(1, 3, 1000) 生成从 1 到 3 的 1000 个均匀分布的点。
xs_2=np.linspace(1,3,1000)
plt.plot(xs,xs_2)#使用 plt.plot(xs, xs_2) 绘制一条直线

In [None]:
W_1=np.linspace(-5,7,1000)
cost_1=[]
for W in W_1:
    hypothesis=W*x_train
    cost=torch.mean((hypothesis-y_train)**2)
    cost_1.append(cost.item())

In [None]:
plt.plot(W_1,cost_1)
plt.xlabel('$W$')
plt.ylabel('cost')
plt.show

Gradient Descent by Hand

In [None]:
W=torch.zeros(1)
lr=0.1
nb_epochs=10
for epoch in range(nb_epochs+1):
    hypothesis=x_train*W #按元素乘法，适用于单特征的情况。多特征数据，应使用矩阵乘法
    cost=torch.mean((hypothesis-y_train)**2)
    gradient=torch.sum((W*x_train-y_train)*x_train)#对所有样本的误差加权和进行求和,沿着总的损失函数的梯度方向更新权重
    print('Epochs:{:4d}/{} W: {:.3f}, Cost: {:.6f}'.format(
        epoch, nb_epochs, W.item(), cost.item()
    ))
    W-=lr*gradient

Advanced

In [None]:
W=torch.zeros(1,requires_grad=True)
b=torch.zeros(1,requires_grad=True)

optimizer=optim.SGD([W,b],lr=0.01)

nb_epochs=1000
for epoch in range(nb_epochs+1):
    
    hypothesis=W*x_train+b
    cost=torch.mean((hypothesis-y_train)**2)
    
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()
    
    if epoch%100==0:
        print('Epoch {:4d}/{} W: {:.3f}, b: {:.3f} Cost: {:.6f}'.format(
            epoch, nb_epochs, W.item(), b.item(), cost.item()
        ))            

In [None]:
class LinearRegressionModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.linear = nn.Linear(1, 1)

    def forward(self, x):
        return self.linear(x)
    
model=LinearRegressionModel()

optimizer=optim.SGD(model.parameters(),lr=0.01)

nb_epochs=1000
for epoch in range(nb_epochs+1):
    
    prediction=model(x_train)
    cost=F.mse_loss(prediction,y_train)
    
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()
    
    if epoch%100==0:
        
        params=list(model.parameters())
        
        W=params[0].item()
        b=params[1].item()
        
        print('Epoch {:4d}/{} W: {:.3f}, b: {:.3f} Cost: {:.6f}'.format(
            epoch, nb_epochs, W, b, cost.item()
        ))