In [9]:
import numpy as np
import torch
# pytorch中用于处理数据加载和预处理模块
from torch.utils import data
from d2l import torch as d2l

In [10]:
# 生成数据集
true_w = torch.tensor([2,-3.4])
true_b = 4.2
# d2l获取数据模块，获取1000个
features,labels = d2l.synthetic_data(true_w, true_b, 1000)

In [16]:
#TensorDataset 用法
#features = torch.tensor([[1, 2], [3, 4], [5, 6]])
#labels = torch.tensor([0, 1, 0])
#dataset = data.TensorDataset(features,labels)
#print(dataset[1:3])

In [19]:
# 读取数据集
# is_train=True表示希望数据迭代器对象在每个迭代周期内打乱数据
def load_array(data_arrays,batch_size,is_train=True):
    #打包数据，使特征和标签对应
    dataset = data.TensorDataset(*data_arrays)
    #返回一批数据的特征和标签，为一个可迭代对象
    return data.DataLoader(dataset,batch_size,shuffle=is_train)
batch_size=10
data_iter = load_array((features,labels),batch_size)

In [34]:
# 可迭代对象转换为迭代器,通过next来一次访问
#next(iter(data_iter))


In [35]:
# 定义模型
# nn是神经网络的缩写
from torch import nn
# 创建一个神经网络模型，只包含一个线性层
net = nn.Sequential(nn.Linear(2, 1))
# net[0]：访问第一层网络
# weight：访问权重
# data：访问数据
# normal_进行填充数据
# bias：访问偏置
# fill_:原地填充为0
net[0].weight.data.normal_(0, 0.01)
net[0].bias.data.fill_(0)

tensor([0.])

In [36]:
# 定义损失函数
# 函数取别名
#loss(y_pred, y_true)预测值，真实值
loss = nn.MSELoss()

In [37]:
# 定义优化函数
# net.parameters()获取神经网络模型中所有可学习参数的方法。
#这些可学习参数通常包括权重和偏置参数，它们在模型训练过程中会根据损失函数和梯度下降算法
#进行更新。
trainer = torch.optim.SGD(net.parameters(), lr=0.03)
# 指定学习率

In [41]:
# 训练模型
num_epochs = 3
for epoch in range(num_epochs):
    for X,y in data_iter:
        # net(X)进行向前传播，并生成模型输出
        l = loss(net(X),y)
        trainer.zero_grad()
        l.backward()
        #进行梯度下降更新
        trainer.step()
    l = loss(net(features), labels)
    print(f'epoch {epoch + 1}, loss {l:f}')

epoch 1, loss 0.000105
epoch 2, loss 0.000104
epoch 3, loss 0.000104


In [42]:
w = net[0].weight.data
print('w的估计误差：', true_w - w.reshape(true_w.shape))
b = net[0].bias.data
print('b的估计误差：', true_b - b)

w的估计误差： tensor([0.0004, 0.0004])
b的估计误差： tensor([0.0004])
