# 线性回归的简简洁实现

**通过使用深度学习框架来简洁的实现线性回归模型生成数据集**

In [11]:
import numpy as np
import torch
from torch.utils import data
from d2l import torch as d2l

true_w = torch.tensor([2, -3.4])
true_b = 4.2
features, labels = d2l.synthetic_data(true_w, true_b, 1000)   #生成数据集

In [13]:
def load_array(data_arrays, batch_size, is_train=True):
    ''' 构造一个pytorch的数据迭代器'''
    dataset = data.TensorDataset(*data_arrays)
    return data.DataLoader(dataset, batch_size, shuffle=is_train) #每次从数据集中挑出指定数量的数据

batch_size = 10
data_iter = load_array((features,labels), batch_size)

next(iter(data_iter))

[tensor([[ 1.1253,  0.6684],
         [-1.1846, -0.2699],
         [-0.9220, -0.1629],
         [-0.1488,  0.4489],
         [ 1.7706, -1.4559],
         [ 1.9011,  0.0120],
         [-1.0077, -1.6793],
         [-2.0265, -0.3730],
         [ 0.4221,  0.4281],
         [ 0.0121,  0.5463]]),
 tensor([[ 4.1954],
         [ 2.7472],
         [ 2.9226],
         [ 2.3713],
         [12.6737],
         [ 7.9512],
         [ 7.8946],
         [ 1.4220],
         [ 3.5941],
         [ 2.3662]])]

**使用框架预定义好的层**

In [23]:
from torch import  nn    #nn是神经网络的缩写

net = nn.Sequential(nn.Linear(2, 1))   #这里的2 ， 1分别表述，输入一个2维向量， 即变量x1， x2， 输出预测值 y  y = w1x1 + w2x2 + w3*x3 + b

**初始化模型参数**

In [36]:
net[0].weight.data.normal_(0, 0.01)
net[0].bias.data.fill_(0)

tensor([0.])

net[0].weight.data.normal_(0, 0.01)：
1. net[0]：访问net中的第一个层，即之前定义的nn.Linear(2, 1)层。
2. weight：访问该层的权重参数。
3. data：访问权重参数的实际数据。
4. normal_(0, 0.01)：使用正态分布来初始化权重数据。这里的0表示正态分布的均值，0.01表示标准差（即方差的平方根）。这意味着权重参数将从均值为0、标准差为0.01的正态分布中随机采样。

net[0].bias.data.fill_(0)：
1. bias：访问该层的偏置参数。
2. data：访问偏置参数的实际数据。
3. fill_(0)：将偏置参数的值全部设置为0。

In [56]:
loss = nn.MSELoss()   #使用均方误差作为损失函数
trainer = torch.optim.SGD(net.parameters(), lr=0.03)

注：
1. 
nn.MSELoss()：创建一个均方误差（Mean Squared Error, MSE）损失函数对象
2. 3)：
torch.optim.SGD：创建一个随机梯度下降（Stochastic Gradient Descent, SGD）.
3. 失函数。
net.parameters()：传递给优化器的是神经网络net的所有可学习参数（即权
4. 和偏置）。
lr=0.03：设置学习率（learning rate在训练过程中使用

**训练**

In [62]:
num_epochs = 3
for epoch in range(num_epochs):
    for X, y in data_iter:
        l = loss(net(X), y)
        trainer.zero_grad()   #梯度清零
        l.backward()
        trainer.step()
    l = loss(net(features), labels)
    print(f'epoch {epoch + 1}, loss {l:f}')

epoch 1, loss 0.000102
epoch 2, loss 0.000101
epoch 3, loss 0.000101
