# 线性回归的简洁实现

随着深度学习框架的发展，开发深度学习应用变得越来越便利。实践中，我们通常可以用比上一节更简洁的代码来实现同样的模型。在本节中，我们将介绍如何使用tensorflow2.0推荐的keras接口更方便地实现线性回归的训练。

## 生成数据集

我们生成与上一节中相同的数据集。其中`features`是训练数据特征，`labels`是标签。

In [1]:
import tensorflow as tf

num_inputs = 2
num_examples = 1000
true_w = [2, -3.4]
true_b = 4.2
features = tf.random.normal(stddev=1, shape=(num_examples, num_inputs))
labels = true_w[0] * features[:, 0] + true_w[1] * features[:, 1] + true_b
labels += tf.random.normal(stddev=0.01, shape=labels.shape)

## 定义模型

在上一节从零开始的实现中，我们需要定义模型参数，并使用它们一步步描述模型是怎样计算的。当模型结构变得更复杂时，这些步骤将变得更繁琐。其实，keras提供了大量预定义的层，这使我们只需关注使用哪些层来构造模型。下面将介绍如何使用keras更简洁地定义线性回归。

首先，导入`keras`模块。我们先定义一个模型变量`model`，它是一个`Sequential`实例。在keras中，`Sequential`实例可以看作是一个串联各个层的容器。在构造模型时，我们在该容器中依次添加层。当给定输入数据时，容器中的每一层将依次计算并将输出作为下一层的输入。

In [2]:
from tensorflow import keras

model = keras.Sequential()

回顾图3.1中线性回归在神经网络图中的表示。作为一个单层神经网络，线性回归输出层中的神经元和输入层中各个输入完全连接。因此，线性回归的输出层又叫全连接层。在keras中，全连接层是一个`Dense`实例。我们定义该层输出个数为1。

In [3]:
model.add(keras.layers.Dense(1))

值得一提的是，在keras中我们无须指定每一层输入的形状。

In [4]:
model.compile(optimizer=tf.keras.optimizers.SGD(0.03),
              loss='mse')

## 定义损失函数和优化方法

在keras中，定义完模型后，调用`compile()`方法可以配置模型的损失函数和优化方法。定义损失函数只需传入`loss`的参数，keras定义了各种损失函数，并直接使用它提供的平方损失`mse`作为模型的损失函数。同样，我们也无须实现小批量随机梯度下降，只需传入`optimizer`的参数，keras定义了各种优化算法，我们这里直接指定学习率为0.03的小批量随机梯度下降`tf.keras.optimizers.SGD(0.03)`为优化算法。

## 训练模型

在使用keras训练模型时，我们通过调用`model`实例的`fit`函数来迭代模型。`fit`函数只需传入你的输入x和输出y，还有epoch遍历数据的次数，每次更新梯度的大小batch_size, 这里定义epoch=3，batch_size=10。

In [5]:
model.fit(features,labels,epochs=3, batch_size=10)

Epoch 1/3
Epoch 2/3
Epoch 3/3


<tensorflow.python.keras.callbacks.History at 0x7febd7ae9518>

下面我们分别比较学到的模型参数和真实的模型参数。我们可以通过model的`get_weights()`来获得其权重（`weight`）和偏差（`bias`）。学到的参数和真实的参数很接近。

In [6]:
true_w, model.get_weights()[0]

([2, -3.4], array([[ 1.999371 ],
        [-3.4004138]], dtype=float32))

In [8]:
true_b, model.get_weights()[1]

(4.2, array([4.20056], dtype=float32))