#### 线性回归的简洁实现
- Tensorflow可以更简洁地实现模型;
- tensorflow.data模块提供了有关数据处理的工具;
- tensorflow.keras.layers模块定义了大量神经网络的层;
- tensorflow.initializers模块定义了各种初始化方法;
- tensorflow.optimizers模块提供了模型的各种优化算法。

#### 1. 数据集

In [2]:
import tensorflow as tf

num_inputs = 2 # 特征数
num_examples = 1000 # 样本数
true_w = [2, -3.4] # 权重
true_b = 4.2 # 偏置
# 随机生成数据集
features = tf.random.normal(shape=(num_examples, num_inputs), stddev=1)
# 生成目标值
labels = true_w[0] * features[:, 0] + true_w[1] * features[:, 1] + true_b
# 增加噪声
labels += tf.random.normal(labels.shape, stddev=0.01)

In [4]:
features.shape

TensorShape([1000, 2])

In [6]:
features.shape, labels.shape

(TensorShape([1000, 2]), TensorShape([1000]))

#### 2. 基于tensorflow读取数据集

In [7]:
batch_size = 10 # 小数据集数目
# 将训练数据的特征和标签组合
dataset = tf.data.Dataset.from_tensor_slices((features, labels))
dataset

<_TensorSliceDataset element_spec=(TensorSpec(shape=(2,), dtype=tf.float32, name=None), TensorSpec(shape=(), dtype=tf.float32, name=None))>

In [8]:
# 随机读取小批量
dataset = dataset.shuffle(buffer_size=num_examples) 
# shuffle: 将数据打乱,提高模型训练效果
dataset = dataset.batch(batch_size)
data_iter = iter(dataset)
# for (batch, (X, y)) in enumerate(dataset):
#     print(batch,X, y)
#     break

#### 3. 模型定义和初始化参数

In [10]:
from tensorflow import keras
from tensorflow.keras import layers
from tensorflow import initializers as init
# 使用Keras定义网络，先定义一个模型变量model（Sequential实例），Sequential实例可以看作是一个串联各个层的容器
model = keras.Sequential() 
# 在该容器中依次添加层，这里添加一层，代表线性回归；init随机初始化权重，偏差参数默认为0，标准差为0.01
model.add(layers.Dense(1, kernel_initializer=init.RandomNormal(stddev=0.01)))

#### 4. 损失函数

In [12]:
from tensorflow import losses
# 这里使用它的均方误差损失作为模型的损失函数
loss = losses.MeanSquaredError()

#### 5. 优化算法

In [14]:
# 无须自己实现小批量随机梯度下降算法
# tensorflow.keras.optimizers 模块提供了很多常用的优化算法比如SGD、Adam和RMSProp等
from tensorflow.keras import optimizers
trainer = optimizers.SGD(learning_rate=0.03)

#### 6. 训练模型

In [17]:
num_epochs = 3 #训练周期
for epoch in range(1, num_epochs + 1): # 循环每一周期
    for (batch, (X, y)) in enumerate(dataset): # 循环每一batch
        with tf.GradientTape() as tape: # 记录动态图梯度
            l = loss(model(X, training=True), y)

        grads = tape.gradient(l, model.trainable_variables) # 找到需要更新的变量，获得动态图中各变量梯度
        trainer.apply_gradients(zip(grads, model.trainable_variables)) # 更新权重，完成一步训练

    l = loss(model(features), labels)
    print('epoch %d, loss: %f' % (epoch, l))


epoch 1, loss: 0.000101
epoch 2, loss: 0.000101
epoch 3, loss: 0.000101


#### 7. 评估模型

In [24]:
print("真实权重：",true_w[0],true_w[1], "\n模型权重：",model.get_weights()[0][0][0],model.get_weights()[0][1][0])

真实权重： 2 -3.4 
模型权重： 2.0003679 -3.3992958


In [30]:
print("真实偏差：",true_b, "\n模型偏差：",model.get_weights()[1][0])

真实偏差： 4.2 
模型偏差： 4.1996474
