### 3.3 线性回归的简洁实现
使用tenseorflow2.1推荐的keras接口更方便地实现线性回归的训练

### 3.3.1 生成数据集

In [4]:
import tensorflow as tf
num_input=2 # 特征数目
num_examples=1000 #样本数目

w_true=[2,-3.4]
b_true=4.2
features=tf.random.normal((num_examples,num_input),stddev=1)
labels=w_true[0]*features[:,0]+w_true[1]*features[:,1]+b_true
labels+=tf.random.normal((1,),stddev=0.01)

### 3.3.2 读取数据
虽然tensorflow2可以直接你和线性回归，不需要划分数据集，但我们仍然学习一下读取数据的方法

In [5]:
from tensorflow import data as tfdata

batch_size=10
#训练数据的特征和标签组合起来
dataset=tfdata.Dataset.from_tensor_slices((features,labels))
#随机读取小批量样本
dataset=dataset.shuffle(buffer_size=num_examples)
dataset=dataset.batch(batch_size)
for (batch,(X,y)) in enumerate(dataset):
    print(X,y)
    break

tf.Tensor(
[[-2.5739121  -0.03105187]
 [-1.1676126  -0.27078718]
 [-2.0111303   1.2487797 ]
 [-1.234453   -0.7569317 ]
 [-0.454333   -0.42830804]
 [ 0.6063047  -0.50836664]
 [ 0.77010465 -0.8540454 ]
 [ 0.18733422 -0.15464906]
 [-0.47878644  0.65418017]
 [ 0.55609     0.4219057 ]], shape=(10, 2), dtype=float32) tf.Tensor(
[-0.8397572  2.787942  -4.0656214  4.3071527  4.750072   7.143547
  8.646455   5.1029663  1.020705   3.880191 ], shape=(10,), dtype=float32)


### 3.3.3 定义模型和初始化参数
tensorflow2.0推荐使用keras定义网络
keras中初始化参数由kernel_initializer 和bias_initializer选项分别设置权重和偏置的初始化方式，偏差参数默认会初始化为0

In [6]:
from tensorflow import keras
from tensorflow.keras import layers
from tensorflow import initializers as init
model=keras.Sequential()
model.add(layers.Dense(1,kernel_initializer=init.RandomNormal(stddev=0.01)))

### 3.3.4 定义损失函数
tensorflow在losses模块中提供了各种损失函数和自定义损失函数的基类，
这里直接使用均方误差损失作为模型的损失函数

In [7]:
from tensorflow import losses
loss=losses.MeanSquaredError()

### 3.3.5 定义优化方法
tensorflow.keras.optimizers模块提供了常用的优化算法如SGD、Adam、RMSProp等。

In [8]:
from tensorflow.keras import optimizers
trainer=optimizers.SGD(learning_rate=0.03)

### 3.3.6 训练模型
执行tape.gradient获得动态图中各变量梯度

通过model.trainable_variables找到需要更新的变量

使用trainer.apply_gradients更新权重，完成一步训练

In [10]:
num_epochs=3
for epoch in range(num_epochs):
    for (batch,(X,y)) in enumerate(dataset):
        with tf.GradientTape() as t:
            l=loss(model(X,training=True),y)
        grads=t.gradient(l,model.trainable_variables)
        trainer.apply_gradients(zip(grads,model.trainable_variables))
    l=loss(model(features),labels)
    print('epoch={},loss={}'.format(epoch+1,l))

epoch=1,loss=0.00012905884068459272
epoch=2,loss=5.990940521449772e-10
epoch=3,loss=5.410730457428015e-12


In [13]:
model.get_weights()[0] # 权重（weight）

array([[ 2.0000002],
       [-3.3999999]], dtype=float32)

In [14]:
model.get_weights()[1]#偏差（bias）

array([4.2024884], dtype=float32)