In [2]:
import tensorflow as tf

## 反向传播算法
### 1. 链式法则

In [15]:
# 使用tensorflow说明链式法则
# 构建待优化变量
x = tf.constant(1.)
w1 = tf.constant(2.)
b1 = tf.constant(1.)
w2 = tf.constant(2.)
b2 = tf.constant(1.)

# 构建梯度记录器，默认情况下只能调用一次
# 如果需要多次调用，persistent = True
with tf.GradientTape(persistent = True) as tape:
    
    # 如果张量是非tf.Variable类型，需要人为设置记录梯度信息
    tape.watch([w1, b1, w2, b2])
    
    # 构建2层线性网络
    y1 = x * w1 + b1
    y2 = y1 * w2 + b2

# 独立求出各个偏导数
dy2_dy1 = tape.gradient(y2, [y1])
dy1_dw1 = tape.gradient(y1, [w1])
dy2_dw1 = tape.gradient(y2, [w1])
dy2_dw2 = tape.gradient(y2, [w2])
dy1_db1 = tape.gradient(y1, [b1])
dy2_db1 = tape.gradient(y2, [b1])

# 查看链式法则是否成立
dy1_dw1[0] * dy2_dw1[0] == dy2_dw1[0], \
dy1_db1[0] * dy2_dw1[0] == dy2_db1[0]

(<tf.Tensor: id=281, shape=(), dtype=bool, numpy=True>,
 <tf.Tensor: id=283, shape=(), dtype=bool, numpy=True>)

In [18]:
# 实现一个Himmelblau优化算法
# 函数
def himmelblau(x):
    return (x[0] ** 2 + x[1] - 11) ** 2 + (x[0] + x[1] ** 2 - 7) ** 2

# 初始化参数
x = tf.constant([4., 0.])

# 循环优化
for step in range(200):
    
    # 梯度跟踪
    with tf.GradientTape() as tape:
        tape.watch([x])
        y = himmelblau(x)
    # 反向传播，计算梯度
    grads = tape.gradient(y, [x])[0]
    
    # 更新参数
    x -= 0.01 * grads

# 打印结果
x, y

(<tf.Tensor: id=25885, shape=(2,), dtype=float32, numpy=array([ 3.5844283, -1.8481264], dtype=float32)>,
 <tf.Tensor: id=25852, shape=(), dtype=float32, numpy=2.2737368e-13>)