# 误差反向传播
求解梯度有两种方法：
- 上一章中的数值微分法
- 本章中的反向传播法

理解反向传播的过程有两种放方法：
- 数学公式
- 计算图

使用计算图的好处：
- 使用计算图可以更好地理解反向传播的过程
- 使用计算图可以高效的计算梯度

链式法则：
- 定义：如果某个函数可以由复合函数表示，则该复合函数的导数可以由构成该符合函数的各个函数的导数乘积表示
- 使用公式表达为：$$\frac{\partial f}{\partial x} = \prod \limits_{i=0}^n \frac{\partial f_i}{\partial x_i}$$
- 乘法节点的反向传播会将输入信号翻转后传给下游
- 加法节点的反向传播会将1传给下游

In [1]:
# 乘法层反向传播的简单实现
class MulLayer:
    def __init__(self):
        self.x = None
        self.y = None

    def forward(self, x, y):
        self.x = x
        self.y = y
        out = x * y

        return out

    def backward(self, dout):
        dx = dout * self.y
        dy = dout * self.x

        return dx, dy

In [3]:
# 测试乘法层的正向、反向传播
apple = 100
apple_num = 2
tax = 1.1

# layer
mul_apple_layer = MulLayer()
mul_tax_layer = MulLayer()

# forward
apple_price = mul_apple_layer.forward(apple, apple_num)
price = mul_tax_layer.forward(apple_price, tax)

print(f'apple_price: {apple_price}')
print(f'price: {price}')

# backforward
# 最终价格自己关于自己的梯度是1
dprice = 1
dapple_price, dtax = mul_tax_layer.backward(dprice)
dapple, dapple_num = mul_apple_layer.backward(dapple_price)
print(dapple_price, dtax, dapple, dapple_num)

apple_price: 200
price: 220.00000000000003
1.1 200 2.2 110.00000000000001
