## 计算图

计算图通过节点和箭头表示计算过程。节点用○表示，○中是计算的内容。将计算的中间结果写在箭头的上方，表示各个节点的计算结果从左向右传递。

问题1： 太郎在超市买了2 个100 日元一个的苹果，消费税是10%，请计算支付金额。

![](https://gitee.com/liuyang0001/blogimage/raw/master/img/20200801203004.png)

问题2：  太郎在超市买了2 个苹果、3 个橘子。其中，苹果每个100 日元，橘子每个150 日元。消费税是10%，请计算支付金额。

![](https://gitee.com/liuyang0001/blogimage/raw/master/img/20200801203111.png)

用计算图解题的情况下，需要按如下流程进行。

1. 构建计算图。

2. 在计算图上，从左向右进行计算。

这里的第2 歩“从左向右进行计算”是一种正方向上的传播，简称为正向传播（forward propagation）。正向传播是从计算图出发点到结束点的传播。既然有正向传播这个名称，当然也可以考虑反向（从图上看的话，就是从右向左）的传播。实际上，这种传播称为反向传播（backward propagation）。反向传播将在接下来的导数计算中发挥重要作用。

## 链式求导法则

![](https://gitee.com/liuyang0001/blogimage/raw/master/img/20200801233353.png)

## 反向传播是基于链式法则的

![](https://gitee.com/liuyang0001/blogimage/raw/master/img/20200801233504.png)

根据计算图计算z =（x+y)^2，z对x的偏导数：

![](https://gitee.com/liuyang0001/blogimage/raw/master/img/20200801233855.png)

## 简单层的实现

这里，我们把要实现的计算图的乘法节点称为“乘法层”（MulLayer），加法节点称为“加法层”（AddLayer）。

### 乘法层的实现

层的实现中有两个共通的方法（接口）forward()和backward()。forward()对应正向传播，backward()对应反向传播。

In [5]:
# 乘法层的实现
class MulLayer:
    def __init__(self):
        self.x = None
        self.y = None

    # 前向传播
    def forward(self, x, y):
        self.x = x
        self.y = y                
        out = x * y

        return out

    # 反向传播——求导数
    # dout--是一个系数（初始为1）
    def backward(self, dout):
        dx = dout * self.y
        # print(f"dx = {dout} * {self.y} = {dx}")
        dy = dout * self.x
        # print(f"dy = {dout} * {self.x} = {dy}")
        return dx, dy

重新实现计算上面的苹果的问题：

![](https://gitee.com/liuyang0001/blogimage/raw/master/img/20200803112203.png)

In [6]:
apple = 100
apple_num = 2
tax = 1.1
# layer
mul_apple_layer = MulLayer()
mul_tax_layer = MulLayer()
# forward 前向传播
apple_price = mul_apple_layer.forward(apple, apple_num)
price = mul_tax_layer.forward(apple_price, tax)
print(price) # 220

220.00000000000003


In [7]:
# backward
dprice = 1
dapple_price, dtax = mul_tax_layer.backward(dprice)
dapple, dapple_num = mul_apple_layer.backward(dapple_price)
print(dapple, dapple_num, dtax) # 2.2 110 200

2.2 110.00000000000001 200


### 加法层的实现

In [8]:
class AddLayer:
    def __init__(self):
        pass

    # 前向传播
    def forward(self, x, y):
        out = x + y
        return out

    # 反向传播 加法的系数固定为1
    def backward(self, dout):
        dx = dout * 1
        dy = dout * 1

        return dx, dy

例子：购买两个苹果和三个橘子

![](https://gitee.com/liuyang0001/blogimage/raw/master/img/20200803115844.png)

In [15]:
apple = 100
apple_num = 2
orange = 150
orange_num = 3
tax = 1.1
# layer
mul_apple_layer = MulLayer()
mul_orange_layer = MulLayer()
add_apple_orange_layer = AddLayer()
mul_tax_layer = MulLayer()

# forward
# 买苹果
apple_price = mul_apple_layer.forward(apple, apple_num) #(1)
# 买橘子
orange_price = mul_orange_layer.forward(orange, orange_num) #(2)
# 价格相加
all_price = add_apple_orange_layer.forward(apple_price, orange_price) #(3)
# 加上税钱
price = mul_tax_layer.forward(all_price, tax) #(4)


# backward
dprice = 1
dall_price, dtax = mul_tax_layer.backward(dprice) #(4)
dapple_price, dorange_price = add_apple_orange_layer.backward(dall_price) #(3)
dorange, dorange_num = mul_orange_layer.backward(dorange_price) #(2)
dapple, dapple_num = mul_apple_layer.backward(dapple_price) #(1)
print("总价为:", price) # 715
print(f"dapple_num:{dapple_num}, \ndapple:{dapple}, \ndorange:{dorange}, \ndorange_num:{dorange_num}, \ndtax:{dtax}") # 110 2.2 3.3 165 650

总价为: 715.0000000000001
dapple_num:110.00000000000001, 
dapple:2.2, 
dorange:3.3000000000000003, 
dorange_num:165.0, 
dtax:650


## 实现ReLu

![](https://gitee.com/liuyang0001/blogimage/raw/master/img/20200804163316.png)

In [16]:
class Relu:
    def __init__(self):
        self.mask = None

    def forward(self, x):
        self.mask = (x <= 0)
        out = x.copy()
        out[self.mask] = 0

        return out

    def backward(self, dout):
        dout[self.mask] = 0
        dx = dout

        return dx

变量mask是由True/False构成的NumPy数组，它会把正向传播时的输入x的元素中小于等于0 的地方保存为True，其他地方（大于0 的元素）保存为False