## 激活函数求导

上面一个小节通过coding实现了对于乘法和加法的前向和反向的实现。这一小节将来实现两个常用的激活函数的实现。
- ReLU
- Sigmoid

### ReLU层

首先我们复习一下ReLU函数的表达式：
![](imgs/13.jpg)
导数的式子：
![](imgs/14.jpg)

从上式子中可以看出，
- 当输入的值大于0，反向传播则将上游的数据原封不动的传递到下游。
- 当输入的值小于0，反向传播则停止传播下游数据。

具体的coding如下：

这里有一个知识点：
Numpy布尔类型索引
>返回的是一个列表，列表里的值根据array里传的值(这里传的布尔是跟调用的ndarray的类型一一对应的，也就是"[]"符号)，意思是列表里的值可以是列表。这里的整个列表是指ndarray



In [2]:
class Relu:
    def __init__(self):
        self.mask = None
        
    def forward(self,x):
        # 将x中大于零的变为true,小于零变为False
        self.mask = (x <= 0)
        out = x.copy()
        #布尔类型索引,true的变为0
        out[self.mask] = 0 
        
        return out
    
    def backward(self,dout):
        dout[self.mask] = 0
        dx = dout
        
        return dx
    
        

In [4]:
# 关于mask的说明
import numpy as np
x = np.array([[1.0,0.5],[-1.3,0.5]])
print(x)
#这一句其实就是将数据变成True与False保存
mask = (x<=0)
print(mask)
# 这一句是最不可思议的
# 将小于0的值设置为0
# 将true的值改变
# numpy布尔类型索引
x[mask] = 0
print(x)

[[ 1.   0.5]
 [-1.3  0.5]]
[[False False]
 [ True False]]
[[1.  0.5]
 [0.  0.5]]


### Sigmoid 层

sigmoid函数的导数表示如下：
![](imgs/15.jpg)

其节点计算图表示如下：
![](imgs/16.jpg)

反向求导的结果如下：
![](imgs/17.jpg)

这里我们整理sigmiod函数的求导公式归纳如下：
![](imgs/18.jpg)

所以sigmoid的函数可以写成：
$
dy = y(1-y)
$

coding写成如下：

In [None]:
class Simoid:
    def __init__(self):
        self.out = None
        
    def forward(self,x):
        out = 1.0/1.0+np.exp(-x)
        self.out = out
        return out
    
    def backward(self,dout):
        # ？？这里不是很懂为什么要*self.out
        dx = dout*(1-dout)*self.out
        
        return dx