详细见：https://www.zybuluo.com/hanbingtao/note/485480
=====

In [10]:
import numpy as np

一：实现卷积核Filter
=============

In [8]:
class Filter(object): #其实卷积核就是我们的权值，所谓权值共享就是体现在这里，各个局部视野下使用同一个卷积核（权值矩阵）
    def __init__(self,width,hight,depth):
        self.weights = np.random.uniform(-1e-4,1e-4,(depth,hight,width))
        self.bias = 0
        self.weights_grad = np.zeros(self.weights.shape)
        self.bias_grad = 0
        
    def get_weights(self):
        return self.weights
    
    def get_bias(self):
        return self.bias
    
    def update(self,learning_rate): #更新权值信息
        self.weights -= learning_rate*self.weights_grad
        self.bias -= learning_rate*self.bias_grad

二：实现激活函数ReluActivator
========

In [None]:
class ReleActivator(object):
    def relu_func(self,input_): #激活函数
        return max(0,input_)
    
    def relu_grad(self,output): #导函数
        return 1 if output > 0 else 0

![image.png](attachment:image.png)

三：实现卷积层ConvLayer
=============

1:前向传播计算
------
![image.png](attachment:image.png)

步长为1：
![image-2.png](attachment:image-2.png)
步长为2：
![image-3.png](attachment:image-3.png)
步长为1与步长为2的差别：
![image-5.png](attachment:image-5.png)
如上图，上面是步长为1时的卷积结果，下面是步长为2时的卷积结果。我们可以看出，因为步长为2，得到的feature map跳过了步长为1时相应的部分。
重点补充：因此，当我们反向计算误差项时，我们可以对步长为S的sensitivity map相应的位置进行补0，将其『还原』成步长为1时的sensitivity map，再用反向传播中式8进行求解。

2：反向传播
-------
1.案例推导：假设输入的大小为3*3，filter大小为2*2，按步长为1卷积，我们将得到2*2的feature map。如下图所示
![image-7.png](attachment:image-7.png)
![image-8.png](attachment:image-8.png)
![image-9.png](attachment:image-9.png)
![image-10.png](attachment:image-10.png)
![image-11.png](attachment:image-11.png)
从上面3个例子中，我们不难发现：在步长为1时，计算：
![image-12.png](attachment:image-12.png)相当于，把第l层的sensitive map周围补一圈0，在与180度翻转后的filter进行cross-correlation，就能得到想要结果，如下图所示：
![image-13.png](attachment:image-13.png)
当然，对于步长不为1时，我们也有相关的公式，判断填充数量：因为在进行反响传播过程中，也是一次卷积过程，所以我们按照卷积可以推导出：
![image-14.png](attachment:image-14.png)
下面接着讨论反向传播步长为1的情况：
因为卷积相当于将filter旋转180度的cross-correlation，因此上图的计算可以用卷积公式（注意：下面公式还是卷积）完美的表达：
![image-15.png](attachment:image-15.png)
![image-16.png](attachment:image-16.png)
![image-17.png](attachment:image-17.png)
以上：我们获取的求解δ的最终表达式（公式8）

3：反向传播输入层深度为D时的误差传递
-------
![image-18.png](attachment:image-18.png)
![image-19.png](attachment:image-19.png)
filter数量为N时的误差传递:
![image-20.png](attachment:image-20.png)
以上就是卷积层误差项传递的算法。详细参考代码

4：卷积层filter权重梯度的计算
-------
![image-21.png](attachment:image-21.png)
![image-22.png](attachment:image-22.png)
![image-23.png](attachment:image-23.png)
![image-24.png](attachment:image-24.png)
上面还是一次卷积操作，只不过又调整了一次输入、输出、卷积核位置。所以卷积操作还是特别重要的！！！！
![image-25.png](attachment:image-25.png)

In [9]:
class ConvLayer(object):
    def __init__(self,input_width,input_hight,channel_number,
                filter_width,filter_hight,filter_number,
                padding_number,stride_number,activator_func,learning_rate):
        #输入层数据
        self.input_width = input_width
        self.input_hight = input_hight
        self.channel_number = channel_number
        
        #根据卷积核信息，构造卷积核类对象
        self.filter_width = filter_width
        self.filter_hight = filter_width
        self.filter_number = filter_number
        
        self.filters = []
        for i in range(filter_number): #每个filter的信息都是与前一层有关（输入层），所有filter的数量与输出层有关
            self.filters.append(Filter(filter_width,filter_hight,channel_number)) #实例化卷积核，加入卷积层中
            
        #根据填充、步长等信息，获取输出层信息
        self.output_width = ConvLayer.calculate_output_size(input_width,filter_width,padding_number,stride_number)
        self.output_hight = ConvLayer.calculate_output_size(input_hight,filter_hight,padding_number,stride_number)
        
        self.output_array = np.zeros((self.filter_number,self.output_hight,self.output_width))
        
        #其他信息
        self.padding_number = padding_number #输入层是否需要填充 same
        self.stride_number = stride_number #卷积过程步长
        self.activator_func = activator_func #激活单元需要激活函数
        self.learning_rate = learning_rate #学习速率
    
    @staticmethod #在init函数调用，设置为classmethod或者staticmethod
    def calculate_output_size(input_size,filter_size,padding_number,stride_number):
        return (input_size-filter_size+padding_number*2)/stride_number+1
    
    def forward(self,input_array)

In [7]:
ConvLayer.calculate_output_size

<function __main__.ConvLayer.calculate_output_size(input_size, filter_size, padding_number, stride_number)>