# 卷积神经网络CNN
* 卷积计算
    * 矩阵A卷积乘以矩阵B，相当于把矩阵B映射到矩阵A中，每个对应的元素相乘后相加，结果作为结果矩阵的一个元素
    * 每次计算完一个元素，需要将B矩阵对应A矩阵往右移动stride个位置，直到第一行计算完
    * 每行计算完后，就会乡下移动stride个位置，继续重复行的计算过程，具体事例如下：
    * $\begin{bmatrix} a_1^1 & a_1^2 & a_1^3 \\ 
        a_2^1 & a_2^2 & a_2^3 \\
        a_3^1 & a_3^2 & a_3^3 \\
        \end{bmatrix} \ast 
        \begin{bmatrix} w_1^1 & w_1^2 \\
        w_2^1 & w_2^2
        \end{bmatrix} = 
        \begin{bmatrix} a_1^1 * w_1^1 + a_1^2 * w_1^2 + a_2^1 * w_2^1 + a_2^2 * w_2^2 & a_1^2 * w_1^1 + a_1^3 * w_1^2 + a_2^2 * w_2^1 + a_2^3 * w_2^2 \\
        a_2^1 * w_1^1 + a_2^2 * w_1^2 + a_3^1 * w_2^1 + a_3^2 * w_2^2 & a_2^2 * w_1^1 + a_2^3 * w_1^2 + a_3^2 * w_2^1 + a_3^3 * w_2^2
        \end{bmatrix}$
* 卷积计算的含义：
    * 将图片进行卷积计算，主要是计算图片的边界（横边界，竖边界，其他角度的边界），找出图片中色差的分界点：
        <img src='../images/deeplearning/卷积计算的实际意义.png' width='400px'>
    * 其次是减少深度网络中的参数数量
        * 寻找边界的过滤器（核矩阵）是可以共享的，例如横边界的过滤器可以用在所有图片中
        * 每次计算的结果，只依赖部分输入参数，对输入参数的偏差拥有良好的抵抗性
    * 可以将大图片，逐层通过划分图片边界，聚焦图片内容，学习更加精确（图片每个区域都进行划分精准学习）
    * 对原始图片数据进行降维
    * 卷积计算过程涉及的参数：
        * $f$：过滤器大小，方阵的维度，过滤器类型：
            <table>
                <tr>
                    <td><img src='../images/deeplearning/过滤器1.png'></td>
                    <td><img src='../images/deeplearning/过滤器2.png'></td>
                </tr>
            </table>
        * $s$：stride大小，每次计算完后移动的步伐
        * $p$：给原图片扩充层数，保障原图片不失真，对在原图片外围扩充一层数据
        * $n_c$：输入源的层数，例如图片就是3层，RGB
        * $\lfloor \frac{n + 2p - f}{s} + 1 \rfloor$：结果矩阵的维度，该式中$n$是输入矩阵的维度
* 卷积神经网络：过滤器（核函数）是通过反向传播学习所得
    * 对图片进行卷积计算的神经网络即为卷积神经网络
        * 先对图片矩阵进行卷积计算：$z = w * x + b, w * b$是卷积计算，$w$代表过滤器（核矩阵），是需要通过反向传播学习
        * 然后将卷积计算的结果应用到非线性函数中：$a = ReLU(z)$
        * 单层网络计算过程与普通神经网络的区别在于：
            * 过滤器（核矩阵）的个数是神经元的节点数
            * 卷积神经网络中的单个输入源需要一次性使用所有过滤器计算，因为卷积网络的输出结果是对同一输入源进行处理的结果（对图片进行卷积计算，输出的结果还是该图片，只不过被切分，降维了）
            * 普通神经网络中的单个输入源一次只需要使用一个神经元节点完成计算
    * 卷积神经网络中的参数：
        <img src='../images/deeplearning/卷积网络中的参数.png' width='400px'>
* 完全卷积神经网络：
    * 先对输入数据进行卷积计算
    * 然后在进行pool计算，没有过滤器（核矩阵），分为Max pool（卷积计算过程中选择过滤器范围原矩阵中的最大值作为结果）和Average pool（直接计算过滤器范围原矩阵中所有元素的平均值）
    * 上面两个步骤算作一层神经网络，经过多次上述步骤的计算，将最终的结果转为列向量（和原始的二分神经网络输入一样）
    * 应用二分神经网络或者softmax神经网络完成最终的分类（这个步骤的调参，分析过程和deep-neural-network.ipynb中的方法一致）
    * 完全卷积神经网络示例：
        <img src='../images/deeplearning/完全卷积神经网络示例.png' width='400px'>