### 空洞卷积最初是为解决图像分割的问题而提出的。
常见的图像分割算法通常使用池化层来增大感受野，同时也缩小了特征图尺寸，然后再利用上采样还原图像尺寸。特征图缩小再放大的过程造成了精度上的损失，因此需要有一种操作可以在增加感受野的同时保持特征图的尺寸不变，从而替代池化与上采样操作，在这种需求下，空洞卷积就诞生了。在近几年的物体检测发展中，空洞卷积也发挥了重要的作用。因为虽然物体检测不要求逐像素地检测，但是保持特征图的尺寸较大，对于小物体的检测及物体的定位来说也是至关重要的。

### 空洞卷积，顾名思义就是卷积核中间带有一些洞，跳过一些元素进行卷积。
在此以3×3卷积为例，其中，图a是普通的卷积过程，在卷积核紧密排列在特征图上滑动计算，而图b代表了空洞数为2的空洞卷积，可以看到，在特征图上每2行或者2列选取元素与卷积核卷积。类似地，图c代表了空洞数为3的空洞卷积。

在代码实现时，空洞卷积有一个额外的超参数dilation rate，表示空洞数，普通卷积dilation rate默认为1，图中的b与c的dilation rate分别为2与3。同样的一个3×3卷积，却可以起到5×5、7×7等卷积的效果。可以看出，**空洞卷积在不增加参数量的前提下，增大了感受野。**

假设空洞卷积的卷积核大小为k，空洞数为d，则其等效卷积核大小k’计算如式（3-12）所示。在计算感受野时，只需要将原来的卷积核大小k更换为k’即可。

![3.1.8.1%E6%99%AE%E9%80%9A%E5%8D%B7%E7%A7%AF%E4%B8%8E%E7%A9%BA%E6%B4%9E%E5%8D%B7%E7%A7%AF%E7%9A%84%E5%AF%B9%E6%AF%94.jfif](attachment:3.1.8.1%E6%99%AE%E9%80%9A%E5%8D%B7%E7%A7%AF%E4%B8%8E%E7%A9%BA%E6%B4%9E%E5%8D%B7%E7%A7%AF%E7%9A%84%E5%AF%B9%E6%AF%94.jfif)

![3.1.8.2%E8%AE%A1%E7%AE%97%E7%A9%BA%E6%B4%9E%E5%8D%B7%E7%A7%AF%E7%AD%89%E6%95%88%E5%8D%B7%E7%A7%AF%E6%A0%B8.jfif](attachment:3.1.8.2%E8%AE%A1%E7%AE%97%E7%A9%BA%E6%B4%9E%E5%8D%B7%E7%A7%AF%E7%AD%89%E6%95%88%E5%8D%B7%E7%A7%AF%E6%A0%B8.jfif)

### 空洞卷积的优点显而易见
在不引入额外参数的前提下可以任意扩大感受野，同时保持特征图的分辨率不变。这一点在分割与检测任务中十分有用，感受野的扩大可以检测大物体，而特征图分辨率不变使得物体定位更加精准。

In [1]:
import torch
from torch import nn

#定义普通卷积，默认dilation为1
conv1 = nn.Conv2d(3, 256, 3, stride=1, padding=1, dilation=1)
conv1

Conv2d(3, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))

In [2]:
#定义dilation为2 的卷积，打印卷积后会有dilation的参数
conv2 = nn.Conv2d(3, 256, 3, stride=1, padding=1, dilation=256)
conv2

Conv2d(3, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), dilation=(256, 256))

### 空洞卷积也有自己的一些缺陷，主要表现在以下3个方面：
①网格效应（Gridding Effect）：由于空洞卷积是一种稀疏的采样方式，当多个空洞卷积叠加时，有些像素根本没有被利用到，会损失信息的连续性与相关性，进而影响分割、检测等要求较高的任务。

②远距离的信息没有相关性：空洞卷积采取了稀疏的采样方式，导致远距离卷积得到的结果之间缺乏相关性，进而影响分类的结果。

③不同尺度物体的关系：大的dilation rate对于大物体分割与检测有利，但是对于小物体则有弊无利，如何处理好多尺度问题的检测，是空洞卷积设计的重点。

对于上述问题，有多篇文章提出了不同的解决方法，典型的有图森未来提出的HDC（Hybrid Dilated Convolution）结构。该结构的设计准则是堆叠卷积的dilation rate不能有大于1的公约数，同时将dilation rate设置为类似于[1,2,5,1,2,5]这样的锯齿类结构。此外各dilation rate之间还需要满足一个数学公式，这样可以尽可能地覆盖所有空洞，以解决网格效应与远距离信息的相关性问题。