在卷积网络中，通常会**在卷积层之间增加池化（Pooling）层，以降低特征图的参数量，提升计算速度，增加感受野，是一种降采样操作。**池化是一种较强的先验，可以使模型更关注全局特征而非局部出现的位置，这种降维的过程可以保留一些重要的特征信息，提升容错能力，并且还能在一定程度上起到防止过拟合的作用。

在物体检测中，常用的池化有最大值池化（Max Pooling）与平均值池化（Average Pooling）。池化层有两个主要的输入参数，即核尺寸kernel_size与步长stride。如图所示为一个核尺寸与步长都为2的最大值池化过程，以左上角为例，9、20、15与26进行最大值池化，保留26。

![3.1.3%E6%9C%80%E5%A4%A7%E5%80%BC%E6%B1%A0%E5%8C%96%E8%BF%87%E7%A8%8B%E7%A4%BA%E4%BE%8B.jfif](attachment:3.1.3%E6%9C%80%E5%A4%A7%E5%80%BC%E6%B1%A0%E5%8C%96%E8%BF%87%E7%A8%8B%E7%A4%BA%E4%BE%8B.jfif)

In [1]:
import torch
from torch import nn

#池化主要有两个参数，第一个参数代表池化区域大小，第二个参数表示步长
max_pooling = nn.MaxPool2d(2, stride=2)
aver_pooling = nn.AvgPool2d(2, stride=2)

input = torch.randn(1, 1, 4, 4)
input

tensor([[[[-1.4085, -0.7868, -0.0919, -0.2341],
          [ 0.1094, -1.2324, -0.3379,  2.2372],
          [ 1.5328,  1.1243, -0.5328,  0.1296],
          [ 1.0601,  0.4363,  0.2071,  1.6421]]]])

In [2]:
#调用最大值池化，可以看到size从[1, 1, 4, 4]变为[1, 1, 2, 2]
max_pooling(input)

tensor([[[[0.1094, 2.2372],
          [1.5328, 1.6421]]]])

In [3]:
#调用平均值池化，可以看到size从[1, 1, 4, 4]变为[1, 1, 2, 2]
aver_pooling(input)

tensor([[[[-0.8296,  0.3933],
          [ 1.0383,  0.3615]]]])