### 二维最大池化层
- 返回滑动窗口中的最大值
- **2 * 2的最大池化可以容忍1像素的移位**

### 填充，步幅和多个通道
1. 和卷积的相似点：
- 都有窗口大小填充和步幅作为超参数
2. 和卷积的不同点：
- 没有可以学习的参数（比如权重）
- 作用于多输入通道时，对每个通道都分别进行池化（没有像卷积一样进行多通道融合）
- 输入通道 = 输出通道

### 池化层的分类
- 最大池化层
- 平均池化层

### 池化层的作用
- 缓解卷积层对位置的敏感性

In [2]:
import torch
from torch import nn
from d2l import torch as d2l


def pool2d(X, pool_size, mode='max'):
    p_h, p_w = pool_size
    # 创建输出：这里没有padding和stride
    Y = torch.zeros((X.shape[0] - p_h + 1, X.shape[1] - p_w + 1))
    # Y[i, j] 对应 X[i, j]，左上角对应
    for i in range(Y.shape[0]):
        for j in range(Y.shape[1]):
            if mode == 'max':
                Y[i, j] = X[i: i + p_h, j: j + p_w].max()
            elif mode == 'avg':
                Y[i, j] = X[i: i + p_h, j: j + p_w].mean()
    return Y

In [3]:
X = torch.tensor([[0.0, 1.0, 2.0], [3.0, 4.0, 5.0], [6.0, 7.0, 8.0]])
pool2d(X, (2, 2))

tensor([[4., 5.],
        [7., 8.]])

In [4]:
pool2d(X, (2, 2), 'avg')

tensor([[2., 3.],
        [5., 6.]])

In [5]:
X = torch.arange(16,dtype = torch.float32).reshape(1,1,4,4)
X

tensor([[[[ 0.,  1.,  2.,  3.],
          [ 4.,  5.,  6.,  7.],
          [ 8.,  9., 10., 11.],
          [12., 13., 14., 15.]]]])

In [7]:
# 默认情况下，深度学习框架中的步幅与池化窗口的大小相同。（不产生重叠！）
pool2d = nn.MaxPool2d(3)
pool2d(X)

tensor([[[[10.]]]])

In [8]:
# output_width = （input_width+2*pad-pool_size）/stride+1
# 如果不能整除则向下取整（因为多一列，数据不完整，也没法pool）
pool2d = nn.MaxPool2d(3,padding = 1, stride = 2)
pool2d(X)

tensor([[[[ 5.,  7.],
          [13., 15.]]]])