# 20 卷积层里的填充和步幅
## 填充
- 给定32*32输入图像
- 应用5*5卷积核
  - 第一层得到输出大小是28*28
  - 第七层得到输出4*4
- 更大的卷积核会使更快的减小输出大小
- 填充可以使输出图像大小不变

填充：在输入的四周加入额外的行和列
![](./assets/2022-02-11-09-30-12.png)
红框里是原始的输入
![](./assets/2022-02-11-09-31-37.png)

步幅：填充减小的输出大小与层数线性相关
- 给定输入大小224\*224，在使用5\*5卷积核时，需要55层将输出降低到4*4
- 需要大量计算才能得到较小输出

![](./assets/2022-02-11-10-32-19.png)

也就是移动的时候，可能不是只移动一格，有可能是2格、3格等等

![](./assets/2022-02-11-10-36-27.png)

**总结：**填充和步幅是卷积层的超参数
- 填充在输入周围的额外的行/列，来控制输出的减少量
- 步幅是每次滑动核窗口时行/列的步长，可以成倍的减少输出形状

In [1]:
# 在所有侧边填充1个像素 
import torch
from torch import nn

def comp_conv2d(conv2d, X):
    X = X.reshape((1, 1) + X.shape)
    Y = conv2d(X)
    return Y.reshape(Y.shape[2:])

conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1)
X = torch.rand(size=(8, 8))
comp_conv2d(conv2d, X).shape

torch.Size([8, 8])

In [2]:
conv2d = nn.Conv2d(1, 1, kernel_size=(5, 3), padding=(2, 1))
comp_conv2d(conv2d, X).shape

torch.Size([8, 8])

In [3]:
# 将高度和宽度的步幅设置为2
conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1, stride=2)
comp_conv2d(conv2d, X).shape

torch.Size([4, 4])

In [4]:
# 一个稍微复杂的例子
conv2d = nn.Conv2d(1, 1, kernel_size=(3, 5), padding=(0, 1), stride=(3, 4))
comp_conv2d(conv2d, X).shape

torch.Size([2, 2])