## 6.3 填充和步幅

**填充**就是为了避免卷积过程中原图像的边界丢失的信息。

**步幅**用于大幅的降低图像的宽度和高度。

### 6.3.1 填充

下面这幅图展示了填充的方法，也就是在这里的外面填充了一圈0.

![](../image/6-3-1.svg)

通常，如果我们添加$p_h$行填充（大约一半在顶部，一半在底部）和$p_w$列填充（左侧大约一半，右侧一半），则输出形状将为：

$$
(n_h-k_h+p_h+1)\times(n_w-k_w+p_w+1)
$$

为了使得输入和输出具有相同的高度，则需要设置$p_h-k_h-1$和$p_w=k_w-1$。

为此，卷积和的高度和宽度通常为奇数，这样使得填充的时候可以在顶部和底部填充相同的行，左侧和右侧填充相同的列。

In [3]:
import torch
from torch import nn

# 定义一个计算卷积层的函数
def comp_conv2d(conv2d, X):
    # 这里的(1, 1)表示批量大小和通道数都为1
    # example: (8, 8) -> (1, 1, 8, 8)
    # 前面的两个1都只是为了满足nn.conv的需要而故意添加的，要不然无法作为输入
    X = X.reshape((1, 1) + X.shape)
    Y = conv2d(X)
    # 省略前两个维度：批量大小和通道
    # 也就是不要前面两个没用的通道
    return Y.reshape(Y.shape[2:])

# 这里每边都填充了1行或1列，因此总共添加了2行或2列
# 这里的padding是针对输入特征的填充
conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1)
X = torch.rand(size=(8, 8))
comp_conv2d(conv2d, X).shape

torch.Size([8, 8])

卷积核宽度和高度不同时，可以填充不同的高度和宽度

In [4]:
conv2d = nn.Conv2d(1, 1, kernel_size=(5, 3), padding=(2, 1))
comp_conv2d(conv2d, X).shape

torch.Size([8, 8])

### 6.3.2 步幅

也就是填充核每次划过多个元素，分为水平步幅和垂直步幅。

通常，当垂直步幅为$s_h$，水平步幅为$s_w$时候，输出形状为：

$$
\lfloor(n_h-k_h+p_h+s_h)/s_h\rfloor\times\lfloor(n_w-k_w+p_w+s_w)/s_w\rfloor
$$

In [5]:
conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1, stride=2)
comp_conv2d(conv2d, X).shape

torch.Size([4, 4])

In [6]:
conv2d = nn.Conv2d(1, 1, kernel_size=(3, 5), padding=(0, 1), stride=(3, 4))
comp_conv2d(conv2d, X).shape

torch.Size([2, 2])

### 6.3.3 小结

- 填充可以增加输出的高度和宽度。这常用来使输出与输入具有相同的高和宽。
- 步幅可以减小输出的高和宽，例如输出的高和宽仅为输入的高和宽的$1/n$（$n$是一个大于$1$的整数）。
- 填充和步幅可用于有效地调整数据的维度。