# $\bm{20}$ $\enspace$ **卷积层里的填充和步幅**

## $\bm{20.1}$ $\enspace$ **填充**

通常，如果我们添加 $p_h$ 行填充（大约一半在顶部，一般在底部）和 $p_w$ 列填充（左侧大约一半，右侧一半），则输出形状将为
$$
    (n_k-k_h+p_h+1)\times (n_w-k_w+p_w+1) \tag{1}
$$

In [1]:
import torch
from torch import nn

# 为了方便起见，我们定义了一个计算卷积层的函数
# 此函数初始化卷积层权重，并对输入和输出提高和缩减相应的维数
def comp_conv2d(conv2d, X):
    # 这里的 (1,1) 表示批量大小和通道数都是1
    X = X.reshape((1, 1) + X.shape)
    Y = conv2d(X)
    # 省略前两个维度：批量大小和通道
    return Y.reshape(Y.shape[2:])

In [2]:
# 请注意，这里每边都填充了1行或1列，因此总共添加了2行或2列
conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1)
X = torch.rand(size=(8, 8))
comp_conv2d(conv2d, X).shape

torch.Size([8, 8])

当卷积核的高度和宽度不同时，我们可以填充不同的高度和宽度，使输出和输入具有相同的高度和宽度。在如下示例中，我们使用高度为 $5$，宽度为 $3$ 的卷积核，高度和宽度两边的填充分别为 $2$ 和 $1$。

In [3]:
conv2d = nn.Conv2d(1, 1, kernel_size=(5, 3), padding=(2, 1))
comp_conv2d(conv2d, X).shape

torch.Size([8, 8])

## $\bm{20.2}$ $\enspace$ **步幅**

通常，当垂直步幅为 $s_h$，水平步幅为 $s_w$ 时，输出形状为
$$
    [(n_h-k_h+p_h+s_h)/s_h]\times  [(n_w-k_w+p_w+s_w)/s_w] \tag{2}
$$


In [4]:
conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1, stride=2)
comp_conv2d(conv2d, X).shape

torch.Size([4, 4])

In [5]:
conv2d = nn.Conv2d(1, 1, kernel_size=(3, 5), padding=(0, 1), stride=(3, 4))
comp_conv2d(conv2d, X).shape

torch.Size([2, 2])