在应用多层卷积时，我们常常丢失边缘像素。由于我们通常使用小卷积核，因此对于任何单个卷积，我们可能只会丢失几个像素。但随着我们应用许多连续卷积层，累积丢失的像素数就多了。解决这个问题的简单方法即为填充（padding）：在输入图像的边界填充元素（通常填充元素是）。例如，在 图6.3.1中，我们将3*3输入填充到5*5，那么它的输出就增加为4*4。阴影部分是第一个输出元素以及用于输出计算的输入和核张量元素： 0*0 + 0*1 + 0*2 + 0*3 = 0。

使用奇数的核大小和填充大小也提供了书写上的便利。对于任何二维张量X，当满足： 1. 卷积核的大小是奇数； 2. 所有边的填充行数和列数相同； 3. 输出与输入具有相同高度和宽度 则可以得出：输出Y[i, j]是通过以输入X[i, j]为中心，与卷积核进行互相关计算得到的。

比如，在下面的例子中，我们创建一个高度和宽度为3的二维卷积层，并在所有侧边填充1个像素。给定高度和宽度为8的输入，则输出的高度和宽度也是8。

In [4]:
import torch
from torch import nn


# 为了方便，我们定义一个计算卷积层的函数
# 此函数初始化卷积层权重，并对输入和输出提高和缩减响应的维数
def comp_conv2d(conv2d, X):
    # 这里的(1, 1)表示批量大小和通道数都是1
    X = X.reshape((1, 1) + X.shape)
    print(X.shape)
    Y = conv2d(X)
    return Y.reshape(Y.shape[2:])

# 请注意，这里每边都填充了1行或1列，因此总共添加了2行或2列
conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1)
X = torch.rand(size=(8, 8))
comp_conv2d(conv2d, X).shape

torch.Size([1, 1, 8, 8])


torch.Size([8, 8])

In [5]:
(1, 1) + (8, 8)

(1, 1, 8, 8)

### 步幅

通常，当垂直步幅为Sh、水平步幅为Sw时，输出形状为
向下取整(Nh - Kh + Ph + Sh)/Sh * 向下取整(Nw - Kw + Pw + Sw)/Sw

Nh为输入的高度，Nw为输入的宽度，Kh为卷积核的高度，Kw为卷积核的宽度，Ph为垂直填充，Pw为水平填充

下面，我们将高度和宽度的步幅设置为2，从而将输入的高度和宽度减半。
根据上述公式计算输出形状：向下取整(8 - 3 + 2 + 2)/2 * 向下取整(8 - 3 + 2 + 2)/2 = 4 * 4

In [6]:
conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1, stride=2)
comp_conv2d(conv2d, X).shape

torch.Size([1, 1, 8, 8])


torch.Size([4, 4])