假设输入形状是$n_h \times n_w$，卷积核窗口形状是$k_h \times \ k_w$，那么输出形状为
$$(n_h - k_h + 1) \times (n_w - k_w + 1)$$

# 填充

填充（padding）是指在输入高和宽的两侧填充元素（通常是0元素）

一般来说，如果在高的两侧一共填充$p_h$行，在宽的两侧一共填充$p_w$列，那么输出形状将会是

$$(n_h - k_h + p_h + 1) \times (n_w - k_w + p_w + 1)$$

也就是说，输出的高和宽会分别增加$p_h$和$p_w$

In [1]:
import torch
from torch import nn

创建一个高和宽为3的二维卷积层，然后设输入高和宽两侧的填充数分别为1。给定一个高和宽为8的输入，我们发现输出的高和宽也是8

In [2]:
# 定义一个函数来计算卷积层。它对输入和输出做相应的升维和降维
def comp_conv2d(conv2d, X):
    # (1, 1)代表批量大小和通道数（“多输入通道和多输出通道”一节将介绍）均为1
    X = X.view((1, 1) + X.shape)
    print('处理后X的维度：', X.shape)
    Y = conv2d(X)
    print('Y.shape', Y.shape)
    return Y.view(Y.shape[2:])  # 排除不关心的前两维：批量和通道

# 注意这里是两侧分别填充1行或列，所以在两侧一共填充2行或列
conv2d = nn.Conv2d(in_channels=1,
                   out_channels=1,
                   kernel_size=3,
                   padding=1)

X = torch.rand(8, 8)
comp_conv2d(conv2d, X).shape

处理后X的维度： torch.Size([1, 1, 8, 8])
Y.shape torch.Size([1, 1, 8, 8])


torch.Size([8, 8])

当卷积核的高和宽不同时，我们也可以通过设置高和宽上不同的填充数使输出和输入具有相同的高和宽。

In [3]:
# 使用高为5、宽为3的卷积核。在高和宽两侧的填充数分别为2和1
conv2d = nn.Conv2d(in_channels=1,
                   out_channels=1,
                   kernel_size=(5, 3),
                   padding=(2, 1))
comp_conv2d(conv2d, X).shape

处理后X的维度： torch.Size([1, 1, 8, 8])
Y.shape torch.Size([1, 1, 8, 8])


torch.Size([8, 8])

# 步幅

In [4]:
conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1, stride=2)
comp_conv2d(conv2d, X).shape

处理后X的维度： torch.Size([1, 1, 8, 8])
Y.shape torch.Size([1, 1, 4, 4])


torch.Size([4, 4])

In [5]:
conv2d = nn.Conv2d(1, 1, kernel_size=(3, 5), padding=(0, 1), stride=(3, 4))
comp_conv2d(conv2d, X).shape

处理后X的维度： torch.Size([1, 1, 8, 8])
Y.shape torch.Size([1, 1, 2, 2])


torch.Size([2, 2])