更大的卷积核可以更快地减小输出大小
如果不想那么快地将输出变小，可以使用填充
# 填充
> 在输入周围添加额外的行和列
> 取Ph = Kh - 1, Pw = Kw - 1，这样输入输出的大小不会发生改变
<img alt="image.png" height="550" src="/Users/loneker/Desktop/d2l/pic/iShot_2024-04-24_15.21.20.png" width="700"/>

# 步幅
> 步幅是指行/列的滑动步长
<img alt="image.png" height="450" src="/Users/loneker/Desktop/d2l/pic/iShot_2024-04-24_15.33.06.png" width="700"/>

# 总结
> 1. 填充和步幅是卷积层的超参数
> 2. 填充在输入周围添加额外的行和列，来控制输出形状的减少量
> 3. 步幅是每次滑动核窗口时的行/列的步长，可以成倍的减少输出形状

In [2]:
import torch
from torch import nn

def comp_conv2d(conv2d, X) : 
    X = X.reshape((1, 1) + X.shape)     # (1, 1) 是通道数和批量大小数
    Y = conv2d(X)
    return Y.reshape(Y.shape[2:])       # 输出是一个四维的东西，将前面两维拿掉

conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1)  # 上下左右各填充一行
X = torch.rand(size=(8, 8))
comp_conv2d(conv2d, X).shape

torch.Size([8, 8])

In [3]:
# 填充不同的高度和宽度
conv2d = nn.Conv2d(1, 1, kernel_size=(5, 3), padding=(2, 1))    # 如果想要输出大小不变的话，上下要各填两行，左右各填一列
comp_conv2d(conv2d, X).shape

torch.Size([8, 8])

# 步幅

In [4]:
# 将高度和宽度的步幅设置为2
conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1, stride=2)    # 每次移两行或者两列
comp_conv2d(conv2d, X).shape

torch.Size([4, 4])

In [5]:
conv2d = nn.Conv2d(1, 1, kernel_size=(3, 5), padding=(0, 1), stride=(3, 4))
comp_conv2d(conv2d, X).shape

torch.Size([2, 2])