### 填充
> * 填充$p_h$行和$p_h$列，输出形状为：$(n_h-k_h+p_h+1)\times(n_w-k_w+p_w+1)$
> * 通常取$p_h=k_h-1$,$p_w=k_w-1$
>> * 当$k_h$为奇数：在上下两侧填充$p_h/2$
>> * 当$k_h$为偶数：在上侧填充 $\ulcorner p_h/2\urcorner$，在下侧填充$\llcorner p_h/2\lrcorner$
#### <font color='red'>填充是为了当层数过大时，不至于使得输入大小被卷积缩小到无法进行卷积的地步</font>

### 步幅
> * 给定高度$s_h$和宽度$s_w$的步幅，输出形状为$\llcorner(n_h-k_h+p_h+s_h)/s_h\lrcorner \times \llcorner(n_w-k_w+p_w+s_w)/s_w\lrcorner$
> * 如果$p_h=k_h-1,p_w=k_w-1,\llcorner(b_h+s_h-1)/s_h\lrcorner \times \llcorner (n_w+s_w-1)/s_w\lrcorner$
> * 如果输入高度和宽度可以被步幅整除，$(n_h/s_h)\times(n_w/s_w)$
#### <font color='red'>步幅是为了当输入尺寸过大，卷积难以使用较小层数使得输入大小变小</font>

### 总结
> * 填充和步幅是卷积层的超参数
> * 填充在输入周围添加额外的行/列，来控制输出形状的减少量
> * 步幅是每次滑动核窗口的行/列的步长，可以成倍的减少输出形状

In [1]:
import torch
from torch import nn

"""在所有侧边填充1个像素"""
def comp_conv2d(conv2d, X):
    X = X.reshape((1, 1) + X.shape) ## 将X尺寸变为[1, 1, X.shape[0],X.shape[1]]
    Y = conv2d(X)
    return Y.reshape(Y.shape[2:])

conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1) ## padding=1表示在上下左右个填充1行，所以一共填充了2行，所以输出形状为：8-3+2+1=8
X = torch.rand(size=(8, 8))
comp_conv2d(conv2d, X).shape

torch.Size([8, 8])

In [2]:
"""填充不同的高度和宽度"""
conv2d = nn.Conv2d(1, 1, kernel_size=(5, 3), padding=(2, 1)) ##padding=(2,1)表示在上下填充2行，左右填充1行
comp_conv2d(conv2d, X).shape

torch.Size([8, 8])

In [3]:
"""将步幅的高宽设为2"""
conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1, stride=2)
comp_conv2d(conv2d, X).shape

torch.Size([4, 4])

In [None]:
"""一个稍微复杂的例子"""
conv2d = nn.Conv2d(1, 1, kernel_size=(3, 5), padding=(0,  1), stride=(3, 4))
comp_conv2d(conv2d, X).shape

#### 卷积的超参数：<font color='red'>核大小， 填充， 步幅<font>