# 卷积层里的填充和步幅


- 给定 (32, 32) 输入图像
- 应用 $5 \times 5$ 大小的 卷积核
    - 第1层得到输出大小 $28 \times 28$
    - 第7层得到输出大小 $4 \times 4$
- 更大的卷积核可以更快地减小输出大小
    - 形状从 $n_h \times n_w$ 减小到 $(n_h - k_h + 1) \times (n_w - k_w + 1)$
    
希望能把卷积层做深一点，但是数据的长宽下降的太快怎么办。

## 1. 填充

在输入周围添加额外的 行/列

- 填充 $p_h$ 行和 $p_w$ 列，输出形状为

$(n_h - k_h + p_h + 1) \times (n_w - k_w + p_w + 1)$

- 通常取 $p_h = k_h - 1, p_w = k_w - 1$
    - 当 $k_h$ 为奇数：在上下两侧填充 $p_h/2$
    - 当 $k_h$ 为偶数：在上侧填充 $\left\lceil p_h / 2\right\rceil$，在下侧填充 $\left\lfloor p_h / 2\right\rfloor$
    
## 2. 步幅

- 步幅是指行/列的滑动步长
    - 例：高度3宽度2的步幅

## 3. 总结

- 填充和步幅是卷积层的超参数
- 填充在输入周围添加额外的 行/列，来控制输出形状的减少量
- 步幅是每次滑动核窗口时的 行/列 的步长，可以成倍地减少输出形状

## 4.

在所有侧边填充1个像素

In [3]:
import torch
from torch import nn

def comp_conv2d(conv2d, X):
    X = X.reshape((1, 1) + X.shape)  # (通道数1，批量大小1)
    Y = conv2d(X)
    return Y.reshape(Y.shape[2:])

conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1)
X = torch.rand(size=(8, 8))
comp_conv2d(conv2d, X).shape

torch.Size([8, 8])