# 填充和步幅

在所有侧边填充1个像素

In [1]:
import torch
from torch import nn

# 1. 给输入X添加批量和通道维度
# 1: 批量大小(batch size), 1: 通道数(channels), 8,8: 高和宽
def comp_conv2d(conv2d, X):
    # 动态适配
    X = X.reshape((1, 1) + X.shape)
    # 2. 执行卷积操作
    Y = conv2d(X)
    # 3. 移除输出中的批量和通道维度，返回二维结果
    # Y.shape[2:] 表示取Y的第2个维度之后的形状
    return Y.reshape(Y.shape[2:])
# 4. 创建一个1输入通道、1输出通道的3x3卷积层
# padding=1 保证输入输出尺寸相同（8x8 → 8x8）
conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1)
# 5. 创建随机输入数据（8x8矩阵）
X = torch.rand(size=(8, 8))
# 6. 调用函数并查看输出形状
comp_conv2d(conv2d, X).shape

torch.Size([8, 8])

填充不同的高度和宽度

In [2]:
conv2d = nn.Conv2d(1, 1, kernel_size=(5, 3), padding=(2, 1))
comp_conv2d(conv2d, X).shape

torch.Size([8, 8])

将高度和宽度的步幅设置为2

In [3]:
conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1, stride=2)
comp_conv2d(conv2d, X).shape

torch.Size([4, 4])

一个稍微复杂的例子

In [4]:
'''
1, 1：输入/输出通道数（都是单通道）
kernel_size=(3, 5)：卷积核大小为3行5列（非常规的正方形）
padding=(0, 1)：高方向不填充，宽方向填充1列
stride=(3, 4)：高方向步幅3，宽方向步幅4
用一个 3×5 的窗口在 8×8 图像上扫描：
高方向：从顶部开始，步长3 → 只能放2次（位置0和3，到位置6时超出边界）
宽方向：左右各填1列0后变成10列，步长4 → 只能放2次（位置0和4）
最终生成了一个 2×2 的特征图。
'''
conv2d = nn.Conv2d(1, 1, kernel_size=(3, 5), padding=(0, 1), stride=(3, 4))
comp_conv2d(conv2d, X).shape

torch.Size([2, 2])