In [2]:
from mxnet import nd
from mxnet.gluon import nn

In [3]:
# 定义一个便利函数来计算卷积层
# 它初始化卷积层权重，并对输入输出做出相应的升维和降维
# 输出形状：(n_h - k_h + p_h +1) * (n_w - k_w + p_w + 1)
def comp_conv2d(conv2d, X):
    conv2d.initialize()
    # (1, 1) 代表批量大小和通道数
    X = X.reshape((1, 1) + X.shape)
    Y = conv2d(X)
    return Y.reshape(Y.shape[2:])  # 排除不关心的前两维：批量和通道

In [4]:
# 注意这里是两侧分别填充1行或列，所以在两侧一共填充2行或列
conv2d = nn.Conv2D(1, kernel_size=3, padding=1)
X = nd.random.uniform(shape=(8, 8))
comp_conv2d(conv2d, X).shape

(8, 8)

In [5]:
# 当卷积核的高和宽不同时
# 使用高为5，宽为3的卷积核。在高和宽两侧的填充数分别为2和1
conv2d = nn.Conv2D(1, kernel_size=(5, 3), padding=(2, 1))
comp_conv2d(conv2d, X).shape

(8, 8)

In [6]:
# 步幅
# **输出形状** (n_h - k_h + p_h + s_h) / s_h * (n_w - k_w + p_w + s_w) / s_w
# 向下取整
# 一般设置 p_h = k_h - 1, p_w = k_w -1
# 那么，输出形状 (n_h + s_h - 1)/s_h * (n_w + s_w -1)/s_w
# 向下取整
# 如果输入的高和宽能分别被高和宽上的步幅整除
# 那么，输出形状 (n_h / s_h) * (n_w / s_w)
conv2d = nn.Conv2D(1, kernel_size=3, padding=1, strides=2)
comp_conv2d(conv2d, X).shape

(4, 4)

In [7]:
conv2d = nn.Conv2D(1, kernel_size=(3, 5), padding=(0, 1), strides=(3, 4))
comp_conv2d(conv2d, X).shape

(2, 2)

In [None]:
# padding 可以增加输出的高和宽，这常用来使输出与输入具有相同的高和宽
# strides 可以减小输出的高和宽