本节我们将介绍含多个输入通道或多个输出通道的卷积核。

# 多输入通道
接下来我们实现含多个输入通道的互相关运算。我们只需要对每个通道做互相关运算，然后通过`add_n`函数来进行累加。

In [1]:
import torch
from torch import nn
import sys
sys.path.append("../深度学习基础/") 
import d2lzh_pytorch as d2l

def corr2d_multi_in(X, K):
    # 沿着X和K的第0维（通道维）分别计算再相加
    res = d2l.corr2d(X[0, :, :], K[0, :, :])
    for i in range(1, X.shape[0]):
        res += d2l.corr2d(X[i, :, :], K[i, :, :])
    return res

我们可以构造输入数组`X`、核数组`K`来验证互相关运算的输出。

In [2]:
X = torch.tensor([[[0, 1, 2], [3, 4, 5], [6, 7, 8]],
              [[1, 2, 3], [4, 5, 6], [7, 8, 9]]])
K = torch.tensor([[[0, 1], [2, 3]], [[1, 2], [3, 4]]])

corr2d_multi_in(X, K)

tensor([[ 56.,  72.],
        [104., 120.]])

# 多输出通道
下面我们实现一个互相关运算函数来计算多个通道的输出。

In [3]:
def corr2d_multi_in_out(X, K):
    # 对K的第0维遍历，每次同输入X做互相关计算。所有结果使用stack函数合并在一起
    return torch.stack([corr2d_multi_in(X, k) for k in K])

我们将核数组`K`同`K+1`（`K`中每个元素加一）和`K+2`连结在一起来构造一个输出通道数为3的卷积核。

In [4]:
K = torch.stack([K, K + 1, K + 2])
K.shape  # torch.Size([3, 2, 2, 2])

torch.Size([3, 2, 2, 2])

下面我们对输入数组`X`与核数组`K`做互相关运算。此时的输出含有3个通道。其中第一个通道的结果与之前输入数组`X`与多输入通道、单输出通道核的计算结果一致。

In [5]:
corr2d_multi_in_out(X, K)

tensor([[[ 56.,  72.],
         [104., 120.]],

        [[ 76., 100.],
         [148., 172.]],

        [[ 96., 128.],
         [192., 224.]]])

# 1 x 1 卷积层
因为使用了最小窗口，`1×1`卷积失去了卷积层可以识别高和宽维度上相邻元素构成的模式的功能。实际上，`1×1`卷积的主要计算发生在通道维上。
假设我们将通道维当作特征维，将高和宽维度上的元素当成数据样本，**那么`1×1`卷积层的作用与全连接层等价**。

下面我们使用全连接层中的矩阵乘法来实现`1×1`卷积。这里需要在矩阵乘法运算前后对数据形状做一些调整。

In [6]:
def corr2d_multi_in_out_1x1(X, K):
    c_i, h, w = X.shape
    c_o = K.shape[0]
    X = X.view(c_i, h * w)
    K = K.view(c_o, c_i)
    Y = torch.mm(K, X)  # 全连接层的矩阵乘法
    return Y.view(c_o, h, w)

经验证，做`1×1`卷积时，以上函数与之前实现的互相关运算函数`corr2d_multi_in_out`等价。

In [7]:
X = torch.rand(3, 3, 3)
K = torch.rand(2, 3, 1, 1)

Y1 = corr2d_multi_in_out_1x1(X, K)
Y2 = corr2d_multi_in_out(X, K)

(Y1 - Y2).norm().item() < 1e-6

True

在之后的模型里我们将会看到`1×1`卷积层被当作保持高和宽维度形状不变的全连接层使用。于是，我们可以通过调整网络层之间的通道数来控制模型复杂度。

# 小结
+ 使用多通道可以拓展卷积层的模型参数。
+ 假设将通道维当作特征维，将高和宽维度上的元素当成数据样本，那么`1×1`卷积层的作用与全连接层等价。
+ `1×1`卷积层通常用来调整网络层之间的通道数，并控制模型复杂度。