卷积神经网络（convolutional neural network）是含有卷积层（convolutional layer）的神经网络。

卷积运算==互相关运算

# 二维互相关运算
输入：二维数组(**输入数组**)+二维核(kernel)数组（**卷积核/过滤器**）

输出：二维数组（**卷积核窗口/卷积窗口**）

In [3]:
import torch
from torch import nn

def corr2d(X,K):
    h, w = K.shape #卷积核的高、宽
    
    # Y输出：卷积核窗口
    Y = torch.zeros((X.shape[0]- h + 1, X.shape[1] - w + 1)) 
    
    
    for i in range(Y.shape[0]):
        for j in range(Y.shape[1]):
            Y[i,j] = (X[i: i+h, j:j+w] * K).sum()
    return Y

In [4]:
X = torch.tensor([[0, 1, 2], [3, 4, 5], [6, 7, 8]])
K = torch.tensor([[0, 1], [2, 3]])
corr2d(X, K)

tensor([[19., 25.],
        [37., 43.]])

# 二维卷积层
二维卷积层将输入和卷积核做互相关运算，并加上一个标量偏差bias来得到输出。

参数：卷积核+bias常数
初始化：随机初始化卷积核

In [17]:
# 自定义二维卷积层
class Conv2D(nn.Module):
    def __init__(self,kernel_size):
        super(Conv2D,self).__init__()
        # Parameter是Tensor实例，不同的是，Parameter实例会自动添加到模型的参数列表
        self.weight = nn.Parameter(torch.randn(kernel_size))
        self.bias = nn.Parameter(torch.randn(1))
        
    def forward(self,x):
        y = corr2d(x,self.weight) + self.bias
        return y

# 图像物体边缘检测

In [11]:
# 构建6x8的图像，中间4列为黑色（0）
X = torch.ones(6, 8)
X[:, 2:6] = 0

# 构造1x2的卷积核
K = torch.tensor([[1,-1]]) # 互相关运算时，如果横向相邻元素相同，输出为0，反之输出为1

# 输入数组与卷积核作互相关运算
Y = corr2d(X,K)
print(Y)

tensor([[ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.]])


**我们可以看出，卷积层可通过重复使用卷积核有效地表征局部空间。**

# 通过数据学习核数组

In [21]:
# 构造一个核数组形状是(1, 2)的二维卷积层
# 其中随机初始化了1x2的卷积核
conv2d = Conv2D(kernel_size=(1, 2))

step = 100
lr = 0.01
for i in range(step):
    Y_hat = conv2d(X)
    l = ((Y_hat - Y) ** 2).sum()
    
    l.backward() # 计算参数梯度

    # 梯度下降
    conv2d.weight.data -= lr * conv2d.weight.grad
    conv2d.bias.data -= lr * conv2d.bias.grad

    # 梯度清0
    conv2d.weight.grad.fill_(0)
    conv2d.bias.grad.fill_(0)
    if (i + 1) % 5 == 0:
        print('Step %d, loss %.3f' % (i + 1, l.item()))


Step 5, loss 11.450
Step 10, loss 3.175
Step 15, loss 0.883
Step 20, loss 0.246
Step 25, loss 0.068
Step 30, loss 0.019
Step 35, loss 0.005
Step 40, loss 0.001
Step 45, loss 0.000
Step 50, loss 0.000
Step 55, loss 0.000
Step 60, loss 0.000
Step 65, loss 0.000
Step 70, loss 0.000
Step 75, loss 0.000
Step 80, loss 0.000
Step 85, loss 0.000
Step 90, loss 0.000
Step 95, loss 0.000
Step 100, loss 0.000


In [22]:
print(conv2d.weight.data)
print(conv2d.bias.data)

tensor([[ 1.0000, -1.0000]])
tensor([-6.5536e-14])


# 互相关运算和卷积运算

# 特征图和感受野

**特征图feature map**：二维卷积层输出的二维数据叫做特征图。可以看做是输入在空间维度上某一级的表征。

**感受野**：影响元素x的前向计算的所有可能输入区域（可能大于输入的实际尺寸）叫做
x的感受野(receptive field)
例如本节例子，输出中的阴影部分（1个格子）的感受野是输入中的阴影部分（4个格子）。

如果记输出为Y，然后再添加一层卷积层，将Y与另一个2x2的核数组作互相关运算，输出大小为1x1的Z。那么Z的感受野，就是输入X的所有格子（9个）