### 二维卷积层

卷积神经网络是含有卷积层的神经网络。

#### 二维互相关运算

深度学习中的卷积层实际用的是互相关运算。

实际上，卷积运算与互相关运算类似。**为了得到卷积运算的输出，我们只需将核数组左右翻转并上下翻转，再与输入数组做互相关运算。其实，在深度学习中核数组都是学出来的：卷积层无论使用互相关运算或卷积运算都不影响模型预测时的输出。**

下图展示了一个二维输入数组和一个二维核(kernel,又称卷积核或过滤器(filter))通过互相关运算输出一个二维数组。
![image.png](attachment:image.png)

In [2]:
#将上述过程实现在corr2d函数里
#输入数组X和卷积核K，输出数组Y

import torch
from torch import nn

def corr2d(X,K):
    h,w=K.shape
    #Y为输出数组
    #在不填充的情况下，y的形状会变小
    Y=torch.zeros((X.shape[0]-h+1,X.shape[1]-w+1))
    for i in range(Y.shape[0]):
        for j in range(Y.shape[1]):
            Y[i,j]=(X[i:i+h,j:j+w]*K).sum()
    return Y

In [3]:
X=torch.tensor([[0,1,2],[3,4,5],[6,7,8]])
K=torch.tensor([[0,1],[2,3]])
corr2d(X,K)

tensor([[19., 25.],
        [37., 43.]])

#### 二维卷积层

**二维卷积层将输入和卷积核做互相关运算，并加上一个标量偏差来得到输出。**

In [4]:
class Conv2D(nn.Module):
    def __init__(self,kernel_size):
        super(Conv2D,self).__init__()
        self.weight=nn.Parameter(torch.randn(kernel_size))
        self.bias=nn.Parameter(torch.randn(1))
    def forward(self,X):
        return corr2d(X,self.weight)+self.bias

#### 图像中物体边缘检测

下面我们来看一个卷积层的简单应用：检测物体的边缘。

In [5]:
X=torch.ones(6,8)
X[:,2:6]=0
X

tensor([[1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.]])

In [8]:
#构造一个卷积核K
K=torch.tensor([[1,-1]])

In [9]:
Y=corr2d(X,K)
Y

tensor([[ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.]])

#### 通过数据学习核数组

下面个我们通过输入数据X和输出数据Y来学习我们构造的核数组K。

In [11]:
#构造一个二维卷积层
conv2d=Conv2D(kernel_size=(1,2))

step=50
lr=0.01
for i in range(step):
    Y_hat=conv2d(X)
    l=((Y_hat-Y)**2).sum()
    l.backward()
    
    #梯度下降
    conv2d.weight.data-=lr*conv2d.weight.grad
    conv2d.bias.data-=lr*conv2d.bias.grad
    
    #梯度清零
    conv2d.weight.grad.fill_(0)
    conv2d.bias.grad.fill_(0)
    if (i+1)%10==0:
        print('Step %d,loss %.3f'%(i+1,l.item()))

Step 10,loss 0.191
Step 20,loss 0.003
Step 30,loss 0.000
Step 40,loss 0.000
Step 50,loss 0.000


In [12]:
print('weight:',conv2d.weight.data)
print('bias:',conv2d.bias.data)

weight: tensor([[ 0.9999, -0.9999]])
bias: tensor([1.0694e-05])


#### 特征图和感受野

二维卷积层输出的二维数组可以看作是输入在空间维度（宽和高）上某一级的表征，也叫特征图（feature map）。影响元素xx的前向计算的所有可能输入区域（可能大于输入的实际尺寸）叫做xx的感受野（receptive field）。

我们可以通过更深的卷积神经网络使特征图中单个元素的感受野变得更加广阔，从而捕捉输入上更大尺寸的特征。