# 二维卷积

在卷积神经网络中，卷积运算实际就是**互相关运算**
(而**卷积运算**是先将kernel进行左右上下翻转, 然后再做互相关操作)．

我们将凡是包含了卷积层的神经网络都称为卷积神经网络．

- **特征图**: Input和kernel进行互相关操作后得到的矩阵
- **感受野**: 后一个特征图中的$1$个单元由前一个特征图的$n$个单元映射而来，$n$就是当前层相对于前一层的感受野；一般所说的感受野是当前特征图的一个单元相当于输入input的几个像素（单元），该大小可以比输入的尺寸大．（另一种说法是：当前feature map的一个单元受到了输入区域中多少个单元的影响）

In [3]:
### 1. 二维互相关运算

In [7]:
import torch 
from torch import nn

def corr2d(X, K):
    h, w = K.shape
    Y = torch.zeros((X.shape[0] - h + 1, X.shape[1] - w + 1))
    for i in range(Y.shape[0]):
        for j in range(Y.shape[1]):
            Y[i, j] = (X[i:i+h, j:j+w] * K).sum()
    
    return Y

In [8]:
# 例子：
Ｘ = torch.tensor([
        [0, 1, 2],
        [3, 4, 5],
        [6, 7, 8],
    ])
K = torch.tensor([
        [0, 1],
        [2, 3],
    ])
corr2d(X, K)

tensor([[19., 25.],
        [37., 43.]])

In [9]:
### 2.定义一个二维卷积层

In [10]:
class Conv2D(nn.Module):
    def __init__(self, kernel_size):
        super(Conv2D, self).__init__()
        self.weight = nn.Parameter(torch.randn(kernel_size))
        self.bias   = nn.Parameter(torch.randn(1))  # Parameter是Ｔensors的子类
                                            # 会自动设置requires_grad=True
    
    def forward(self, x):
        return corr2d(x, self.weight) + self.bias    

In [11]:
### 3. 尝试进行边缘检测

In [14]:
# 准备数据

Ｘ = torch.ones(6, 8)
X[:, 2:6] = 0
K = torch.tensor([[1, -1]])
Y = corr2d(X, K)

print(X)
print(K)
print(Y)

tensor([[1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.]])
tensor([[ 1, -1]])
tensor([[ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.]])


In [15]:
### 4. 反过来，给定数据，让其学习核函数

In [16]:
conv2d = Conv2D(kernel_size=(1, 2))  # 内部已经将　w, b完成初始化

step = 20
lr = 0.01
for i in range(step):
    Y_hat = conv2d(X)
    l = ((Y_hat - Y) ** 2).sum()
    l.backward()
    
    # 梯度下降
    conv2d.weight.data -= lr * conv2d.weight.grad
    conv2d.bias.data -= lr * conv2d.bias.grad
    
    # 梯度清零
    conv2d.weight.grad.fill_(0)
    conv2d.bias.grad.fill_(0)
    if (i + 1) % 5 == 0:
        print('Step %d, loss %.3f' % (i + 1, l.item()))

Step 5, loss 0.162
Step 10, loss 0.019
Step 15, loss 0.002
Step 20, loss 0.000


In [17]:
# 查看学习到的卷积核的权重, 偏置
print('weight:', conv2d.weight.data)
print('bias: ', conv2d.bias.data)

weight: tensor([[ 0.9956, -0.9998]])
bias:  tensor([0.0023])
