In [1]:
import torch
from d2l import torch as d2l
from torch import nn

In [37]:
# 通过在图像边界周围填充零来保证有足够的空间移动卷积核，从而保持输出大小不变。
# 在corr2d函数中实现如上过程，该函数接受输入张量X和卷积核张量K，并返回输出张量Y。

def corr2d(X, K):  #@save
    """计算二维互相关运算"""
    h, w = K.shape # h=2 w=2
    Y = torch.zeros((X.shape[0] - h + 1, X.shape[1] - w + 1)) # 3-2+1.  3-2+1
    for i in range(Y.shape[0]):
        for j in range(Y.shape[1]):
            Y[i, j] = (X[i:i + h, j:j + w] * K).sum()
#             print(X[i:i + h, j:j + w])
#             print(X[i:i + h, j:j + w] * K)
    return Y

X = torch.tensor([[0.0, 1.0, 2.0], [3.0, 4.0, 5.0], [6.0, 7.0, 8.0]])
K = torch.tensor([[0.0, 1.0], [2.0, 3.0]])
X.shape, K.shape, X.shape[0],X.shape[1], corr2d(X, K)

(torch.Size([3, 3]),
 torch.Size([2, 2]),
 3,
 3,
 tensor([[19., 25.],
         [37., 43.]]))

In [20]:
# 卷积层
# 定义的corr2d函数实现二维卷积层。在__init__构造函数中，将weight和bias声明为两个模型参数。
# 前向传播函数调用corr2d函数并添加偏置。
class Conv2D(nn.Module):
    def __init__(self,kernel_size):
        super().__init__()
        self.weight=nn.Parameter(torch.rand(kernel_size))
        self.bias=nn.Parameter(torch.zeros(1))
        
    def forward(self,x):
        return corr2d(x,self.weight)+self.bias

- 无论是左边还是右边逗号都要靠近冒号：
- 如果冒号：的左边或者右边还有冒号，这时候就说明其中一个冒号代表的是范围（eg:1:5 从１到４）
- 如果冒号：左边或者右边没有任何东西，那么这时候代表全体
- [a:b] 对ａ的改变是行的改变，对ｂ的改变是队列的改变
- 负数在左侧，则从后往前数n个
- 负数在右侧，则是排除了后n个

In [32]:
# 取法
x=torch.tensor([[0,1],[2,3],[4,5],[6,7],[8,9],[10,11],[12,13],[14,15],[16,17],[18,19]])  
x

# x[:,0] #　二维数组取第１维所有数据
# x[:,1] # 第２列
# x[0,:] # 第１行
# x[3,:] # 第4行
# x[1:4,:] # 第一二三行

tensor([[ 0,  1],
        [ 2,  3],
        [ 4,  5],
        [ 6,  7],
        [ 8,  9],
        [10, 11],
        [12, 13],
        [14, 15],
        [16, 17],
        [18, 19]])

In [40]:
X=torch.ones(6,8)
X

tensor([[1., 1., 1., 1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1., 1., 1., 1.]])

In [41]:
X[:,2:6]=0 # 第一维全取（行） 第二维取2到6列
X
# 中间四列为黑色（0），其余像素为白色（1）。

tensor([[1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.]])

In [42]:
# 构造一个高度为1、宽度为2的卷积核K
K=torch.tensor([[1.0,-1.0]])
Y=corr2d(X,K)
K , Y

(tensor([[ 1., -1.]]),
 tensor([[ 0.,  1.,  0.,  0.,  0., -1.,  0.],
         [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
         [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
         [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
         [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
         [ 0.,  1.,  0.,  0.,  0., -1.,  0.]]))

In [43]:
# 将输入的二维图像转置，再进行如上的互相关运算。 其输出如下，之前检测到的垂直边缘消失了。 
# 这个卷积核K只可以检测垂直边缘，无法检测水平边缘。

corr2d(X.t(),K)

tensor([[0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.]])

In [52]:
conv2d=nn.Conv2d(1,1,kernel_size=(1,2),bias=False)

X=X.reshape((1,1,6,8))
Y=Y.reshape((1,1,6,7))

lr=3e-2

for i in range(10):
    y_hat=conv2d(X)
    loss=(y_hat-Y)**2
    conv2d.zero_grad()
    loss.sum().backward()
    # 迭代卷积核
    conv2d.weight.data[:]-=lr*conv2d.weight.grad
    print(f'epoch:{i},loss{loss.sum():.3f}')

epoch:0,loss28.109
epoch:1,loss12.573
epoch:2,loss5.828
epoch:3,loss2.821
epoch:4,loss1.433
epoch:5,loss0.765
epoch:6,loss0.427
epoch:7,loss0.248
epoch:8,loss0.148
epoch:9,loss0.090


In [58]:
conv2d.weight.data

tensor([[[[ 0.9541, -1.0136]]]])

- 二维卷积层的核心计算是二维互相关运算。最简单的形式是，对二维输入数据和卷积核执行互相关操作，然后添加一个偏置。

- 我们可以设计一个卷积核来检测图像的边缘。

- 我们可以从数据中学习卷积核的参数。

- 学习卷积核时，无论用严格卷积运算或互相关运算，卷积层的输出不会受太大影响。

- 当需要检测输入特征中更广区域时，我们可以构建一个更深的卷积网络。