1. 相邻像素在像素中可能举例较远，难以被模型识别
2. 对于大尺寸图像，全连接层容易造成模型过大，权重参数过多，消耗资源较多。

# LeNet模型

分为卷积层块和全连接层块两个部分。

## 卷积层块
卷积层块里的基本单位是**卷积层** 后接 **池化层**，前者用来识别图像里的空间模式，后者用来降低卷积层对位置的敏感性。

卷积层：5 * 5的窗口，输出接sigmoid激活函数。第一层输出通道为6，第二层输出通道数则增加到16，增加输出通道的目的是使得两层的参数尺寸类似。

池化层：窗口形状为 2 * 2，步幅为2，这样池化窗口每次覆盖的区域互不重叠。

卷积层块输出形状：（批量大小，通道，高，宽）


## 全连接层块
当卷积层块的输出传入全连接层块时，全连接层块会将小批量中每个样本变平（flatten）。

全连接层块含3个全连接层，它们输出个数分别是120、84、10。

In [1]:
import time
import torch
import torch.nn as nn
import torch.optim as optim

import d2lzh_pytorch as d2l

In [2]:
class LeNet(nn.Module):
    def __init__(self):
        super(LeNet, self).__init__()
        self.conv = nn.Sequential(
            nn.Conv2d(1, 6, 5), # in_channel, out_channels, kernel_size 
            nn.Sigmoid(),
            nn.MaxPool2d(2, 2), # kernel_size, stride
            nn.Conv2d(6, 16, 5),
            nn.Sigmoid(),
            nn.MaxPool2d(2, 2)
        )
        self.fc = nn.Sequential(
            nn.Linear(16 * 4 * 4, 120),
            nn.Sigmoid(),
            nn.Linear(120, 84),
            nn.Sigmoid(),
            nn.Linear(84, 10)
        )
        def forward(self, img):
            feature = self.conv(img)
            # -1 表示除了将batch_size的留住，其他都平铺
            output = self.fc(feature.view(img.shape[0], -1))
            return output

In [4]:
X = torch.rand(3, 3, 4, 5)
Y = X.view(X.shape[0], -1)
X, Y

(tensor([[[[0.2074, 0.2054, 0.5633, 0.3730, 0.8804],
           [0.4153, 0.4657, 0.5863, 0.3955, 0.8333],
           [0.1516, 0.9421, 0.3776, 0.0644, 0.0509],
           [0.3256, 0.8615, 0.0672, 0.2774, 0.1863]],
 
          [[0.8762, 0.0150, 0.1385, 0.0170, 0.7206],
           [0.3973, 0.1492, 0.1111, 0.1172, 0.1541],
           [0.6786, 0.7248, 0.4294, 0.8560, 0.8313],
           [0.6508, 0.5372, 0.6621, 0.8178, 0.3615]],
 
          [[0.0988, 0.4579, 0.3510, 0.6998, 0.2864],
           [0.4671, 0.0352, 0.8265, 0.4562, 0.7443],
           [0.5871, 0.8109, 0.0035, 0.3449, 0.8018],
           [0.7328, 0.4198, 0.7526, 0.5755, 0.8206]]],
 
 
         [[[0.9563, 0.4376, 0.7134, 0.9166, 0.5823],
           [0.9733, 0.5761, 0.2175, 0.8851, 0.2554],
           [0.0991, 0.2961, 0.9611, 0.6106, 0.0844],
           [0.1208, 0.1454, 0.3462, 0.2565, 0.8868]],
 
          [[0.0856, 0.0987, 0.3582, 0.1966, 0.4465],
           [0.8674, 0.2877, 0.4052, 0.2205, 0.4557],
           [0.1451, 0.9533, 0.5