<a href="https://colab.research.google.com/github/chris-magic/d2l/blob/main/23_lenet.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

LetNet 由两个部分组成：卷积编码器和全连接层密集块


In [None]:
# 安装 d2l 库
!pip install d2l


In [6]:
# 导入库
import torch
from torch import nn
from d2l import torch as d2l

class Reshape(torch.nn.Module):
    def forward(self, x):
        return x.view(-1, 1, 28, 28)

net = torch.nn.Sequential(
    Reshape(), nn.Conv2d(1, 6, kernel_size=5, padding=2), nn.Sigmoid(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Conv2d(6, 16, kernel_size=5), nn.Sigmoid(),
    nn.AvgPool2d(kernel_size=2, stride=2), nn.Flatten(),
    nn.Linear(16 * 5 * 5, 120), nn.Sigmoid(),
    nn.Linear(120, 84), nn.Sigmoid(),
    nn.Linear(84, 10)
)


## 解释
|||
| :-----| :---- |
| Reshape: | 将输入重塑为 (batch_size, channels, height, width) 的形式。 |
|Conv2d:|二维卷积层，通常会改变输出通道数、高度和宽度。|
|Sigmoid:|激活函数，不改变形状。|
|AvgPool2d:|二维平均池化层，通常会减小高度和宽度。|
|Flatten:|将多维张量展平成一维向量。|
|Linear:|全连接层，改变最后一个维度的大小。|

## 解释每层的输出形状
|||
| :-----| :---- |
| Reshape: | 输入重塑为 [1, 1, 28, 28]。 |
| Conv2d(1, 6, kernel_size=5, padding=2): | 输出形状为 [1, 6, 28, 28]，由于填充使得输出大小不变，输出通道变为6。 |
| Sigmoid: | 输出形状不变，仍为 [1, 6, 28, 28]。 |
| AvgPool2d(kernel_size=2, stride=2):  | 输出形状为 [1, 6, 14, 14]，池化层将每个2x2的区域缩小为1x1，输出高宽各减半。 |
| Conv2d(6, 16, kernel_size=5): | 输出形状为 [1, 16, 10, 10]，没有填充，输出通道变为16，高宽各减少4。 |
| Sigmoid: | 输出形状不变，仍为 [1, 16, 10, 10]。 |
|AvgPool2d(kernel_size=2, stride=2):|输出形状为 [1, 16, 5, 5]，池化层将每个2x2的区域缩小为1x1，输出高宽各减半。|
|Flatten:|输出形状为 [1, 400]，将多维张量展平成一维向量。|
|Linear(16 * 5 * 5, 120):|输出形状为 [1, 120]，全连接层将400维输入转为120维。|
|Sigmoid:|输出形状不变，仍为 [1, 120]。|
|Linear(120, 84):|输出形状为 [1, 84]，全连接层将120维输入转为84维。|
|Sigmoid:|输出形状不变，仍为 [1, 84]。|
|Linear(84, 10): |输出形状为 [1, 10]，全连接层将84维输入转为10维，表示10个类别的输出。|
|||



这样，你可以看到每一层如何改变输入张量的形状，有助于理解网络结构和调试模型。

In [7]:
X = torch.rand(size=(1, 1, 28,28), dtype=torch.float32)
for layer in net:
    X = layer(X)
    print(layer.__class__.__name__, 'output shape: \t', X.shape)


Reshape output shape: 	 torch.Size([1, 1, 28, 28])
Conv2d output shape: 	 torch.Size([1, 6, 28, 28])
Sigmoid output shape: 	 torch.Size([1, 6, 28, 28])
AvgPool2d output shape: 	 torch.Size([1, 6, 14, 14])
Conv2d output shape: 	 torch.Size([1, 16, 10, 10])
Sigmoid output shape: 	 torch.Size([1, 16, 10, 10])
AvgPool2d output shape: 	 torch.Size([1, 16, 5, 5])
Flatten output shape: 	 torch.Size([1, 400])
Linear output shape: 	 torch.Size([1, 120])
Sigmoid output shape: 	 torch.Size([1, 120])
Linear output shape: 	 torch.Size([1, 84])
Sigmoid output shape: 	 torch.Size([1, 84])
Linear output shape: 	 torch.Size([1, 10])
