In [6]:
# 本代码构建了LeNet-5卷积神经网络，并使用MNIST数据集进行训练完成手写数字识别任务

In [7]:
import torch
import torch.nn as nn
import torch.utils.data as data
import torchvision
import matplotlib.pyplot as plt

In [8]:
# 运算设备设置为显卡
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
print(device)

cuda


In [9]:
# 下载MNIST数据集，输入调整为28×28
training_set = torchvision.datasets.MNIST('dataset', 
                                          train=True, 
                                          transform=torchvision.transforms.ToTensor(), 
                                          download=True)
test_set = torchvision.datasets.MNIST('dataset', 
                                      train=False, 
                                      transform=torchvision.transforms.ToTensor(),
                                      download=True)

100%|█████████████████████████████████████████████████████████████████████████████| 9.91M/9.91M [00:02<00:00, 4.32MB/s]
100%|██████████████████████████████████████████████████████████████████████████████| 28.9k/28.9k [00:00<00:00, 125kB/s]
100%|██████████████████████████████████████████████████████████████████████████████| 1.65M/1.65M [00:02<00:00, 648kB/s]
100%|█████████████████████████████████████████████████████████████████████████████| 4.54k/4.54k [00:00<00:00, 2.56MB/s]


In [14]:
# 设置批次大小
BATCH_SIZE= 256

In [15]:
# 加载训练集和测试集
train_loader = data.DataLoader(training_set, batch_size=BATCH_SIZE, shuffle=True)
test_loader = data.DataLoader(test_set, batch_size=BATCH_SIZE)

In [16]:
# 自定义最小池化层
class MinPool2d(nn.Module):
    def __init__(self, kernel_size, stride=None, padding=0):
        super(MinPool2d, self).__init__()
        self.kernel_size = kernel_size
        self.stride = stride or kernel_size
        self.padding = padding
    def forward(self, x):
        return -nn.functional.max_pool2d(-x,kernel_size=self.kernel_size, stride=self.stride, padding=self.padding)
        

In [20]:
# 定义LeNet-5模型，允许选择不同的池化方式
class LeNet5(nn.Module):
    def __init__(self):
        super(LeNet5,self).__init__()
        
        # 定义第一层卷积层：输入通道1，输出通道6，卷积核5x5，输出大小变为24x24x6
        conv1 = nn.Conv2d(1 ,6 ,kernel_size = 5, padding = 0, stride = 1)
        
        # 定义不同的池化层
        
        #最大池化层
        # self.pool1 = nn.MaxPool2d(kernel_size=2, stride=2)
        # self.pool2 = nn.MaxPool2d(kernel_size=2, stride=2)
        
        #平均池化层
        # self.pool1 = nn.AvgPool2d(kernel_size=2, stride=2)
        # self.pool2 = nn.AvgPool2d(kernel_size=2, stride=2)

        #最小池化层
        self.pool1 = MinPool2d(kernel_size=2, stride=2)
        self.pool2 = MinPool2d(kernel_size=2, stride=2)

        # 第二层卷积：输入通道6，输出通道16，卷积核5x5，输出大小变为8x8x16
        self.conv2 = nn.Conv2d(6, 16, kernel_size=5, stride=1, padding=0)
        
        # 全连接层：输入尺寸为4x4x16（经过第二次池化后）
        self.fc1 = nn.Linear(16 * 4 * 4, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)
        
        # 定义前向传播函数
        def forward(self,x):
            
        # 第一层卷积 + 池化
        x = self.pool1(torch.relu(self.conv1(x)))
        
        # 第二层卷积 + 池化
        x = self.pool2(torch.relu(self.conv2(x)))
        
        # 展平为一维向量
        x = x.view(-1, 16 * 4 * 4)
        x = torch.relu(self.fc1(x))
        x = torch.relu(self.fc2(x))
        x = self.fc3(x)
        
        return x