1. 理论基础

CNN 的基本结构是什么？

考察你是否了解卷积层、池化层、全连接层等核心组件。

可以进一步追问每层的作用（如卷积层提取特征，池化层降维等）。

卷积操作的作用是什么？

考察你是否理解卷积操作如何提取局部特征，以及为什么卷积适合处理图像数据。

什么是感受野（Receptive Field）？

考察你对感受野的理解，以及如何计算感受野的大小。

池化层的作用是什么？最大池化和平均池化有什么区别？

考察你是否理解池化层的降维和抗过拟合作用，以及不同池化方法的优缺点。

什么是填充（Padding）和步幅（Stride）？

考察你是否理解填充和步幅对输出特征图大小的影响。

CNN 为什么适合处理图像数据？

考察你是否理解 CNN 的局部连接、权值共享和平移不变性等特点。

什么是通道（Channel）？1x1 卷积的作用是什么？

考察你是否理解多通道特征图的概念，以及 1x1 卷积在降维和特征融合中的作用。

CNN 的常见优化方法有哪些？

考察你是否了解批量归一化（Batch Normalization）、Dropout、权重初始化等方法。

2. 实践应用
常见问题：


你用过哪些深度学习框架（如 TensorFlow、PyTorch）实现 CNN？

考察你对框架的熟悉程度，能否快速实现一个简单的 CNN 模型。

如何设计一个 CNN 模型来解决图像分类问题？

考察你对模型设计的理解，包括层数、卷积核大小、激活函数等选择。

如何解决过拟合问题？

考察你是否了解数据增强、正则化、早停等方法。

如何处理图像数据？

考察你是否了解图像预处理（如归一化、数据增强）和加载数据的方法。

如何评估 CNN 模型的性能？

考察你是否了解常见的评估指标（如准确率、精确率、召回率、F1 分数）以及混淆矩阵。



In [1]:
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader
from torchvision import datasets, transforms
import matplotlib.pyplot as plt

In [2]:
# 定义数据预处理
transform = transforms.Compose([
    transforms.ToTensor(),  # 将图像转换为张量
    transforms.Normalize((0.5,), (0.5,))  # 归一化到 [-1, 1]
])

# 加载训练集和测试集
train_dataset = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
test_dataset = datasets.MNIST(root='./data', train=False, download=True, transform=transform)

# 创建 DataLoader
train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=64, shuffle=False)

In [3]:
class SimpleCNN(nn.Module):
    def __init__(self):
        super(SimpleCNN, self).__init__()
        # 卷积层 1：输入通道 1，输出通道 32，卷积核大小 3x3，填充 1
        self.conv1 = nn.Conv2d(1, 32, kernel_size=3, stride=1, padding=1)
        # 池化层：最大池化，核大小 2x2，步幅 2
        self.pool = nn.MaxPool2d(kernel_size=2, stride=2)
        # 卷积层 2：输入通道 32，输出通道 64，卷积核大小 3x3，填充 1
        self.conv2 = nn.Conv2d(32, 64, kernel_size=3, stride=1, padding=1)
        # 全连接层 1：输入大小 64*7*7，输出大小 128
        self.fc1 = nn.Linear(64 * 7 * 7, 128)
        # 全连接层 2：输入大小 128，输出大小 10（10 个类别）
        self.fc2 = nn.Linear(128, 10)
        # 激活函数
        self.relu = nn.ReLU()

    def forward(self, x):
        # 卷积层 1 + 池化 + ReLU
        x = self.pool(self.relu(self.conv1(x)))
        # 卷积层 2 + 池化 + ReLU
        x = self.pool(self.relu(self.conv2(x)))
        # 展平张量
        x = x.view(-1, 64 * 7 * 7)
        # 全连接层 1 + ReLU
        x = self.relu(self.fc1(x))
        # 全连接层 2（输出层）
        x = self.fc2(x)
        return x

In [None]:
#卷积操作
self.conv1 = nn.Conv2d(1, 32, kernel_size=3, stride=1, padding=1)


理解参数含义：输入通道、输出通道、卷积核大小

步长(stride)和填充(padding)的作用

感受野计算

特征图尺寸计算

输出大小 = (W - F + 2P)/S + 1
W=输入尺寸，F=卷积核，P=填充，S=步长
参数量计算

卷积层：(K×K×Cin + 1) × Cout
全连接层：(Nin + 1) × Nout


In [None]:
# 常见层类型
self.conv1 = nn.Conv2d()     # 卷积层
self.pool = nn.MaxPool2d()   # 池化层
self.fc1 = nn.Linear()       # 全连接层
self.relu = nn.ReLU()        # 激活函数

In [None]:
def forward(self, x):
    x = self.pool(self.relu(self.conv1(x)))  # 经典结构：Conv->ReLU->Pool
    x = x.view(-1, 64 * 7 * 7)               # 特征图展平
    x = self.fc2(self.relu(self.fc1(x)))     # 全连接分类

5. 常见问题
为什么要用CNN？

局部连接
参数共享
平移不变性
过拟合解决方案

Dropout
Batch Normalization
数据增强
梯度问题

梯度消失/爆炸
激活函数选择
残差连接


经典网络
LeNet
AlexNet
VGG
ResNet
Inception




In [None]:
# 常见优化方法
optimizer = torch.optim.Adam(model.parameters())
scheduler = torch.optim.lr_scheduler.StepLR()  # 学习率调整
criterion = nn.CrossEntropyLoss()             # 损失函数