In [1]:
import numpy as np
import tensorflow as tf
from tensorflow import keras
from keras.layers import Dense, Conv2D, Flatten, MaxPooling2D
from keras.models import Sequential



In [2]:
# 导入 TensorFlow 和 MNIST 数据集
(train_images, train_labels), (test_images, test_labels) = tf.keras.datasets.mnist.load_data()

# 重新塑造图像数据以匹配 CNN 的输入形状
train_images = train_images.reshape(60000, 28, 28, 1)  # 将训练集图像重新塑造为 (60000, 28, 28, 1) 的形状
test_images = test_images.reshape(10000, 28, 28, 1)    # 将测试集图像重新塑造为 (10000, 28, 28, 1) 的形状

# 对标签进行独热编码，以适应模型的输出形式
test_labels = tf.keras.utils.to_categorical(test_labels)    # 将测试集标签进行独热编码
train_labels = tf.keras.utils.to_categorical(train_labels)  # 将训练集标签进行独热编码

# 将像素值标准化至 [0,1] 区间，以提高训练的稳定性和收敛速度
train_images = train_images / 255.0  # 将训练集像素值标准化至 [0,1] 区间
test_images = test_images / 255.0    # 将测试集像素值标准化至 [0,1] 区间

In [3]:
# 创建一个序贯模型
model = Sequential()

# 添加第一个卷积层： - 32个卷积核，每个卷积核大小为3x3 - 激活函数为ReLU
# - 输入图像大小为28x28，单通道
model.add(Conv2D(32, kernel_size=3, activation='relu', input_shape=(28,28,1)))

# 添加第一个池化层： - 池化窗口大小为3x3
model.add(MaxPooling2D(pool_size=(3, 3)))

# 添加第二个卷积层： - 24个卷积核，每个卷积核大小为3x3 - 激活函数为ReLU
model.add(Conv2D(24, kernel_size=3, activation='relu'))

# 添加第二个池化层： - 池化窗口大小为2x2
model.add(MaxPooling2D(pool_size=(2, 2)))

# 添加展平层，将多维输入展平为一维
model.add(Flatten())

# 添加全连接层： - 输出维度为10，因为数据集中有10个类别 - 激活函数为softmax，用于多分类问题
model.add(Dense(10, activation='softmax'))

# 编译模型： - 优化器为Adam - 损失函数为交叉熵损失，适用于多分类问题 - 评估指标为准确率
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])



In [4]:
model.fit(train_images, train_labels, validation_data=(test_images, test_labels), epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x1eac3a45710>