## Chuong 25
- Xây dựng mô hình CNN đơn giản
- Chi tiết kiến trúc:
Conv2D (32 filters, 5x5 kernel): Lớp tích chập trích xuất đặc trưng từ ảnh đầu vào.
MaxPooling2D(): Giảm kích thước ảnh đặc trưng và tăng tính khái quát.
Dropout(0.2): Giảm overfitting bằng cách vô hiệu hóa ngẫu nhiên 20% số neuron trong quá trình huấn luyện.
Flatten: Biến ảnh đặc trưng 2D thành vector 1D.
Dense(128, relu): Lớp fully-connected ẩn.
Dense(10, softmax): Lớp đầu ra với 10 nhãn tương ứng với 10 chữ số (0–9).

📚 Dataset: MNIST (Modified National Institute of Standards and Technology)
Gồm: 70.000 ảnh grayscale 28x28 pixels các chữ số viết tay từ 0 đến 9.

60.000 ảnh huấn luyện (training set)

10.000 ảnh kiểm tra (test set)

Dữ liệu ảnh: 1 kênh (grayscale), kích thước 28x28.

Dữ liệu nhãn (label): Các số từ 0 đến 9.

✅ Ứng dụng thực tế:
Bài toán phân loại ảnh đơn giản.

Bài học nền tảng về xử lý ảnh, nhận diện chữ số, kiến trúc CNN.

Là bài tập phổ biến trong học máy và deep learning nhập môn.

In [1]:
# Simple CNN for the MNIST Dataset
from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.layers import Dropout
from tensorflow.keras.layers import Flatten
from tensorflow.keras.layers import Conv2D
from tensorflow.keras.layers import MaxPooling2D
from tensorflow.keras.utils import to_categorical
# load data
(X_train, y_train), (X_test, y_test) = mnist.load_data()
# reshape to be [samples][width][height][channels]
X_train = X_train.reshape((X_train.shape[0], 28, 28, 1)).astype('float32')
X_test = X_test.reshape((X_test.shape[0], 28, 28, 1)).astype('float32')
# normalize inputs from 0-255 to 0-1
X_train = X_train / 255
X_test = X_test / 255
# one-hot encode outputs
y_train = to_categorical(y_train)
y_test = to_categorical(y_test)
num_classes = y_test.shape[1]
# define a simple CNN model
def baseline_model():
    # create model
    model = Sequential()
    model.add(Conv2D(32, (5, 5), input_shape=(28, 28, 1), activation='relu'))
    model.add(MaxPooling2D())
    model.add(Dropout(0.2))
    model.add(Flatten())
    model.add(Dense(128, activation='relu'))
    model.add(Dense(num_classes, activation='softmax'))
    # Compile model
    model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
    return model
# build the model
model = baseline_model()
# Fit the model
model.fit(X_train, y_train, validation_data=(X_test, y_test), epochs=10, batch_size=200)
# Final evaluation of the model
scores = model.evaluate(X_test, y_test, verbose=0)
print("CNN Error: %.2f%%" % (100-scores[1]*100))

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
[1m11490434/11490434[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 0us/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


Epoch 1/10
[1m300/300[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m11s[0m 34ms/step - accuracy: 0.8651 - loss: 0.4799 - val_accuracy: 0.9780 - val_loss: 0.0746
Epoch 2/10
[1m300/300[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m12s[0m 39ms/step - accuracy: 0.9775 - loss: 0.0778 - val_accuracy: 0.9835 - val_loss: 0.0504
Epoch 3/10
[1m300/300[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m12s[0m 39ms/step - accuracy: 0.9843 - loss: 0.0527 - val_accuracy: 0.9867 - val_loss: 0.0426
Epoch 4/10
[1m300/300[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m11s[0m 38ms/step - accuracy: 0.9881 - loss: 0.0396 - val_accuracy: 0.9890 - val_loss: 0.0349
Epoch 5/10
[1m300/300[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m11s[0m 35ms/step - accuracy: 0.9902 - loss: 0.0329 - val_accuracy: 0.9887 - val_loss: 0.0351
Epoch 6/10
[1m300/300[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m11s[0m 36ms/step - accuracy: 0.9920 - loss: 0.0262 - val_accuracy: 0.9870 - val_loss: 0.0362
Epoch 7/10
[1m3

📊 Kết quả huấn luyện mô hình CNN
⚙️ Thông số huấn luyện:
Số epoch: 10
Batch size: 200
Hàm mất mát: Categorical Crossentropy
Bộ tối ưu hóa: Adam

⚙️ Kiến trúc mô hình:
Conv2D(32 filters, 5x5) + ReLU
MaxPooling2D()
Dropout(0.2)
Flatten
Dense(128) + ReLU
Dense(10) + Softmax