In [3]:
import os
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Flatten, Dense, Dropout
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.callbacks import EarlyStopping, ModelCheckpoint
from tensorflow.keras.applications import VGG16
from setting.setting import *

In [4]:
data_dir = "../../dataset/processed/v1/training"
val_data_dir = "../../dataset/processed/v1/validation"
model_dir = "../../models/VGG16"
best_model_filename = 'vgg16_best_model_v1.keras'
os.makedirs(model_dir, exist_ok=True)

In [5]:
# Tải và chuẩn hóa dữ liệu huấn luyện
train_ds = tf.keras.preprocessing.image_dataset_from_directory(
    data_dir,
    image_size=(IMG_HEIGHT, IMG_WIDTH),
    batch_size=BATCH_SIZE,
    label_mode='categorical',  # Nhãn dạng one-hot cho 26 lớp
).map(lambda x, y: (x / 255.0, y))  # Chuẩn hóa pixel về [0, 1]

# Tải và chuẩn hóa dữ liệu validation
val_ds = tf.keras.preprocessing.image_dataset_from_directory(
    val_data_dir,
    image_size=(IMG_HEIGHT, IMG_WIDTH),
    batch_size=BATCH_SIZE,
    label_mode='categorical',
).map(lambda x, y: (x / 255.0, y))

Found 21945 files belonging to 26 classes.
Found 2465 files belonging to 26 classes.


In [6]:
data_augmentation = tf.keras.Sequential([
    tf.keras.layers.RandomFlip("horizontal"),  # Lật ngang ngẫu nhiên
    tf.keras.layers.RandomZoom(0.1),  # Zoom ngẫu nhiên với biên độ 10%
    tf.keras.layers.RandomRotation(0.1),  # Xoay ngẫu nhiên với góc tối đa 10%
])

In [7]:
# Áp dụng augmentation cho tập huấn luyện
train_ds = train_ds.map(lambda x, y: (data_augmentation(x, training=True), y), num_parallel_calls=tf.data.AUTOTUNE)

# Tăng tốc xử lý dữ liệu bằng prefetch
train_ds = train_ds.prefetch(tf.data.AUTOTUNE)
val_ds = val_ds.prefetch(tf.data.AUTOTUNE)

In [8]:
# Tải VGG16 làm base model
base_model = VGG16(weights='imagenet', include_top=False, input_shape=(IMG_HEIGHT, IMG_WIDTH, 3))

# Đóng băng các lớp của VGG16
for layer in base_model.layers:
    layer.trainable = False

# Xây dựng mô hình hoàn chỉnh
model = Sequential([
    base_model,  # Sử dụng VGG16 làm nền tảng
    Flatten(),  # Chuyển tensor thành vector
    Dense(256, activation='relu'),  # Lớp fully connected với 256 units
    Dropout(0.5),  # Giảm overfitting
    Dense(26, activation='softmax')  # Lớp đầu ra cho 26 ký tự ASL
])

In [9]:
model.compile(
    optimizer=Adam(learning_rate=0.0001),  # Learning rate thấp để hội tụ ổn định
    loss='categorical_crossentropy',  # Loss function cho phân loại đa lớp
    metrics=['accuracy']  # Đánh giá bằng độ chính xác
)

In [10]:
# EarlyStopping để dừng sớm nếu không cải thiện
early_stopping = EarlyStopping(
    monitor='val_loss',  # Theo dõi validation loss
    patience=5,  # Dừng sau 5 epochs nếu không cải thiện
    mode='min',
    verbose=1
)

# ModelCheckpoint để lưu mô hình tốt nhất
checkpoint = ModelCheckpoint(
    os.path.join(model_dir, best_model_filename),  # Đường dẫn lưu file
    monitor='val_accuracy',  # Theo dõi validation accuracy
    save_best_only=True,  # Chỉ lưu mô hình tốt nhất
    mode='max',
    verbose=1
)

In [None]:
final_total_epochs = 100  # Số epochs tối đa
history = model.fit(
    train_ds,
    validation_data=val_ds,
    epochs=final_total_epochs,
    callbacks=[early_stopping, checkpoint],  # Áp dụng callbacks
    verbose=1  # Hiển thị tiến trình huấn luyện
)

Epoch 1/100


In [None]:
print(f"Mô hình tốt nhất đã được lưu tại: {os.path.join(model_dir, best_model_filename)}")

In [None]:
import matplotlib.pyplot as plt

plt.figure(figsize=(12, 4))
plt.subplot(1, 2, 1)
plt.plot(history.history['accuracy'], label='Train Accuracy')
plt.plot(history.history['val_accuracy'], label='Validation Accuracy')
plt.title('Model Accuracy')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.legend()

plt.subplot(1, 2, 2)
plt.plot(history.history['loss'], label='Train Loss')
plt.plot(history.history['val_loss'], label='Validation Loss')
plt.title('Model Loss')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.legend()

plt.show()

In [None]:
import random
import numpy as np
import string

val_images, val_labels = next(iter(val_ds))
random_index = random.randint(0, BATCH_SIZE - 1)
img = val_images[random_index]
true_label = val_labels[random_index]

pred = model.predict(tf.expand_dims(img, axis=0))
pred_label = string.ascii_uppercase[np.argmax(pred)]
true_label_str = string.ascii_uppercase[np.argmax(true_label)]

plt.imshow(img)
plt.title(f"True: {true_label_str}, Pred: {pred_label}")
plt.axis('off')
plt.show()