# Bước 1: Import thư viện và tiền xử lý dữ liệu
- Đổi kích thước ảnh về cùng một kích thước (ví dụ 224x224 pixel cho các mô hình CNN phổ biến).
- Chuẩn hóa giá trị pixel (thường chia cho 255 để giá trị nằm trong khoảng 0-1).
- Nếu có thể, áp dụng `augmentation` (kỹ thuật tăng cường dữ liệu) để làm phong phú tập huấn luyện.

In [13]:
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# Định nghĩa các tham số hình ảnh
IMG_HEIGHT = 224
IMG_WIDTH = 224
BATCH_SIZE = 32

# Tạo đối tượng tăng cường dữ liệu cho huấn luyện
train_datagen = ImageDataGenerator(
    rescale=1./255,           # chuẩn hóa ảnh
    rotation_range=20,        # xoay ảnh ngẫu nhiên
    width_shift_range=0.2,    # dịch chuyển theo chiều ngang
    height_shift_range=0.2,   # dịch chuyển theo chiều dọc
    shear_range=0.2,          # gia công xoắn ảnh
    zoom_range=0.2,           # phóng to/thu nhỏ
    horizontal_flip=True,     # lật ảnh theo chiều ngang
    fill_mode='nearest'       # xử lý điểm ảnh biên
)

# Tạo đối tượng cho tập kiểm tra (không áp dụng augmentation)
test_datagen = ImageDataGenerator(rescale=1./255)

# Đường dẫn đến thư mục dữ liệu huấn luyện và testing trên máy của bạn
train_dir = './data/train'
test_dir = './data/test'

# Tạo generator
train_generator = train_datagen.flow_from_directory(
    train_dir,
    target_size=(IMG_HEIGHT, IMG_WIDTH),
    batch_size=BATCH_SIZE,
    class_mode='categorical'  # hoặc 'sparse' nếu nhãn được mã hóa dưới dạng số nguyên
)

test_generator = test_datagen.flow_from_directory(
    test_dir,
    target_size=(IMG_HEIGHT, IMG_WIDTH),
    batch_size=BATCH_SIZE,
    class_mode='categorical'
)

Found 12000 images belonging to 120 classes.
Found 8580 images belonging to 120 classes.


# Bước 2: Xây dựng mô hình CNN để phân loại ảnh
- Có thể sẽ xây dựng mô hình từ đầu hoặc sử dụng transfer learning (mô hình tiền huấn luyện như VGG16, ResNet50...)

### Sử dụng `Transfer learning` với mô hình `MobileNetV2`:

In [17]:
import tensorflow as tf
from tensorflow.keras.applications import MobileNetV2
from tensorflow.keras.models import Model
from tensorflow.keras.layers import Dense, GlobalAveragePooling2D, Dropout
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# Tải mô hình MobileNetV2 với trọng số đã được huấn luyện trên ImageNet, không bao gồm phần đầu phân loại
base_model = MobileNetV2(weights='imagenet', include_top=False, input_shape=(IMG_HEIGHT, IMG_WIDTH, 3))

# Đóng băng các tầng của mô hình cơ sở (không huấn luyện lại các weight đã học)
base_model.trainable = False

# Xây dựng phần head cho phân loại
x = base_model.output
x = GlobalAveragePooling2D()(x)
x = Dropout(0.5)(x)  # chặn quá khớp
# Số lớp đầu ra = số loại chó trong tập dữ liệu (nếu bạn đã kiểm tra, ví dụ giả sử có 120 loại)
num_classes = 120  
predictions = Dense(num_classes, activation='softmax')(x)

# Khởi tạo mô hình hoàn chỉnh
model = Model(inputs=base_model.input, outputs=predictions)

# Biên dịch mô hình
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
model.summary()

# Bước 3: Huấn luyện mô hình

In [20]:
epochs = 10  # thay đổi theo số epoch mong muốn

history = model.fit(
    train_generator,
    epochs=epochs,
    validation_data=test_generator
)

  self._warn_if_super_not_called()


Epoch 1/10
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m437s[0m 1s/step - accuracy: 0.2649 - loss: 3.3229 - val_accuracy: 0.7253 - val_loss: 0.9408
Epoch 2/10
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m447s[0m 1s/step - accuracy: 0.6077 - loss: 1.3796 - val_accuracy: 0.7558 - val_loss: 0.7965
Epoch 3/10
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m389s[0m 1s/step - accuracy: 0.6473 - loss: 1.2175 - val_accuracy: 0.7717 - val_loss: 0.7434
Epoch 4/10
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m366s[0m 977ms/step - accuracy: 0.6756 - loss: 1.0864 - val_accuracy: 0.7763 - val_loss: 0.7171
Epoch 5/10
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m381s[0m 1s/step - accuracy: 0.6788 - loss: 1.0952 - val_accuracy: 0.7762 - val_loss: 0.7172
Epoch 6/10
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m387s[0m 1s/step - accuracy: 0.7037 - loss: 1.0039 - val_accuracy: 0.7885 - val_loss: 0.7011
Epoch 7/10
[1m375/

In [22]:
test_loss, test_acc = model.evaluate(test_generator)
print("Test accuracy:", test_acc)

[1m269/269[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m92s[0m 343ms/step - accuracy: 0.7760 - loss: 0.7023
Test accuracy: 0.776456892490387


In [23]:
model.save('dog_classifier_model.h5')



## Bước 4: Fine Tuning mô hình

In [25]:
# Chọn từ tầng nào của base model sẽ mở khóa để cập nhật trọng số
fine_tune_at = 100  # Mở khóa từ tầng thứ 100 trở đi
for layer in base_model.layers[:fine_tune_at]:
    layer.trainable = False
for layer in base_model.layers[fine_tune_at:]:
    layer.trainable = True

# Sử dụng learning rate thấp hơn khi fine tuning để tránh thay đổi đột ngột trọng số đã học
model.compile(optimizer=Adam(learning_rate=1e-5), loss='categorical_crossentropy', metrics=['accuracy'])
model.summary()

In [26]:
fine_tune_epochs = 10  # Số epoch fine tuning, thay đổi theo dữ liệu và tài nguyên
total_epochs = epochs + fine_tune_epochs

print("\n--- Fine tuning toàn bộ mô hình ---")
history_fine = model.fit(
    train_generator,
    epochs=total_epochs,
    initial_epoch=history.epoch[-1] + 1,
    validation_data=test_generator
)


--- Fine tuning toàn bộ mô hình ---
Epoch 11/20
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m462s[0m 1s/step - accuracy: 0.5182 - loss: 1.9479 - val_accuracy: 0.7763 - val_loss: 0.7283
Epoch 12/20
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m505s[0m 1s/step - accuracy: 0.6213 - loss: 1.2911 - val_accuracy: 0.7775 - val_loss: 0.7254
Epoch 13/20
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m489s[0m 1s/step - accuracy: 0.6518 - loss: 1.1747 - val_accuracy: 0.7803 - val_loss: 0.7031
Epoch 14/20
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m587s[0m 2s/step - accuracy: 0.6823 - loss: 1.0458 - val_accuracy: 0.7812 - val_loss: 0.6951
Epoch 15/20
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m531s[0m 1s/step - accuracy: 0.6859 - loss: 1.0312 - val_accuracy: 0.7894 - val_loss: 0.6735
Epoch 16/20
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m612s[0m 2s/step - accuracy: 0.7027 - loss: 0.9920 - val_accuracy: 0.793

In [31]:
# Lưu mô hình đã huấn luyện
model.save('dog_classifier_model_fine_tuned.h5')
print("\nMô hình đã được lưu với tên 'dog_classifier_model_fine_tuned.h5'")




Mô hình đã được lưu với tên 'dog_classifier_model_fine_tuned.h5'


In [34]:
test_loss, test_acc = model.evaluate(test_generator)
print("Test accuracy:", test_acc)

[1m269/269[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m94s[0m 348ms/step - accuracy: 0.8094 - loss: 0.6249
Test accuracy: 0.8033799529075623
