In [4]:
!pip install tensorflow

Collecting tensorflow
  Downloading tensorflow-2.19.0-cp312-cp312-win_amd64.whl.metadata (4.1 kB)
Collecting absl-py>=1.0.0 (from tensorflow)
  Downloading absl_py-2.2.2-py3-none-any.whl.metadata (2.6 kB)
Collecting astunparse>=1.6.0 (from tensorflow)
  Downloading astunparse-1.6.3-py2.py3-none-any.whl.metadata (4.4 kB)
Collecting flatbuffers>=24.3.25 (from tensorflow)
  Downloading flatbuffers-25.2.10-py2.py3-none-any.whl.metadata (875 bytes)
Collecting gast!=0.5.0,!=0.5.1,!=0.5.2,>=0.2.1 (from tensorflow)
  Downloading gast-0.6.0-py3-none-any.whl.metadata (1.3 kB)
Collecting google-pasta>=0.1.1 (from tensorflow)
  Downloading google_pasta-0.2.0-py3-none-any.whl.metadata (814 bytes)
Collecting libclang>=13.0.0 (from tensorflow)
  Downloading libclang-18.1.1-py2.py3-none-win_amd64.whl.metadata (5.3 kB)
Collecting opt-einsum>=2.3.2 (from tensorflow)
  Downloading opt_einsum-3.4.0-py3-none-any.whl.metadata (6.3 kB)
Collecting termcolor>=1.1.0 (from tensorflow)
  Downloading termcolor-3.0

# Bước 1: Import thư viện và tiền xử lý dữ liệu
- Đổi kích thước ảnh về cùng một kích thước (ví dụ 224x224 pixel cho các mô hình CNN phổ biến).
- Chuẩn hóa giá trị pixel (thường chia cho 255 để giá trị nằm trong khoảng 0-1).
- Nếu có thể, áp dụng `augmentation` (kỹ thuật tăng cường dữ liệu) để làm phong phú tập huấn luyện.

In [6]:
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# Định nghĩa các tham số hình ảnh
IMG_HEIGHT = 224
IMG_WIDTH = 224
BATCH_SIZE = 32

# Tạo đối tượng tăng cường dữ liệu cho huấn luyện
train_datagen = ImageDataGenerator(
    rescale=1./255,           # chuẩn hóa ảnh
    rotation_range=20,        # xoay ảnh ngẫu nhiên
    width_shift_range=0.2,    # dịch chuyển theo chiều ngang
    height_shift_range=0.2,   # dịch chuyển theo chiều dọc
    shear_range=0.2,          # gia công xoắn ảnh
    zoom_range=0.2,           # phóng to/thu nhỏ
    horizontal_flip=True,     # lật ảnh theo chiều ngang
    fill_mode='nearest'       # xử lý điểm ảnh biên
)

# Tạo đối tượng cho tập kiểm tra (không áp dụng augmentation)
test_datagen = ImageDataGenerator(rescale=1./255)

# Đường dẫn đến thư mục dữ liệu huấn luyện và testing trên máy của bạn
train_dir = './data/train'
test_dir = './data/test'

# Tạo generator
train_generator = train_datagen.flow_from_directory(
    train_dir,
    target_size=(IMG_HEIGHT, IMG_WIDTH),
    batch_size=BATCH_SIZE,
    class_mode='categorical'  # hoặc 'sparse' nếu nhãn được mã hóa dưới dạng số nguyên
)

test_generator = test_datagen.flow_from_directory(
    test_dir,
    target_size=(IMG_HEIGHT, IMG_WIDTH),
    batch_size=BATCH_SIZE,
    class_mode='categorical'
)

Found 12000 images belonging to 120 classes.
Found 8580 images belonging to 120 classes.


# Bước 2: Xây dựng mô hình CNN để phân loại ảnh
- Có thể sẽ xây dựng mô hình từ đầu hoặc sử dụng transfer learning (mô hình tiền huấn luyện như VGG16, ResNet50...)

### Sử dụng `Transfer learning` với mô hình `MobileNetV2`:

In [28]:
import tensorflow as tf
from tensorflow.keras.applications import MobileNetV2
from tensorflow.keras.models import Model
from tensorflow.keras.layers import Dense, GlobalAveragePooling2D, Dropout
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# Tải mô hình MobileNetV2 với trọng số đã được huấn luyện trên ImageNet, không bao gồm phần đầu phân loại
base_model = MobileNetV2(weights='imagenet', include_top=False, input_shape=(IMG_HEIGHT, IMG_WIDTH, 3))

# Đóng băng các tầng của mô hình cơ sở (không huấn luyện lại các weight đã học)
base_model.trainable = False

# Xây dựng phần head cho phân loại
x = base_model.output
x = GlobalAveragePooling2D()(x)
x = Dropout(0.5)(x)  # chặn quá khớp
# Số lớp đầu ra = số loại chó trong tập dữ liệu (nếu bạn đã kiểm tra, ví dụ giả sử có 120 loại)
num_classes = 120  
predictions = Dense(num_classes, activation='softmax')(x)

# Khởi tạo mô hình hoàn chỉnh
model = Model(inputs=base_model.input, outputs=predictions)

# Biên dịch mô hình
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
model.summary()

# Bước 3: Huấn luyện mô hình

In [17]:
epochs = 10  # thay đổi theo số epoch mong muốn

history = model.fit(
    train_generator,
    epochs=epochs,
    validation_data=test_generator
)

  self._warn_if_super_not_called()


Epoch 1/10
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m600s[0m 2s/step - accuracy: 0.2551 - loss: 3.3944 - val_accuracy: 0.7367 - val_loss: 0.9377
Epoch 2/10
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m377s[0m 1s/step - accuracy: 0.6054 - loss: 1.4027 - val_accuracy: 0.7639 - val_loss: 0.7702
Epoch 3/10
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m377s[0m 1s/step - accuracy: 0.6458 - loss: 1.1985 - val_accuracy: 0.7682 - val_loss: 0.7489
Epoch 4/10
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m358s[0m 954ms/step - accuracy: 0.6822 - loss: 1.0886 - val_accuracy: 0.7769 - val_loss: 0.7096
Epoch 5/10
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m326s[0m 871ms/step - accuracy: 0.6824 - loss: 1.0784 - val_accuracy: 0.7787 - val_loss: 0.6979
Epoch 6/10
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m361s[0m 963ms/step - accuracy: 0.7054 - loss: 0.9970 - val_accuracy: 0.7864 - val_loss: 0.6985
Epoch 7/10
[

In [20]:
test_loss, test_acc = model.evaluate(test_generator)
print("Test accuracy:", test_acc)

[1m269/269[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m89s[0m 329ms/step - accuracy: 0.7833 - loss: 0.7104
Test accuracy: 0.7833333611488342


In [22]:
model.save('dog_classifier_model.h5')



## Bước 4: Fine Tuning mô hình

In [30]:
# Chọn từ tầng nào của base model sẽ mở khóa để cập nhật trọng số
fine_tune_at = 100  # Mở khóa từ tầng thứ 100 trở đi
for layer in base_model.layers[:fine_tune_at]:
    layer.trainable = False
for layer in base_model.layers[fine_tune_at:]:
    layer.trainable = True

# Sử dụng learning rate thấp hơn khi fine tuning để tránh thay đổi đột ngột trọng số đã học
model.compile(optimizer=Adam(learning_rate=1e-5), loss='categorical_crossentropy', metrics=['accuracy'])
model.summary()

In [None]:
fine_tune_epochs = 10  # Số epoch fine tuning, thay đổi theo dữ liệu và tài nguyên
total_epochs = epochs + fine_tune_epochs

print("\n--- Fine tuning toàn bộ mô hình ---")
history_fine = model.fit(
    train_generator,
    epochs=total_epochs,
    initial_epoch=history.epoch[-1] + 1,
    validation_data=test_generator
)


--- Fine tuning toàn bộ mô hình ---
Epoch 11/20
