<a href="https://colab.research.google.com/github/Quanh2104/fall_detection/blob/main/resnet50ver2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.applications import ResNet50
from tensorflow.keras.models import Model
from tensorflow.keras.layers import Dense, GlobalAveragePooling2D, Dropout, BatchNormalization, Input
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.callbacks import ModelCheckpoint, EarlyStopping, ReduceLROnPlateau
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
from sklearn.metrics import classification_report, confusion_matrix
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import os
import cv2

In [2]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [3]:
#CÀI ĐẶT CÁC THAM SỐ ---
IMAGE_WIDTH = 224
IMAGE_HEIGHT = 224
IMAGE_SIZE = (IMAGE_WIDTH, IMAGE_HEIGHT)
IMAGE_CHANNELS = 3
BATCH_SIZE = 32
EPOCHS_INITIAL = 20
EPOCHS_FINE_TUNE = 30
LEARNING_RATE_INITIAL = 1e-3
LEARNING_RATE_FINE_TUNE = 1e-5

In [4]:
#Đường dẫn
DRIVE_PATH = '/content/drive/MyDrive/'
CSV_FILE_PATH = os.path.join('/content/drive/MyDrive/Dataset_Gender_Age/thuy2.csv')
IMAGE_DATA_DIR = os.path.join('/content/drive/MyDrive/Dataset_Gender_Age')


In [5]:
AGE_CLASSES = ['Child', 'Teen', 'Adult', 'Elderly']
GENDER_CLASSES = ['Male', 'Female']

## **Tải và tiền xử lý data**


In [6]:
# Đọc file CSV
try:
    df = pd.read_csv(CSV_FILE_PATH)
    print(f"Tải thành công file CSV. Số lượng mẫu: {len(df)}")
    print(df.head(20))
except FileNotFoundError:
    print(f"LỖI: Không tìm thấy file CSV tại: {CSV_FILE_PATH}")
    exit()

Tải thành công file CSV. Số lượng mẫu: 3505
                                                image  gender age group
0   /content/drive/MyDrive/Dataset_Gender_Age/Chil...  Female     Child
1   /content/drive/MyDrive/Dataset_Gender_Age/Chil...  Female     Child
2   /content/drive/MyDrive/Dataset_Gender_Age/Chil...  Female     Child
3   /content/drive/MyDrive/Dataset_Gender_Age/Chil...  Female     Child
4   /content/drive/MyDrive/Dataset_Gender_Age/Chil...  Female     Child
5   /content/drive/MyDrive/Dataset_Gender_Age/Chil...  Female     Child
6   /content/drive/MyDrive/Dataset_Gender_Age/Chil...  Female     Child
7   /content/drive/MyDrive/Dataset_Gender_Age/Chil...  Female     Child
8   /content/drive/MyDrive/Dataset_Gender_Age/Chil...  Female     Child
9   /content/drive/MyDrive/Dataset_Gender_Age/Chil...  Female     Child
10  /content/drive/MyDrive/Dataset_Gender_Age/Chil...  Female     Child
11  /content/drive/MyDrive/Dataset_Gender_Age/Chil...  Female     Child
12  /content/drive/M

In [7]:
df['image_path'] = df['image']

In [8]:
df['image_path']

Unnamed: 0,image_path
0,/content/drive/MyDrive/Dataset_Gender_Age/Chil...
1,/content/drive/MyDrive/Dataset_Gender_Age/Chil...
2,/content/drive/MyDrive/Dataset_Gender_Age/Chil...
3,/content/drive/MyDrive/Dataset_Gender_Age/Chil...
4,/content/drive/MyDrive/Dataset_Gender_Age/Chil...
...,...
3500,/content/drive/MyDrive/Dataset_Gender_Age/Elde...
3501,/content/drive/MyDrive/Dataset_Gender_Age/Elde...
3502,/content/drive/MyDrive/Dataset_Gender_Age/Elde...
3503,/content/drive/MyDrive/Dataset_Gender_Age/Elde...


In [9]:
# Định nghĩa hàm load_and_preprocess_image ĐÚNG
def load_and_preprocess_image(image_path, target_size=IMAGE_SIZE):
    image_path_str = '' # Khởi tạo biến trước khối try
    try:
        image_path_str = image_path.numpy().decode('utf-8') # Gán giá trị cho biến bên trong try
        image = tf.io.read_file(image_path)
        image = tf.image.decode_image(image, channels=IMAGE_CHANNELS) # <-- Dùng tf.image.decode_image
        print(f"Đã giải mã ảnh: {image_path_str}") # <-- Giữ lại dòng này để debug
        image = tf.image.resize(image, target_size)
        image = image / 255.0  # Chuẩn hóa về [0, 1]
        return image
    except Exception as e:
        print(f"Lỗi khi tải hoặc xử lý ảnh '{image_path_str}': {e}") # <-- Giữ lại dòng này để báo lỗi ảnh
        return None

In [10]:
# Mã hóa nhãn
# Giới tính:
gender_encoder = LabelEncoder()
df['gender_encoded'] = gender_encoder.fit_transform(df['gender'])
print("\nCác lớp giới tính sau mã hóa:", gender_encoder.classes_) # Sẽ là [0, 1] hoặc ['Female', 'Male'] tùy theo dữ liệu

gender_one_hot_encoder = OneHotEncoder(sparse_output=False)
gender_labels_one_hot = gender_one_hot_encoder.fit_transform(df['gender_encoded'].values.reshape(-1, 1))
print("Ví dụ nhãn giới tính one-hot:", gender_labels_one_hot[:5])

# Nhóm tuổi
age_encoder = LabelEncoder()
df['age_group_encoded'] = age_encoder.fit_transform(df['age group'])
print("\nCác lớp nhóm tuổi sau mã hóa:", age_encoder.classes_) # ['Adult', 'Child', 'Elderly', 'Teenager'] (thứ tự tùy thuộc vào dữ liệu)

age_one_hot_encoder = OneHotEncoder(sparse_output=False)
age_labels_one_hot = age_one_hot_encoder.fit_transform(df['age_group_encoded'].values.reshape(-1, 1))
print("Ví dụ nhãn nhóm tuổi one-hot:", age_labels_one_hot[:5])



Các lớp giới tính sau mã hóa: ['Female' 'Male']
Ví dụ nhãn giới tính one-hot: [[1. 0.]
 [1. 0.]
 [1. 0.]
 [1. 0.]
 [1. 0.]]

Các lớp nhóm tuổi sau mã hóa: ['Adult' 'Child' 'Elderly' 'Teen']
Ví dụ nhãn nhóm tuổi one-hot: [[0. 1. 0. 0.]
 [0. 1. 0. 0.]
 [0. 1. 0. 0.]
 [0. 1. 0. 0.]
 [0. 1. 0. 0.]]


In [11]:
# Chuẩn bị danh sách đường dẫn ảnh và nhãn
image_paths = df['image_path'].tolist()

gender_labels_binary = df['gender_encoded'].values # Sử dụng trực tiếp 0 hoặc 1
labels_gender = gender_labels_binary
labels_age = age_labels_one_hot


In [12]:
# Tỉ lệ: 70% train, 15% validation, 15% test
X_train_paths, X_temp_paths, y_train_gender, y_temp_gender, y_train_age, y_temp_age = train_test_split(
    image_paths, labels_gender, labels_age, test_size=0.3, random_state=42, stratify=df['age_group_encoded'] # Stratify theo tuổi để đảm bảo phân bố
)
X_val_paths, X_test_paths, y_val_gender, y_test_gender, y_val_age, y_test_age = train_test_split(
    X_temp_paths, y_temp_gender, y_temp_age, test_size=0.5, random_state=42, stratify=y_temp_age.argmax(axis=1) if y_temp_age.ndim > 1 else y_temp_age
)

print(f"\nKích thước tập huấn luyện: {len(X_train_paths)}")
print(f"Kích thước tập kiểm định: {len(X_val_paths)}")
print(f"Kích thước tập kiểm thử: {len(X_test_paths)}")


Kích thước tập huấn luyện: 2453
Kích thước tập kiểm định: 526
Kích thước tập kiểm thử: 526


In [13]:
# # Hàm tạo dataset từ đường dẫn và nhãn
# def create_dataset(image_paths, gender_labels, age_labels, batch_size):

#     path_ds = tf.data.Dataset.from_tensor_slices(image_paths)

#     image_ds = path_ds.map(load_and_preprocess_image, num_parallel_calls=tf.data.AUTOTUNE)

#     label_ds_gender = tf.data.Dataset.from_tensor_slices(tf.cast(gender_labels, tf.float32)) # Gender: 0 hoặc 1
#     label_ds_age = tf.data.Dataset.from_tensor_slices(tf.cast(age_labels, tf.float32)) # Age: one-hot
#     image_label_ds = tf.data.Dataset.zip((image_ds, {"gender_output": label_ds_gender, "age_output": label_ds_age}))
#     dataset = image_label_ds.shuffle(buffer_size=len(image_paths))
#     dataset = dataset.batch(batch_size)
#     dataset = dataset.prefetch(buffer_size=tf.data.AUTOTUNE) # Tối ưu hóa hiệu suất
#     return dataset


In [14]:
def create_dataset(image_paths, gender_labels, age_labels, batch_size):
    path_ds = tf.data.Dataset.from_tensor_slices(image_paths)

    # Sử dụng hàm map tùy chỉnh trả về ảnh và nhãn, và lọc bỏ ảnh None
    def load_and_filter(image_path, gender_label, age_label):
        image = load_and_preprocess_image(image_path)
        # Trả về cấu trúc có thể lọc, bao gồm cả nhãn
        return image, gender_label, age_label

    image_label_ds = tf.data.Dataset.from_tensor_slices((image_paths, gender_labels, age_labels))
    image_label_ds = image_label_ds.map(
        load_and_filter,
        num_parallel_calls=tf.data.AUTOTUNE
    )

    # Lọc bỏ các mục mà ảnh là None
    image_label_ds = image_label_ds.filter(lambda image, gender_label, age_label: image is not None)

    # Tách dataset đã lọc trở lại cấu trúc mong muốn, đặt tên cho output
    # This defines the output shapes explicitly
    image_label_ds = image_label_ds.map(lambda image, gender_label, age_label: (image, {"gender_output": tf.cast(gender_label, tf.float32), "age_output": tf.cast(age_label, tf.float32)}),
                                        num_parallel_calls=tf.data.AUTOTUNE,
                                        deterministic=False)

    dataset = image_label_ds.shuffle(buffer_size=len(image_paths)) # Kích thước buffer có thể cần điều chỉnh sau khi lọc
    dataset = dataset.batch(batch_size)
    dataset = dataset.prefetch(buffer_size=tf.data.AUTOTUNE) # Tối ưu hóa hiệu suất
    return dataset
    def is_valid_path(image_path, gender_label, age_label):
        image = load_and_preprocess_image(image_path)
        return image is not None  # True if valid, False if not

    image_label_ds = image_label_ds.filter(is_valid_path)

In [15]:
# def load_and_preprocess_image(image_path, target_size=IMAGE_SIZE):
#     # Use tf.py_function to wrap the eager execution part
#     def _load_and_preprocess_image_eager(image_path):
#         image_path_str = image_path.numpy().decode('utf-8')  # Now safe to use .numpy()
#         image = tf.io.read_file(image_path_str)
#         image = tf.image.decode_image(image, channels=IMAGE_CHANNELS)
#         print(f"Đã giải mã ảnh: {image_path_str}")
#         image = tf.image.resize(image, target_size)
#         image = image / 255.0  # Chuẩn hóa về [0, 1]
#         return image

#     # Apply tf.py_function
#     return tf.py_function(
#         _load_and_preprocess_image_eager,
#         [image_path],
#         tf.float32
#     )

In [16]:
train_dataset = create_dataset(X_train_paths, y_train_gender, y_train_age, BATCH_SIZE)
val_dataset = create_dataset(X_val_paths, y_val_gender, y_val_age, BATCH_SIZE)
test_dataset = create_dataset(X_test_paths, y_test_gender, y_test_age, BATCH_SIZE)

Lỗi khi tải hoặc xử lý ảnh '': 'SymbolicTensor' object has no attribute 'numpy'
Lỗi khi tải hoặc xử lý ảnh '': 'SymbolicTensor' object has no attribute 'numpy'
Lỗi khi tải hoặc xử lý ảnh '': 'SymbolicTensor' object has no attribute 'numpy'


In [17]:
# print("\nKiểm tra shape của một batch dữ liệu:")
# try:
#     for images, labels in train_dataset.take(1):
#         print("Train batch images shape:", images.shape)
#         print("Train batch gender labels shape:", labels['gender_output'].shape)
#         print("Train batch age labels shape:", labels['age_output'].shape)
# except Exception as e:
#     print(f"Lỗi khi lấy một batch từ train_dataset: {e}")

# try:
#     for images, labels in val_dataset.take(1):
#         print("Validation batch images shape:", images.shape)
#         # print("Validation batch gender labels shape:", labels['gender_output'].shape)
#         print("Validation batch age labels shape:", labels['age_output'].shape)
# except Exception as e:
#     print(f"Lỗi khi lấy một batch từ val_dataset: {e}")

# try:
#     for images, labels in test_dataset.take(1):
#         print("Test batch images shape:", images.shape)
#         print("Test batch gender labels shape:", labels['gender_output'].shape)
#         print("Test batch age labels shape:", labels['age_output'].shape)
# except Exception as e:
#     print(f"Lỗi khi lấy một batch từ test_dataset: {e}")

In [18]:
# # ... (previous code)

# # Xóa các hàng có đường dẫn không hợp lệ khỏi DataFrame
# invalid_paths = []
# for i in range(len(df)):
#     path_to_check = df['image_path'].iloc[i]
#     if not os.path.exists(path_to_check):
#         invalid_paths.append(i)

# # Check if all paths are invalid before dropping
# if len(invalid_paths) == len(df):
#     print("ERROR: All image paths are invalid. Please check your dataset.")
#     # Handle the case where all paths are invalid, e.g., exit the script
#     # or provide an option to the user to fix the paths.
#     exit()
# else:
#     df = df.drop(invalid_paths).reset_index(drop=True) # Reset index after dropping invalid paths
#     print(f"Đã xóa {len(invalid_paths)} hàng có đường dẫn không hợp lệ.")

# # Recreate X_train_paths, y_train_gender, etc. after removing invalid paths
# image_paths = df['image_path'].tolist()
# gender_labels_binary = df['gender_encoded'].values
# labels_gender = gender_labels_binary
# labels_age = age_one_hot_encoder.transform(df['age_group_encoded'].values.reshape(-1, 1)) # Re-encode age

# # Redo the train-test split with the updated data
# X_train_paths, X_temp_paths, y_train_gender, y_temp_gender, y_train_age, y_temp_age = train_test_split(
#     image_paths, labels_gender, labels_age, test_size=0.3, random_state=42, stratify=df['age_group_encoded']
# )
# X_val_paths, X_test_paths, y_val_gender, y_test_gender, y_val_age, y_test_age = train_test_split(
#     X_temp_paths, y_temp_gender, y_temp_age, test_size=0.5, random_state=42, stratify=y_temp_age.argmax(axis=1) if y_temp_age.ndim > 1 else y_temp_age
# )

# # Recreate datasets with the updated paths and labels
# train_dataset = create_dataset(X_train_paths, y_train_gender, y_train_age, BATCH_SIZE)
# val_dataset = create_dataset(X_val_paths, y_val_gender, y_val_age, BATCH_SIZE)
# test_dataset = create_dataset(X_test_paths, y_test_gender, y_test_age, BATCH_SIZE)

In [19]:
# Kiểm tra một batch dữ liệu
for images, labels in train_dataset.take(1):
    print("\nShapes của một batch dữ liệu huấn luyện:")
    print("Images shape:", images.shape)
    print("Gender labels shape:", labels['gender_output'].shape)
    print("Age labels shape:", labels['age_output'].shape)
    # Hiển thị một vài ảnh ví dụ
    plt.figure(figsize=(10, 10))
    for i in range(min(9, images.shape[0])): # Hiển thị tối đa 9 ảnh
        ax = plt.subplot(3, 3, i + 1)
        plt.imshow(images[i].numpy()) # .numpy() để chuyển tensor sang numpy array
        gender_pred_idx = int(round(labels['gender_output'][i].numpy())) # Nếu là sigmoid output
        age_pred_idx = np.argmax(labels['age_output'][i].numpy())
        plt.title(f"G: {GENDER_CLASSES[gender_pred_idx]}\nA: {AGE_CLASSES[age_pred_idx]}")
        plt.axis("off")
    plt.show()
    break

In [20]:
def create_dataset(image_paths, gender_labels, age_labels, batch_size):
    path_ds = tf.data.Dataset.from_tensor_slices(image_paths)

    # Sử dụng hàm map tùy chỉnh trả về ảnh và nhãn, và lọc bỏ ảnh None
    def load_and_filter(image_path, gender_label, age_label):
        image = load_and_preprocess_image(image_path)
        # Trả về cấu trúc có thể lọc
        return image, gender_label, age_label

    image_label_ds = tf.data.Dataset.from_tensor_slices((image_paths, gender_labels, age_labels))
    image_label_ds = image_label_ds.map(
        load_and_filter,
        num_parallel_calls=tf.data.AUTOTUNE
    )

    # Lọc bỏ các mục mà ảnh là None
    image_label_ds = image_label_ds.filter(lambda image, gender_label, age_label: image is not None)

    # Tách dataset đã lọc trở lại cấu trúc mong muốn
    image_ds = image_label_ds.map(lambda image, gender_label, age_label: image)
    label_ds_gender = image_label_ds.map(lambda image, gender_label, age_label: tf.cast(gender_label, tf.float32))
    label_ds_age = image_label_ds.map(lambda image, gender_label, age_label: tf.cast(age_label, tf.float32))

    # Ghép lại dataset
    image_label_ds = tf.data.Dataset.zip((image_ds, {"gender_output": label_ds_gender, "age_output": label_ds_age}))

    dataset = image_label_ds.shuffle(buffer_size=len(image_paths)) # Kích thước buffer có thể cần điều chỉnh sau khi lọc
    dataset = dataset.batch(batch_size)
    dataset = dataset.prefetch(buffer_size=tf.data.AUTOTUNE) # Tối ưu hóa hiệu suất
    return dataset

In [21]:
# --- 3. XÂY DỰNG MÔ HÌNH ResNet50 ---
def build_resnet50_model(image_size=IMAGE_SIZE, num_age_classes=len(AGE_CLASSES)):
    # Tải ResNet50 pre-trained trên ImageNet, không bao gồm lớp fully connected ở trên cùng
    base_model = ResNet50(weights='imagenet', include_top=False,
                          input_shape=(image_size[0], image_size[1], IMAGE_CHANNELS))

    # Đóng băng các lớp của base_model để không huấn luyện lại trong giai đoạn đầu
    base_model.trainable = False

    # Xây dựng phần đầu của mô hình (custom head)
    inputs = Input(shape=(image_size[0], image_size[1], IMAGE_CHANNELS))
    x = base_model(inputs, training=False) # Quan trọng: training=False khi base_model bị đóng băng
    x = GlobalAveragePooling2D(name='avg_pool')(x)

    # Nhánh cho Nhóm tuổi (Age)
    age_branch = Dense(256, activation='relu', name='age_dense_1')(x)
    age_branch = BatchNormalization(name='age_bn_1')(age_branch)
    age_branch = Dropout(0.5, name='age_dropout_1')(age_branch) # Dropout để chống overfitting
    age_branch = Dense(128, activation='relu', name='age_dense_2')(age_branch)
    age_branch = BatchNormalization(name='age_bn_2')(age_branch)
    age_branch = Dropout(0.3, name='age_dropout_2')(age_branch)
    age_output = Dense(num_age_classes, activation='softmax', name='age_output')(age_branch)

    # Nhánh cho Giới tính (Gender)
    gender_branch = Dense(128, activation='relu', name='gender_dense_1')(x) # Có thể dùng ít lớp hơn cho gender
    gender_branch = BatchNormalization(name='gender_bn_1')(gender_branch)
    gender_branch = Dropout(0.5, name='gender_dropout_1')(gender_branch)
    # Sử dụng 1 unit với sigmoid cho binary classification (Male/Female)
    gender_output = Dense(1, activation='sigmoid', name='gender_output')(gender_branch)
    # Hoặc 2 units với softmax nếu bạn mã hóa one-hot cho gender
    # gender_output = Dense(2, activation='softmax', name='gender_output')(gender_branch)


    # Tạo mô hình với 1 đầu vào và 2 đầu ra
    model = Model(inputs=inputs, outputs=[gender_output, age_output], name="ResNet50_Gender_Age")

    return model

model = build_resnet50_model()
model.summary()


Downloading data from https://storage.googleapis.com/tensorflow/keras-applications/resnet/resnet50_weights_tf_dim_ordering_tf_kernels_notop.h5
[1m94765736/94765736[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 0us/step


In [22]:
# Compile mô hình
# Định nghĩa losses và loss_weights
losses = {
    "gender_output": "binary_crossentropy", # Vì gender_output dùng sigmoid (1 unit)
    # "gender_output": "categorical_crossentropy", # Nếu gender_output dùng softmax (2 units)
    "age_output": "categorical_crossentropy"  # Vì age_output dùng softmax (4 units)
}
loss_weights = {"gender_output": 0.5, "age_output": 0.5} # Có thể điều chỉnh trọng số

model.compile(optimizer=Adam(learning_rate=LEARNING_RATE_INITIAL),
              loss=losses,
              loss_weights=loss_weights,
              metrics={
                  "gender_output": "accuracy", # Hoặc tf.keras.metrics.BinaryAccuracy()
                  "age_output": "accuracy"   # Hoặc tf.keras.metrics.CategoricalAccuracy()
              })


In [23]:
# --- 4. HUẤN LUYỆN GIAI ĐOẠN 1 (CHỈ HUẤN LUYỆN CÁC LỚP MỚI) ---
print("\n--- BẮT ĐẦU HUẤN LUYỆN GIAI ĐOẠN 1 (TRANSFER LEARNING) ---")

# Callbacks
checkpoint_path_initial = os.path.join(DRIVE_PATH, "resnet50_gender_age_initial_best.keras") #Lưu dưới dạng .keras
model_checkpoint_initial = ModelCheckpoint(filepath=checkpoint_path_initial,
                                           save_best_only=True,
                                           monitor='val_age_output_accuracy', # Theo dõi accuracy của nhánh tuổi trên tập val
                                           mode='max',
                                           verbose=1)
early_stopping = EarlyStopping(monitor='val_loss', # Theo dõi tổng loss trên tập val
                               patience=10, # Dừng nếu không cải thiện sau 10 epochs
                               verbose=1,
                               mode='min',
                               restore_best_weights=True)
reduce_lr = ReduceLROnPlateau(monitor='val_loss',
                              factor=0.2, # Giảm LR đi 5 lần
                              patience=5,
                              verbose=1,
                              mode='min',
                              min_lr=1e-7)

history_initial = model.fit(
    train_dataset,
    epochs=EPOCHS_INITIAL,
    validation_data=val_dataset,
    callbacks=[model_checkpoint_initial, early_stopping, reduce_lr]
)

# Tải lại trọng số tốt nhất từ giai đoạn 1
# model.load_weights(checkpoint_path_initial) # Đã có restore_best_weights=True trong EarlyStopping



--- BẮT ĐẦU HUẤN LUYỆN GIAI ĐOẠN 1 (TRANSFER LEARNING) ---
Epoch 1/20


ValueError: Inputs to a layer should be tensors. Got 'None' (of type <class 'NoneType'>) as input for layer 'ResNet50_Gender_Age'.

In [None]:
# --- 5. FINE-TUNING (MỞ BĂNG MỘT PHẦN HOẶC TOÀN BỘ ResNet50) ---
print("\n--- BẮT ĐẦU HUẤN LUYỆN GIAI ĐOẠN 2 (FINE-TUNING) ---")

base_model = model.get_layer('resnet50') # Lấy lại base_model từ mô hình đã xây dựng
base_model.trainable = True

for layer in base_model.layers:
    if isinstance(layer, BatchNormalization):
        layer.trainable = False

# Re-compile mô hình với learning rate nhỏ hơn nhiều cho fine-tuning
model.compile(optimizer=Adam(learning_rate=LEARNING_RATE_FINE_TUNE), # LR rất nhỏ
              loss=losses,
              loss_weights=loss_weights,
              metrics={
                  "gender_output": "accuracy",
                  "age_output": "accuracy"
              })

model.summary() # Xem lại các lớp trainable

# Callbacks cho fine-tuning
checkpoint_path_fine_tune = os.path.join(DRIVE_PATH, "resnet50_gender_age_fine_tune_best.keras")
model_checkpoint_fine_tune = ModelCheckpoint(filepath=checkpoint_path_fine_tune,
                                             save_best_only=True,
                                             monitor='val_age_output_accuracy',
                                             mode='max',
                                             verbose=1)
# Có thể dùng lại early_stopping và reduce_lr đã định nghĩa ở trên, hoặc tạo mới với patience khác
early_stopping_ft = EarlyStopping(monitor='val_loss', patience=15, verbose=1, mode='min', restore_best_weights=True)
reduce_lr_ft = ReduceLROnPlateau(monitor='val_loss', factor=0.2, patience=7, verbose=1, mode='min', min_lr=1e-8)


history_fine_tune = model.fit(
    train_dataset,
    epochs=EPOCHS_FINE_TUNE,
    validation_data=val_dataset,
    callbacks=[model_checkpoint_fine_tune, early_stopping_ft, reduce_lr_ft],
    initial_epoch=history_initial.epoch[-1] # Tiếp tục từ epoch cuối của giai đoạn 1 (nếu muốn)
)

# Tải lại trọng số tốt nhất từ giai đoạn fine-tuning
model.load_weights(checkpoint_path_fine_tune)


In [None]:
# --- 6. ĐÁNH GIÁ MÔ HÌNH TRÊN TẬP TEST ---
print("\n--- ĐÁNH GIÁ MÔ HÌNH TRÊN TẬP KIỂM THỬ ---")
results = model.evaluate(test_dataset, verbose=1)

print("\nKết quả đánh giá trên tập Test:")
print(f"Total Loss: {results[0]:.4f}")
print(f"Gender Loss: {results[1]:.4f} - Gender Accuracy: {results[3]:.4f}") # Index có thể thay đổi, kiểm tra model.metrics_names
print(f"Age Loss: {results[2]:.4f} - Age Accuracy: {results[4]:.4f}")
# In ra model.metrics_names để biết đúng index của từng metric
print("Model metrics names:", model.metrics_names)


# Lấy dự đoán trên tập test để xem xét chi tiết hơn
y_pred_test = model.predict(test_dataset)
y_pred_gender_proba = y_pred_test[0] # Xác suất cho gender
y_pred_age_proba = y_pred_test[1]    # Xác suất cho age

# Chuyển đổi xác suất thành nhãn lớp
y_pred_gender_classes = (y_pred_gender_proba > 0.5).astype("int32").flatten() # Ngưỡng 0.5 cho sigmoid
# y_pred_gender_classes = np.argmax(y_pred_gender_proba, axis=1) # Nếu gender dùng softmax
y_pred_age_classes = np.argmax(y_pred_age_proba, axis=1)

# Lấy nhãn thực tế từ test_dataset (cần phải lặp q///////ua dataset để lấy hết)
y_true_gender = []
y_true_age = []
for _, labels_batch in test_dataset:
    y_true_gender.extend(labels_batch['gender_output'].numpy().flatten().astype(int))
    y_true_age.extend(np.argmax(labels_batch['age_output'].numpy(), axis=1))

y_true_gender = np.array(y_true_gender)
y_true_age = np.array(y_true_age)



In [None]:
# Báo cáo phân loại và Ma trận nhầm lẫn
print("\n--- BÁO CÁO PHÂN LOẠI CHO GIỚI TÍNH ---")
print(classification_report(y_true_gender, y_pred_gender_classes, target_names=GENDER_CLASSES))
cm_gender = confusion_matrix(y_true_gender, y_pred_gender_classes)
plt.figure(figsize=(6, 5))
sns.heatmap(cm_gender, annot=True, fmt='d', cmap='Blues', xticklabels=GENDER_CLASSES, yticklabels=GENDER_CLASSES)
plt.title('Confusion Matrix - Gender')
plt.ylabel('True Label')
plt.xlabel('Predicted Label')
plt.show()

print("\n--- BÁO CÁO PHÂN LOẠI CHO NHÓM TUỔI ---")
# Đảm bảo target_names khớp với thứ tự của age_encoder.classes_
print(classification_report(y_true_age, y_pred_age_classes, target_names=age_encoder.classes_))
cm_age = confusion_matrix(y_true_age, y_pred_age_classes)
plt.figure(figsize=(8, 7))
sns.heatmap(cm_age, annot=True, fmt='d', cmap='Blues', xticklabels=age_encoder.classes_, yticklabels=age_encoder.classes_)
plt.title('Confusion Matrix - Age Group')
plt.ylabel('True Label')
plt.xlabel('Predicted Label')
plt.show()

In [None]:
# --- 7. VẼ BIỂU ĐỒ QUÁ TRÌNH HUẤN LUYỆN ---
def plot_training_history(history1, history2=None, stage1_name="Initial Training", stage2_name="Fine-tuning"):
    acc_gender_initial = history1.history['gender_output_accuracy']
    val_acc_gender_initial = history1.history['val_gender_output_accuracy']
    loss_gender_initial = history1.history['gender_output_loss'] # Hoặc 'loss' nếu chỉ có 1 loss
    val_loss_gender_initial = history1.history['val_gender_output_loss'] # Hoặc 'val_loss'

    acc_age_initial = history1.history['age_output_accuracy']
    val_acc_age_initial = history1.history['val_age_output_accuracy']
    loss_age_initial = history1.history['age_output_loss']
    val_loss_age_initial = history1.history['val_age_output_loss']

    epochs_range_initial = range(len(acc_gender_initial))

    plt.figure(figsize=(20, 12))

    # Gender Accuracy - Giai đoạn 1
    plt.subplot(2, 2, 1)
    plt.plot(epochs_range_initial, acc_gender_initial, label=f'{stage1_name} Gender Training Acc')
    plt.plot(epochs_range_initial, val_acc_gender_initial, label=f'{stage1_name} Gender Validation Acc')
    if history2:
        acc_gender_ft = history2.history['gender_output_accuracy']
        val_acc_gender_ft = history2.history['val_gender_output_accuracy']
        epochs_range_ft = range(len(acc_gender_initial), len(acc_gender_initial) + len(acc_gender_ft))
        plt.plot(epochs_range_ft, acc_gender_ft, label=f'{stage2_name} Gender Training Acc')
        plt.plot(epochs_range_ft, val_acc_gender_ft, label=f'{stage2_name} Gender Validation Acc')
    plt.legend(loc='lower right')
    plt.title('Gender Training and Validation Accuracy')

    # Gender Loss - Giai đoạn 1
    plt.subplot(2, 2, 2)
    plt.plot(epochs_range_initial, loss_gender_initial, label=f'{stage1_name} Gender Training Loss')
    plt.plot(epochs_range_initial, val_loss_gender_initial, label=f'{stage1_name} Gender Validation Loss')
    if history2:
        loss_gender_ft = history2.history['gender_output_loss']
        val_loss_gender_ft = history2.history['val_gender_output_loss']
        epochs_range_ft = range(len(loss_gender_initial), len(loss_gender_initial) + len(loss_gender_ft))
        plt.plot(epochs_range_ft, loss_gender_ft, label=f'{stage2_name} Gender Training Loss')
        plt.plot(epochs_range_ft, val_loss_gender_ft, label=f'{stage2_name} Gender Validation Loss')
    plt.legend(loc='upper right')
    plt.title('Gender Training and Validation Loss')

    # Age Accuracy - Giai đoạn 1
    plt.subplot(2, 2, 3)
    plt.plot(epochs_range_initial, acc_age_initial, label=f'{stage1_name} Age Training Acc')
    plt.plot(epochs_range_initial, val_acc_age_initial, label=f'{stage1_name} Age Validation Acc')
    if history2:
        acc_age_ft = history2.history['age_output_accuracy']
        val_acc_age_ft = history2.history['val_age_output_accuracy']
        epochs_range_ft = range(len(acc_age_initial), len(acc_age_initial) + len(acc_age_ft))
        plt.plot(epochs_range_ft, acc_age_ft, label=f'{stage2_name} Age Training Acc')
        plt.plot(epochs_range_ft, val_acc_age_ft, label=f'{stage2_name} Age Validation Acc')
    plt.legend(loc='lower right')
    plt.title('Age Group Training and Validation Accuracy')

    # Age Loss - Giai đoạn 1
    plt.subplot(2, 2, 4)
    plt.plot(epochs_range_initial, loss_age_initial, label=f'{stage1_name} Age Training Loss')
    plt.plot(epochs_range_initial, val_loss_age_initial, label=f'{stage1_name} Age Validation Loss')
    if history2:
        loss_age_ft = history2.history['age_output_loss']
        val_loss_age_ft = history2.history['val_age_output_loss']
        epochs_range_ft = range(len(loss_age_initial), len(loss_age_initial) + len(loss_age_ft))
        plt.plot(epochs_range_ft, loss_age_ft, label=f'{stage2_name} Age Training Loss')
        plt.plot(epochs_range_ft, val_loss_age_ft, label=f'{stage2_name} Age Validation Loss')
    plt.legend(loc='upper right')
    plt.title('Age Group Training and Validation Loss')

    plt.tight_layout()
    plt.show()

plot_training_history(history_initial, history_fine_tune)

In [None]:
# --- 8. LƯU MÔ HÌNH CUỐI CÙNG ---
final_model_path = os.path.join(DRIVE_PATH, "resnet50_gender_age_final_model.keras")
model.save(final_model_path)
print(f"\nMô hình cuối cùng đã được lưu tại: {final_model_path}")


In [None]:
# --- 9. (TÙY CHỌN) DỰ ĐOÁN TRÊN ẢNH MỚI ---
def predict_single_image(image_path, model_loaded, age_encoder_classes, gender_classes_map):
    img = load_and_preprocess_image(image_path)
    if img is None:
        return None, None
    img_array = tf.expand_dims(img, 0) # Tạo batch dimension

    predictions = model_loaded.predict(img_array)
    gender_pred_proba = predictions[0][0][0] # Xác suất giới tính (sigmoid output)
    age_pred_proba = predictions[1][0]       # Mảng xác suất các nhóm tuổi

    gender_label = gender_classes_map[int(round(gender_pred_proba))]
    age_label = age_encoder_classes[np.argmax(age_pred_proba)]

    # Hiển thị ảnh và dự đoán
    plt.imshow(img.numpy())
    plt.title(f"Predicted Gender: {gender_label} ({gender_pred_proba:.2f})\nPredicted Age Group: {age_label} ({np.max(age_pred_proba):.2f})")
    plt.axis("off")
    plt.show()
    return gender_label, age_label




In [None]:
# Ví dụ sử dụng '
test_image_path = os.path.join('/content/drive/MyDrive/Dataset_Gender_Age/Child/Female/viet_child_783.jpg')
GENDER_MAP_FOR_PREDICTION = {0: 'Male', 1: 'Female'}
loaded_model = tf.keras.models.load_model(final_model_path)
predict_single_image(test_image_path, loaded_model, age_encoder.classes_, GENDER_MAP_FOR_PREDICTION)