In [4]:
import numpy as np
import os
import tensorflow as tf
from keras.models import Model
from PIL import Image

# Tải mô hình Siamese đã huấn luyện
MODEL_PATH = "models/siamese_model.h5"
siamese_model = tf.keras.models.load_model(MODEL_PATH)

# Lấy mô hình cơ bản để trích xuất đặc trưng
base_model = siamese_model.layers[2]  # Đây là mô hình con trong Siamese Network

# Hàm load và chuẩn hóa ảnh
def load_image(image_path, target_size=(160, 160)):
    image = Image.open(image_path).convert("RGB")
    image = image.resize(target_size)
    image = np.array(image) / 255.0  # Chuẩn hóa giá trị pixel
    return np.expand_dims(image, axis=0)

# Tạo cơ sở dữ liệu embeddings
database = {}
PROCESSED_DIR = "data/processed"

for person_name in os.listdir(PROCESSED_DIR):
    person_dir = os.path.join(PROCESSED_DIR, person_name)
    if os.path.isdir(person_dir):
        for image_file in os.listdir(person_dir):
            if image_file.endswith(('.jpg', '.png')):
                image_path = os.path.join(person_dir, image_file)
                # Trích xuất đặc trưng
                image = load_image(image_path)
                embedding = base_model.predict(image)
                # Lưu vào database
                if person_name not in database:
                    database[person_name] = []
                database[person_name].append(embedding)

# Lưu database
np.save("data/database_embeddings.npy", database)
print("Cơ sở dữ liệu embeddings đã được lưu.")


Cơ sở dữ liệu embeddings đã được lưu.


In [6]:
import numpy as np

# Đường dẫn file cơ sở dữ liệu
DATABASE_PATH = "data/database_embeddings.npy"

# Đọc cơ sở dữ liệu
database = np.load(DATABASE_PATH, allow_pickle=True).item()

# Chuẩn hóa tất cả các embeddings thành vector 1-D
for person_name in database:
    database[person_name] = [embedding.flatten() for embedding in database[person_name]]

# Lưu lại cơ sở dữ liệu đã chuẩn hóa
np.save(DATABASE_PATH, database)
print("Cơ sở dữ liệu đã được chuẩn hóa và lưu lại!")


Cơ sở dữ liệu đã được chuẩn hóa và lưu lại!


In [7]:
import numpy as np

# Đường dẫn tới file embeddings
DATABASE_PATH = "data/database_embeddings.npy"

# Đọc file embeddings
database = np.load(DATABASE_PATH, allow_pickle=True).item()

# In ra danh sách các người trong cơ sở dữ liệu
print("Danh sách người trong cơ sở dữ liệu:")
for person_name, embeddings in database.items():
    print(f"- {person_name}: {len(embeddings)} embeddings")

# Kiểm tra kích thước và nội dung của embeddings
for person_name, embeddings in database.items():
    print(f"\nNgười: {person_name}")
    for i, embedding in enumerate(embeddings):
        print(f"  Embedding {i + 1} - Shape: {embedding.shape}, Values: {embedding[:5]}...")


Danh sách người trong cơ sở dữ liệu:
- Akshay Kumar: 50 embeddings
- Alexandra Daddario: 92 embeddings
- Alia Bhatt: 79 embeddings
- Amitabh Bachchan: 74 embeddings
- Andy Samberg: 92 embeddings
- Anushka Sharma: 68 embeddings
- Billie Eilish: 98 embeddings
- Brad Pitt: 120 embeddings
- Camila Cabello: 87 embeddings
- Charlize Theron: 78 embeddings
- Claire Holt: 96 embeddings
- Courtney Cox: 80 embeddings
- Dwayne Johnson: 61 embeddings
- Elizabeth Olsen: 71 embeddings
- Ellen Degeneres: 75 embeddings
- Henry Cavill: 106 embeddings
- Hrithik Roshan: 101 embeddings
- Hugh Jackman: 112 embeddings
- Jessica Alba: 108 embeddings
- Kashyap: 30 embeddings
- Lisa Kudrow: 70 embeddings
- Margot Robbie: 72 embeddings
- Marmik: 32 embeddings
- Natalie Portman: 105 embeddings
- Priyanka Chopra: 102 embeddings
- Robert Downey Jr: 113 embeddings
- Roger Federer: 77 embeddings
- Tom Cruise: 58 embeddings
- Vijay Deverakonda: 70 embeddings

Người: Akshay Kumar
  Embedding 1 - Shape: (128,), Values: 

In [2]:
import os
os.chdir('E:/thuc/doan2')  # Đổi thư mục làm việc