In [3]:
import numpy as np

train_path = "../data/embeddings/train_facenet_embeddings.npz"
# Load lại file numpy embeddings
npzfile = np.load(train_path)
X_train = npzfile['embedding']
y_train = npzfile['label']

In [4]:
import numpy as np

test_path = "../data/embeddings/test_facenet_embeddings.npz"
# Load lại file numpy embeddings
npzfile = np.load(test_path)
X_test = npzfile['embedding']
y_test = npzfile['label']

In [None]:
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score
from sklearn.model_selection import KFold

# Chia tập dữ liệu thành K-fold
kfold = KFold(n_splits=5, shuffle=True)

# Giá trị K muốn thử
k_values = [1, 2, 3, 4, 5, 6, 7, 8, 9]

# Lưu kết quả
results = {}

for k in k_values:
    # Tạo mô hình KNN
    model = KNeighborsClassifier(n_neighbors=k)

    # Lưu các kết quả đánh giá
    acc_scores = []
    prec_scores = []
    rec_scores = []
    f1_scores = []

    for train_idx, test_idx in kfold.split(X):
        # Tách dữ liệu train và test
        X_train, y_train = X[train_idx], y[train_idx]
        X_test, y_test = X[test_idx], y[test_idx]

        # Huấn luyện mô hình KNN
        model.fit(X_train, y_train)

        # Dự đoán trên tập test
        y_pred = model.predict(X_test)

        # Tính toán các độ đo hiệu suất
        acc = accuracy_score(y_test, y_pred)
        prec = precision_score(y_test, y_pred, average='weighted', zero_division=1)
        rec = recall_score(y_test, y_pred, average='weighted', zero_division=1)
        f1 = f1_score(y_test, y_pred, average='weighted')

        # Lưu kết quả
        acc_scores.append(acc)
        prec_scores.append(prec)
        rec_scores.append(rec)
        f1_scores.append(f1)

    # Tính trung bình các độ đo hiệu suất
    acc_avg = sum(acc_scores) / len(acc_scores)
    prec_avg = sum(prec_scores) / len(prec_scores)
    rec_avg = sum(rec_scores) / len(rec_scores)
    f1_avg = sum(f1_scores) / len(f1_scores)

    # Lưu kết quả vào dictionary
    results[k] = {
        'Accuracy': acc_avg,
        'Precision': prec_avg,
        'Recall': rec_avg,
        'F1-score': f1_avg
    }

# In kết quả
for k, res in results.items():
    print(f"K = {k}:")
    print(f"  Accuracy: {res['Accuracy']:.4f}")
    print(f"  Precision: {res['Precision']:.4f}")
    print(f"  Recall: {res['Recall']:.4f}")
    print(f"  F1-score: {res['F1-score']:.4f}")


In [None]:
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score
from sklearn.model_selection import train_test_split

# Giá trị K muốn thử
k_values = [1, 3, 5, 7, 9]

# Lưu kết quả
results = {}

for k in k_values:
    # Tạo mô hình KNN
    model = KNeighborsClassifier(n_neighbors=k)

    # Lưu các kết quả đánh giá
    acc_scores = []
    prec_scores = []
    rec_scores = []
    f1_scores = []

    for i in range(5):
        # Huấn luyện mô hình KNN
        model.fit(X_train, y_train)

        # Dự đoán trên tập test
        y_pred = model.predict(X_test)

        # Tính toán các độ đo hiệu suất
        acc = accuracy_score(y_test, y_pred)
        prec = precision_score(y_test, y_pred, average='weighted')
        rec = recall_score(y_test, y_pred, average='weighted')
        f1 = f1_score(y_test, y_pred, average='weighted')

        # Lưu kết quả
        acc_scores.append(acc)
        prec_scores.append(prec)
        rec_scores.append(rec)
        f1_scores.append(f1)

    # Tính trung bình các độ đo hiệu suất
    acc_avg = sum(acc_scores) / len(acc_scores)
    prec_avg = sum(prec_scores) / len(prec_scores)
    rec_avg = sum(rec_scores) / len(rec_scores)
    f1_avg = sum(f1_scores) / len(f1_scores)

    # Lưu kết quả vào dictionary
    results[k] = {
        'Accuracy': acc_avg,
        'Precision': prec_avg,
        'Recall': rec_avg,
        'F1-score': f1_avg
    }

# In kết quả
for k, res in results.items():
    print(f"K = {k}:")
    print(f"  Accuracy: {res['Accuracy']:.4f}")
    print(f"  Precision: {res['Precision']:.4f}")
    print(f"  Recall: {res['Recall']:.4f}")
    print(f"  F1-score: {res['F1-score']:.4f}")


In [26]:
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score
from sklearn.model_selection import KFold

# Chia tập dữ liệu thành K-fold
kfold = KFold(n_splits=5, shuffle=True)

# Giá trị số cây muốn thử
n_trees = [10, 15]

# Lưu kết quả
results = {}

for n in n_trees:
    # Tạo mô hình Random Forest với số cây là n
    model = RandomForestClassifier(n_estimators=n)

    # Lưu các kết quả đánh giá
    acc_scores = []
    prec_scores = []
    rec_scores = []
    f1_scores = []

    for train_idx, test_idx in kfold.split(X):
        # Tách dữ liệu train và test
        X_train, y_train = X[train_idx], y[train_idx]
        X_test, y_test = X[test_idx], y[test_idx]

        # Huấn luyện mô hình Random Forest
        model.fit(X_train, y_train)

        # Dự đoán trên tập test
        y_pred = model.predict(X_test)

        # Tính toán các độ đo hiệu suất
        acc = accuracy_score(y_test, y_pred)
        prec = precision_score(y_test, y_pred, average='weighted', zero_division=1)
        rec = recall_score(y_test, y_pred, average='weighted', zero_division=1)
        f1 = f1_score(y_test, y_pred, average='weighted')

        # Lưu kết quả
        acc_scores.append(acc)
        prec_scores.append(prec)
        rec_scores.append(rec)
        f1_scores.append(f1)

    # Tính trung bình các độ đo hiệu suất
    acc_avg = sum(acc_scores) / len(acc_scores)
    prec_avg = sum(prec_scores) / len(prec_scores)
    rec_avg = sum(rec_scores) / len(rec_scores)
    f1_avg = sum(f1_scores) / len(f1_scores)

    # Lưu kết quả vào dictionary
    results[n] = {
        'Accuracy': acc_avg,
        'Precision': prec_avg,
        'Recall': rec_avg,
        'F1-score': f1_avg
    }

# In kết quả
for n, res in results.items():
    print(f"Number of trees = {n}:")
    print(f"  Accuracy: {res['Accuracy']:.4f}")
    print(f"  Precision: {res['Precision']:.4f}")
    print(f"  Recall: {res['Recall']:.4f}")
    print(f"  F1-score: {res['F1-score']:.4f}")


Number of trees = 10:
  Accuracy: 0.1759
  Precision: 0.3287
  Recall: 0.1759
  F1-score: 0.1728
Number of trees = 15:
  Accuracy: 0.1979
  Precision: 0.2976
  Recall: 0.1979
  F1-score: 0.1876
