In [1]:
# Import các thư viện cần thiết
import numpy as np
import cv2
import pandas as pd
import os
import pickle
from google.colab import drive
from google.colab.patches import cv2_imshow

In [2]:
# Connect Google Drive
drive.mount('/content/drive')
path = '/content/drive/MyDrive/test_opencv/'
# Hiển thị tất cả thư mục hoặc file
os.listdir(path)

Mounted at /content/drive


['image_2260.jpg',
 'image_2400.jpg',
 'People.jpg',
 'models',
 '27.ipynb',
 '30.ipynb',
 'FaceImage',
 'data_face_features.pickle',
 '31_data_preprocessing.ipynb']

In [3]:
# Face detection model
faceDetectionModel = path + "/models/res10_300x300_ssd_iter_140000_fp16.caffemodel"

# Mô tả kiến trúc
faceDetectionProto = path + "/models/deploy.prototxt.txt"

# Mô hình mô tả khuôn mặt
faceDescriptor = path + "/models/openface.nn4.small2.v1.t7"

# Sử dụng OpenCV DNN đọc mô hình nhận diện khuôn mặt
dectectorModel = cv2.dnn.readNetFromCaffe(faceDetectionProto, faceDetectionModel)

# Đọc mô hình mô tả khuôn mặt từ file Torch
descriptorModel = cv2.dnn.readNetFromTorch(faceDescriptor)

In [4]:
# Danh sách hình ảnh chuẩn bị
faces = path + '/FaceImage'
os.listdir(faces)

['1721031620_PhanQuocHuy',
 '1721031695_DinhDuyLong',
 '1721031731_NguyenDongHung',
 '1721031591_NguyenHongNhung',
 '1721031651_NguyenHoangKyAnh',
 '1721031660_LeQuangQuocDat',
 '1721031615_VuDinhNguyen',
 '1721031618_TruongThanhLuan',
 '1721031561_NguyenDucHieu',
 '1721031693_HuynhMinhTien',
 '1721031324_LeVanTrong',
 '1721031488_PhamTheToan',
 '1721031558_ThaiMinhTam',
 '1721031457_BuiThiCaoDuyen',
 '1721031512_LeMinhNghia',
 '1721031314_NguyenDinhHao',
 '1721031546_Tran Trung Hieu',
 '1721031446_NguyenMinhKhanh',
 '1721031416_NguyenTheHien',
 '1721031460_NguyenDoanDucNam',
 '1721031293_LeBaoHongDuc',
 '1721031229_NinhVanDung',
 '1721031129_TranAnhHao',
 '1721031139_BaoNgocThienBao',
 '1721031077_PhamNguyenPhuongTheNgoc',
 '1721030985-PhamNgocKhanhVinh',
 '1721031236_nguyenhoangtuan',
 '1721031291_DaoHoangNhi',
 '1721030961_NguyenPhuocSang',
 '1721031276_ThachAnhQuoc',
 '1721030881_ThanTrongPhuc',
 '1721030848_LeQuocKy',
 '1721030802_NguyenNhatTien',
 '1721030943_DangMinhVu',
 '17210

In [5]:
# Tạo ra một functions để áp dụng cho nhiều ảnh
def myDetect(image_path):
  # Trích xuất đặc trưng cho một ảnh
  img1 = cv2.imread(image_path)

  # Copy cái ảnh
  image = img1.copy()

  # Lấy chiều cao và chiều rộng của ảnh
  h, w = image.shape[:2]

  # Chuẩn bị dữ liệu đầu vào cho mô hình nhận diện khuôn mặt
  imgBlob = cv2.dnn.blobFromImage(image, 1, (300,300), (104, 177, 123), swapRB=False, crop=False)

  # Thiết lập đầu vào cho mô hình
  dectectorModel.setInput(imgBlob)

  # Thực hiện việc nhận diện khuôn mặt
  detections = dectectorModel.forward()

  # Kiểm tra xem có khuôn mặt nào hay không?
  if (len(detections)>0):
    # Chọn khuôn mặt có độ tin cậy cao nhất (confidence) cao nhất
    i = np.argmax(detections[0, 0, :, 2]) # Giá trị thứ 2 trong 7 giá trị cuối cùng => confidence
    confidence = detections[0, 0, i, 2]

    # Kiểm tra độ tin cậy có lớn hơn 0.5
    if (confidence>0.5):
        # Tính toán hộp bao quanh khuôn mặt
        box = detections[0, 0, i, 3:7]* np.array([w, h, w, h])
        (startX, startY, endX, endY) =box.astype('int')

        # Trích xuất vùng ảnh chứa khuôn mặt ra
        roi = image[startY:endY, startX:endX]

        # Chuẩn bị dữ liệu đầu vào cho mô hình trích xuất đặc trưng
        faceBlob = cv2.dnn.blobFromImage(roi, 1/255, (96,96), (0,0,0), swapRB=True, crop=True)

        # Thiết lập đầu vào cho mô hình
        descriptorModel.setInput(faceBlob)

        # Thực hiện việc trích xuất đặc trưng
        vectors = descriptorModel.forward()

        # Print vectors
        return vectors

In [6]:
# Apply for all images
# Khởi tạo một dictionary
data = dict(data=[], label=[])

myDir = '/content/drive/MyDrive/test_opencv/FaceImage'
folders = os.listdir(myDir)

# Duyệt qua từng thư mục
for folder in folders:
  path = myDir + "/"+folder
  print(path)

  files = os.listdir(path)
  for fileName in files:
    try:
        # Gọi hàm trích xuất đặc trưng
        vector = myDetect(path+'/'+fileName)

        # Kiểm tra việc trích xuất đặc trưng thành công:
        if vector is not None:
          #Thêm vector đặc trưng vào trong từ điển với nhãn là tên của thư mục
          data['data'].append(vector)
          data['label'].append(folder)
          print('Trích xuất đặc trưng thành công')
    except:
      # Bỏ qua nếu gặp lỗi
      pass

/content/drive/MyDrive/test_opencv/FaceImage/1721031620_PhanQuocHuy
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Trích xuất đặc trưng thành công
Tríc

In [7]:
# Tạo một series từ dictionary
labelSeries = pd.Series(data['label'])
# Đếm số lần xuất hiện của mỗi nhãn
labelCounts = labelSeries.value_counts()
print(labelCounts)

1721030566_LeNguyenHoang        150
1721030676_NguyenChauNhutPhi    137
1721030848_LeQuocKy             135
1721031129_TranAnhHao           130
1721030367_LePhuongLinh         124
                               ... 
172100251_NguỵenHaiDuy          10
1721030497_HoThienSinh            9
172100103_tranquangthuan          8
1721021119_TranDuyHa              6
1721030802_NguyenNhatTien         5
Name: count, Length: 94, dtype: int64


In [8]:
# Save data -> file
print('/content/drive/MyDrive/test_opencv/')
fileName = '/content/drive/MyDrive/test_opencv/data_face_features.pickle'
pickle.dump(data, open(fileName, mode='wb'))

/content/drive/MyDrive/test_opencv/


In [9]:
pd.set_option('display.max_rows', None)  # Hiển thị tất cả các hàng
pd.set_option('display.max_columns', None) # Hiển thị tất cả các cột

In [10]:
print(labelCounts)

1721030566_LeNguyenHoang            150
1721030676_NguyenChauNhutPhi        137
1721030848_LeQuocKy                 135
1721031129_TranAnhHao               130
1721030367_LePhuongLinh             124
172100257_LuongThanhPhong           121
1721030537-VoHuuThang               102
1721030874_HoTuanDung               102
1721031293_LeBaoHongDuc              96
1721011379_TruongXuanHai             96
1721030572_DoTruongPhatDat           93
1721031276_ThachAnhQuoc              89
1721031615_VuDinhNguyen              88
1721030687_TrinhDuyNghia             87
172100048_NguyenPhamAnhKhoa          84
172100201_NguyenThanhDat             83
172100041_HoangHuuDien               82
1721031561_NguyenDucHieu             79
1721030403_LeKhaHieu                 79
1721030936-phamtrantrunghieu         77
1721030548_VuNguyenQuocAn            76
1721031731_NguyenDongHung            74
1721030544_TranQuangBinh             69
1721030398_TranMinhQuang             67
1721030943_DangMinhVu                66
