In [1]:
import numpy as np
import cv2

In [17]:
# Bước 1: Tải ảnh đầu vào
img = cv2.imread('./face.png')

# Hiển thị ảnh gốc
cv2.imshow('Ảnh Gốc', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

# Bước 2: Tải mô hình đã được huấn luyện trước
net = cv2.dnn.readNetFromCaffe('./models/deploy.prototxt.txt',
                               './models/res10_300x300_ssd_iter_140000_fp16.caffemodel')
                               
# Bước 3: Chuẩn bị dữ liệu đầu vào cho mạng neuron
# img: Đây là ảnh đầu vào mà bạn muốn nhận dạng khuôn mặt. Trong trường hợp của bạn, bạn đã đọc ảnh từ tệp "face.png".
# 1.0: Đây là tỷ lệ co giãn cho ảnh. Trong trường hợp này, ảnh sẽ không bị co giãn hoặc mở rộng, và giữ nguyên kích thước ban đầu.
# (300, 300): Đây là kích thước mà mô hình yêu cầu cho ảnh đầu vào. Mô hình mà bạn đang sử dụng mong muốn ảnh có kích thước 300x300 pixel. Do đó, bạn co giãn hoặc cắt ảnh đầu vào thành kích thước này.
# (104, 177, 123): Đây là giá trị trung bình màu sắc được trừ đi từ mỗi pixel của ảnh. Điều này thường được sử dụng để chuẩn hóa dữ liệu đầu vào. Trong trường hợp này, các giá trị này thường được lấy từ dữ liệu huấn luyện của mô hình.
# swapRB=False: Đây là một cờ để xác định xem có cần hoán đổi các kênh màu đỏ và xanh (Red-Blue) trong ảnh hay không. Trong trường hợp này, bạn đã đặt nó thành False, tức là không hoán đổi kênh mà
blob = cv2.dnn.blobFromImage(img, 1.0, (300, 300), (104, 177, 123), swapRB=False)

# Bước 4: Đặt dữ liệu đầu vào cho mạng
net.setInput(blob)

# Bước 5: Chạy mạng để phát hiện khuôn mặt
detections = net.forward()

print(detections.shape)     
# Chiều đầu tiên (đầu tiên từ trái sang phải) có kích thước là 1, đại diện cho số lô (batch size) của các ảnh đầu vào. Trong trường hợp này, bạn đang xử lý một ảnh nên batch size là 1.
# Chiều thứ hai cũng có kích thước là 1, đại diện cho số lớp (classes) hoặc số kích thước (size dimensions) trong dữ liệu đầu ra. Trong trường hợp này, bạn đang thực hiện nhận dạng khuôn mặt nên số lớp là 1.
# Chiều thứ ba có kích thước là 200, đại diện cho số khuôn mặt được phát hiện trong một ảnh. Điều này có nghĩa rằng mô hình có khả năng phát hiện tối đa 200 khuôn mặt trong ảnh đầu vào.
# Chiều cuối cùng có kích thước là 7, đại diện cho thông tin về mỗi khuôn mặt phát hiện. Chiều này chứa thông tin về vị trí của khuôn mặt và độ tin cậy (confidence) của việc phát hiện.
                               
# Bước 6: Lấy kích thước của ảnh đầu vào
h, w = img.shape[:2]

# Bước 7: Duyệt qua các khuôn mặt đã được phát hiện
for i in range(0, detections.shape[2]):
    confidence = detections[0, 0, i, 2]

    # Kiểm tra nếu khuôn mặt đã phát hiện có độ tin cậy lớn hơn hoặc bằng 0.5
    if confidence >= 0.5:
        # Trích xuất tọa độ hình chữ nhật chuẩn hóa
        box = detections[0, 0, i, 3:7]
        box = box * np.array([w, h, w, h])
        box = box.astype(int)
        startx, starty, endx, endy = box

        # Vẽ hình chữ nhật xung quanh khuôn mặt phát hiện
        cv2.rectangle(img, (startx, starty), (endx, endy), (0, 255, 0), 2)

        # Hiển thị điểm tin cậy trên hình chữ nhật
        text = 'Face: {:.2f}%'.format(confidence * 100)
        cv2.putText(img, text, (startx, starty - 10), cv2.FONT_HERSHEY_PLAIN, 1, (255, 255, 255), 2)

# Hiển thị ảnh kết quả với khuôn mặt đã được phát hiện
cv2.imshow('Kết Quả Nhận Dạng Khuôn Mặt', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

(1, 1, 200, 7)


# Landmark Detection

In [12]:
h,w = img.shape[:2]
for i in range(0,detections.shape[2]):
    confidence = detections[0,0,i,2]
    if confidence >= 0.5:
        #print(confidence)
        # bounding box (3:7)
        box = detections[0,0,i,3:7] # normalized bounding box values
        box = box*np.array([w,h,w,h])
        box = box.astype(int)
        startx, starty , endx, endy = box
        # draw the rectangle face
        cv2.rectangle(img,(startx,starty),(endx,endy),(0,255,0))
        
        
        # put text
        text = 'Face: {:.2f} %'.format(confidence*100)
        cv2.putText(img,text,(startx,starty-10),cv2.FONT_HERSHEY_PLAIN,1,(255,255,255),)
        
cv2.imshow('face detect',img)
cv2.waitKey(0)
cv2.destroyAllWindows()
        