**BÁO CÁO môn học** “Chuyên đề nghiên cứu về Thị giác máy tính”

- **Giảng viên**: TS. Lê Đình Duy
- **Sinh viên**: Phạm Đức Duy - CH1801024


**Đồ án**: FACE RECOGNITION MINI-CHALLENGE

- **Nguồn tham khảo**:[face_recognition](https://github.com/ageitgey/face_recognition)  - **Adam Geitgey**
- **Project đã thực hiện**:[face_recognition-KNN](https://github.com/WoSea/CS2309.CH1302/tree/master/6.FaceRecognition)


 # 1. Giới thiệu
Bài toán nhận dạng các HV của lớp CĐ Thị Giác Máy Tính. Với tập dữ liệu là các thư mục chứa hình ảnh khuôn mặt của từng người. Viết chương trình để gán label cho các face có trong những hình ảnh Test (có mặt các thành viên trong lớp).
Sau đó, xác định độ chính xác bằng đếm thủ công (manually) và report kết quả.

- Input: Hình ảnh test chứa khuôn mặt của các thành viên trong lớp hoặc 1 số thành viên
- Output: Những khuôn mặt có trong hình test được bounding box và gán label, kiểm tra thủ công bao nhiêu khuôn mặt được nhận diện chính xác.
- Technique:[K-Nearest Neighbors algorithm (K-NN)](https://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm)
- Cây thư mục Project:
     >- **FaceRecognition**
       - **images**
         - **result** (chứa các hình đã được xử lý)
           - *.jpg
           - ...
           - *.jpg
         - **test**   (chứa các hình ảnh để test)
           - *.jpg
           - ...
           - *.jpg
         - **train**  (chứa các hình ảnh khuôn mặt - training data)
           - user1 folder
             - *.jpg
             - ...
             - *.jpg
           - ...
           - user19 folder
             - *.jpg
             - ...
             - *.jpg 
       - **main.py**
       - **report.ipynb**
       - *trained_knn_model.clf*

Mã nguồn giải bài toán nằm trong tập tin main.py chạy với Anaconda Prompt

Môi trường thực hiện:
>- [x] Python 3.6 or Python 2.7
- [x] Windows 
- [x] sklearn, Dlib, face_recognition package 

Các bước thực thi project:
>1.Tạo Virtual Environment với Anaconda
    - Tạo env cho project này: conda create -n myenv 
    - lựa chọn phiên bản python phù hợp cho project: conda create -n myenv python=3.6
    - activate env vừa tạo: conda activate myenv
>2.Install package
    - Dlib: pip install dlib
    - FaceRecognition: pip install face_recognition
>3.Thực thi code
    -(myenv) C:\Users\username>python C:\Users\duyph\projectfolder\main.py 

 # 2. Mã nguồn

In [None]:
# Import các thư viện
import math
from sklearn import neighbors 
import os
import os.path
import pickle
from PIL import Image, ImageDraw
import face_recognition
from face_recognition.face_recognition_cli import image_files_in_folder

In [None]:
# Danh sách các đuôi mở rộng cho phép của tệp hình ảnh
ALLOWED_EXTENSIONS = {'png', 'jpg', 'jpeg'}

In [None]:
# Định nghĩa hàm Train(), trả về một model chứa kết quả huấn luyện cho KNN trên tập dự liệu trong folder train
def train(train_dir, model_save_path=None, n_neighbors=None, knn_algo='ball_tree', verbose=False):

    X = [] # mảng chứa các khuôn mặt để huấn luyện
    y = [] # mảng chứa các label tương ứng
    # Vòng lặp for duyệt các hình ảnh khuôn mặt trong tập huấn luyện
    for class_dir in os.listdir(train_dir):
        if not os.path.isdir(os.path.join(train_dir, class_dir)):
            continue 
        
        # Với mỗi thư mục trên tạo một vòng lặp duyệt các file hình ảnh trong đó
        for img_path in image_files_in_folder(os.path.join(train_dir, class_dir)):
            image = face_recognition.load_image_file(img_path) 
            face_bounding_boxes = face_recognition.face_locations(image)


            if len(face_bounding_boxes) != 1:
                #Nếu không có hoặc có quá nhiều khuôn mặt trong hình ảnh test sẽ không hợp lệ và thực hiện skip
                if verbose:
                    print("Image {} not suitable for training: {}".format(img_path, "Didn't find a face" if len(face_bounding_boxes) < 1 else "Found more than one face"))
            else:
                # mã hóa khuôn mặt và đưa vào tập huấn huyện (mảng X)
                X.append(face_recognition.face_encodings(image, known_face_locations=face_bounding_boxes)[0])
                y.append(class_dir) 
    # Xác định bao nhiêu neighbors trong KNN classifier,  
    if n_neighbors is None:
        n_neighbors = int(round(math.sqrt(len(X))))
        if verbose:
            print("Chose n_neighbors automatically:", n_neighbors)

    # Gọi hàm neighbors.KneighborsClassifier để tạo và tập huấn cho KNN classifier trên tập huấn luyện X, truyền vào trọng số n_neighbors đã tính, tham số algorithm và weights
    knn_clf = neighbors.KNeighborsClassifier(n_neighbors=n_neighbors, algorithm=knn_algo, weights='distance')
    knn_clf.fit(X, y)

     
    # save model đã train
    if model_save_path is not None:
        with open(model_save_path, 'wb') as f:
            pickle.dump(knn_clf, f)  
    # lưu kết quả huấn luyện của KNN classifier => file trained_knn_model.clf
    return knn_clf

In [None]:
def predict(X_img_path, knn_clf=None, model_path=None, distance_threshold=0.6):

    # Kiểm tra đường dẫn hình ảnh  
    if not os.path.isfile(X_img_path) or os.path.splitext(X_img_path)[1][1:] not in ALLOWED_EXTENSIONS:
        raise Exception("Invalid image path: {}".format(X_img_path))
        
    # Yêu cầu truyền vào model knn_clf đã train trước đó  (kết quả hàm train)
    if knn_clf is None and model_path is None:
        raise Exception("Must supply knn classifier either thourgh knn_clf or model_path") 
        
    # Load KNN model đã train (trained_knn_model.clf)
    if knn_clf is None:
        with open(model_path, 'rb') as f:
            knn_clf = pickle.load(f)

    # Load hình ảnh cần nhận dạng và tìm các vị trí có khuôn mặt  
    X_img = face_recognition.load_image_file(X_img_path)
    X_face_locations = face_recognition.face_locations(X_img)

    # Trả về 0 nếu không tìm ra các khuôn mặt 
    if len(X_face_locations) == 0:
        return []

    # Encoding cho các khuôn mặt của ảnh test
    faces_encodings = face_recognition.face_encodings(X_img, known_face_locations=X_face_locations)

    # Gọi hàm kneighbors để tìm kết quả phù match tốt từ model knn_clf cho các khuôn mặt cần nhận dạng.
    # Sau đó chọn ra các kết quả nằm trong ngưỡng closest_distances
    closest_distances = knn_clf.kneighbors(faces_encodings, n_neighbors=1)
    are_matches = [closest_distances[0][i][0] <= distance_threshold for i in range(len(X_face_locations))]

    # Kết quả sẽ trả về bounding box khuôn mặt và Label tương ứng. Những khuôn mặt không xác định sẽ được gán 'unknown'
    return [(pred, loc) if rec else ("unknown", loc) for pred, loc, rec in zip(knn_clf.predict(faces_encodings), X_face_locations, are_matches)] 

In [None]:
# Hàm hiển thị kết quả, vị trí khuôn mặt tìm được và label tên tương ứng
def show_prediction_labels_on_image(image_file, predictions):
    
    #Sử dụng thư viện Image và ImageDraw để vẽ label và box lên hình
    img_path = os.path.join("C:/Users/duyph/PYTHONSOURCECODE/FACERECOGNITIONMINI-CHALLENGE/images/test", image_file)
    pil_image = Image.open(img_path).convert("RGB")
    draw = ImageDraw.Draw(pil_image)
    # Vòng lặp: với mỗi tên label, tọa độ vị trí khuôn mặt lấy được từ hàm predict, ta vẽ bounding box quanh khuôn mặt lên hình
    for name, (top, right, bottom, left) in predictions:
        # vẽ bounding box cho khuôn mặt sử dụng Pillow module 
        draw.rectangle(((left, top), (right, bottom)), outline=(0, 0, 255))

         # Do có lỗi trong Pillow nên cần encode UTF-8
        name = name.encode("UTF-8")

        # Vẽ thêm Label bên dưới bounding box
        text_width, text_height = draw.textsize(name)
        draw.rectangle(((left, bottom - text_height - 10), (right, bottom)), fill=(0, 0, 255), outline=(0, 0, 255))
        draw.text((left + 6, bottom - text_height - 5), name, fill=(255, 255, 255, 255))
    # Xóa drawing library từ memory
    del draw

    # Hiển thị kết quả
    pil_image.show()

    # lưu vào thư mục result
    pil_image.save(os.path.join("C:/Users/duyph/PYTHONSOURCECODE/FACERECOGNITIONMINI-CHALLENGE/images/result", image_file))

In [None]:
# Thực thi các cài đặt, hiển thị thông báo kết quả
if __name__ == "__main__":
     
    # Bước 1: Train the KNN classifier và save vào thư mục project 
    print("Training KNN classifier...")
    classifier = train("C:/Users/duyph/PYTHONSOURCECODE/FACERECOGNITIONMINI-CHALLENGE/images/train", model_save_path="C:/Users/duyph/PYTHONSOURCECODE/FACERECOGNITIONMINI-CHALLENGE/trained_knn_model.clf", n_neighbors=2)
    print("Training complete!\n\n")

   # STEP 2: Sử dụng model đã train, chạy chuẩn đoán cho các hình ảnh test  
    for image_file in os.listdir("C:/Users/duyph/PYTHONSOURCECODE/FACERECOGNITIONMINI-CHALLENGE/images/test"):
        full_file_path = os.path.join("C:/Users/duyph/PYTHONSOURCECODE/FACERECOGNITIONMINI-CHALLENGE/images/test", image_file)

        print("Looking for faces in {}".format(image_file))
 
        # Tìm các khuôn mặt trong hình test 
        predictions = predict(full_file_path, model_path="C:/Users/duyph/PYTHONSOURCECODE/FACERECOGNITIONMINI-CHALLENGE/trained_knn_model.clf")

        # hiển thị thông báo ra console
        count = 0
         for name, (top, right, bottom, left) in predictions:
            print("Found {}".format(name))
            if name != "unknown":
                count += 1 
        print("Recognized {}/{} faces found".format(count, len(predictions)))
        print("")

         # Hiển thị thông tin trên ảnh test, kết quả ảnh đã test trong thư mục result
        show_prediction_labels_on_image(image_file, predictions)


 # 3. Đánh giá kết quả

**Kết quả chạy chương trình**

Training KNN classifier...

Training complete!

Looking for faces in IMG_5326.jpg

Found THAODNT

Found NHANTH

Found HANTQ

Found MINHHA

Found VULQ

Found QUANVM

Found VULQ

Found MINHHA

Found DUYETLV

Recognized 9/9 faces found

Looking for faces in IMG_5327.jpg

Found MINHHA

Found TAIHPT

Found VULQ

Found TIENBDT

Found MINHHA

Found HUNGNV

Found DUYNN

Found MYNH

Found QUANVM

Found MINHHA

Found TANTD

Found TRUONGTX

Found unknown

Found MINHHA

Found LOCTH

Found MINHHA

Found HANTQ

Found QUANVM

Recognized 17/18 faces found

Looking for faces in IMG_5328.jpg

Found MINHHA

Found TRUONGTX

Found DUYNN

Found TIENBDT

Found MINHHA

Found VULQ

Found THAODNT

Found QUANVM

Found TANTD

Found LOCTH

Found unknown

Recognized 10/11 faces found

Looking for faces in IMG_5329.jpg

Found MINHHA

Found VULQ

Found LOCTH

Found TIENBDT

Found VULQ

Found QUANVM

Found TULG

Recognized 7/7 faces found

Looking for faces in IMG_5330.jpg

Found VULQ

Found MINHHA

Found QUANVM

Found DUYETLV

Found unknown

Found VULQ

Found QUANVM

Found TULG

Recognized 7/8 faces found

Looking for faces in IMG_5331.jpg

Found TIENBDT

Found DUYETLV

Found VUND

Found MINHHA

Found DUYNN

Found VULQ

Found VULQ

Recognized 7/7 faces found

Looking for faces in IMG_5332.jpg

Found VULQ

Found VUND

Found MINHHA

Found VULQ

Found TULG

Recognized 5/5 faces found

**Đánh giá kết quả**
Mẫu test: IMG_5326.jpg
>- Nhận dạng được: 9/9 faces
- Nhận dạng chính xác: 6 faces

Mẫu test: IMG_5327.jpg
>- Nhận dạng được: 17/18 faces
- Nhận dạng chính xác: 9 faces 

Mẫu test: IMG_5328.jpg
>- Nhận dạng được: 10/11 faces
- Nhận dạng chính xác: 5 faces 

Mẫu test: IMG_5329.jpg
>- Nhận dạng được: 7/7 faces
- Nhận dạng chính xác: 5 faces 

Mẫu test: IMG_5330.jpg
>- Nhận dạng được: 7/8 faces
- Nhận dạng chính xác: 4 faces 

Mẫu test: IMG_5331.jpg
>- Nhận dạng được: 7/7 faces
- Nhận dạng chính xác: 2 faces 

Mẫu test: IMG_5332.jpg
>- Nhận dạng được: 5/5 faces
- Nhận dạng chính xác: 4 faces 


# 4. Kết luận
Kết quả nhận diện vẫn còn sai sót và chưa hiệu quả, một số nguyên nhân:
- Tập huấn luyện chưa chuẩn, đầy đủ
- Hình ảnh test chưa chuẩn: do thiếu ánh sáng, góc chụp, độ phân giải
- Kết quả đầu ra chưa gán nhãn được hết các khuôn mặt có trong hình  
- Thuật toán chưa được tối ưu
 