# 1. Import packages

In [None]:
from tensorflow.keras.applications.mobilenet_v2 import preprocess_input
from tensorflow.keras.preprocessing.image import img_to_array
from tensorflow.keras.models import load_model
from imutils.video import VideoStream
import numpy as np
import argparse
import imutils
import time
import cv2
import os

# 2. Argument setting

In [None]:
ap = argparse.ArgumentParser()   #  --를 인식함.    외부 데이터 불러들이기

ap.add_argument("-f", -face"-", type=str,   #외부에서  --face, --model, 그리고 --confidence의 데이터를 받아옴.
    default="face_detector",
    help="path to face detector model directory")    #--face의 데이터는 face_detector에 추가합니다.
    
ap.add_argument("-m", "--model", type=str,
    default="mask_detector.model",
    help="path to trained face mask detector model")      #--model의 데이터는 mask_detector.model에 추가합니다.
    
ap.add_argument("-c", "--confidence", type=float, default=0.5,
    help="minimum probability to filter weak detections")    
    
args = vars(ap.parse_args())   #마지막으로 args에 각각의 데이터들을 업데이트해줍니다

# 3. detect_and_predict_mask 함수 정의

In [None]:
def detect_and_predict_mask(frame, faceNet, maskNet):
    (h, w) = frame.shape[:2]   #frame배열의 1,2번째 index값을 h(세로),w(가로)에 저장   #frame은 실시간 비디오의 화면
    blob = cv2.dnn.blobFromImage(frame, 1.0, (300, 300),(104.0, 177.0, 123.0))  #이미지 가공해서 blob에 저장

    faceNet.setInput(blob)  #blob에 저장된 가공한 이미지를 faceNet에 저장
    detections = faceNet.forward()  #순방향으로 딥러닝 네트워크를 실행해 detection에 저장

    faces = []  #얼굴을 모으는 리스트
    locs = []   #box의 좌표를 모으는 리스트
    preds = []  #마스크 예측한 것을 모으는 리스트
    
    for i in range(0, detections.shape[2]):  #200번 반복
        confidence = detections[0, 0, i, 2]  #얼굴을 인식하고 마스크를 착용했는지에 대한 추측 정확도를 confidence에 저장
                                              #detections는 실시간으로 찍히는 화면이 저장되는 것

        if confidence > args["confidence"]:   #기본값이 0.5로 설정. confidence가 크면 마스크를 잘 쓴 것.
            box = detections[0, 0, i, 3:7] * np.array([w, h, w, h])  #detection에서 얼굴크기를 이용해 box의 네 모퉁이를 box에 저장.
            (startX, startY, endX, endY) = box.astype("int")  #box의 두 모퉁이 값을 정수로 바꿔서 좌표로 지정

            (startX, startY) = (max(0, startX), max(0, startY))   #좌표가 음수가 안나오게 하기 위함.
            (endX, endY) = (min(w - 1, endX), min(h - 1, endY))   #box가 화면 밖으로 안나가게 하기 위함.

            face = frame[startY:endY, startX:endX]   #frame(배경+사람)에서 box크기 만클을 slicing 한 것을 face에 저장.
            face = cv2.cvtColor(face, cv2.COLOR_BGR2RGB)
            face = cv2.resize(face, (224, 224))   
            face = img_to_array(face)
            face = preprocess_input(face)

            faces.append(face)    #가공된 face가 faces에 추가됨.
            locs.append((startX, startY, endX, endY))   #locs에는 box의 좌표가 추가됨.

    if len(faces) > 0:   #저장된 얼굴의 개수가 1개 이상이면 얼굴 사진들을 넘파이 어레이로 만듦.
        faces = np.array(faces, dtype="float32")
        preds = maskNet.predict(faces, batch_size=32)   #예측한 것(마스크를 착용했을 확률과 착용하지 않았을 확률)  

    return  (locs,preds)  #box의 좌표들과 예측한 값을 return

# 4. face_detector폴더 내의 파일들을 불러와 faceNet에 저장

In [None]:
print("[INFO] loading face detector model...")

prototxtPath = os.path.sep.join([args["face"], "deploy.prototxt"])   #"deploy.prototxt"파일을 불러와서 prototxtPath에 저장 

weightsPath = os.path.sep.join([args["face"],"res10_300x300_ssd_iter_140000.caffemodel"])

faceNet = cv2.dnn.readNet(prototxtPath, weightsPath)  #dnn(딥러닝 네트워크)를 사용해 prototxtPath와 weightPath를 faceNet에 저장

# 5. mask_detector.model을 불러와 maskNet에 저장, 비디오 시작

In [None]:
print("[INFO] loading face mask detector model...")

maskNet = load_model(args["model"])      #mask_detector.model을 불러와서 model에 저장하고, 그 model을 maskNet이라는 변수에 저장.

print("[INFO] starting video stream...")

vs = VideoStream(src=0).start()     #video stream을 초기화하고, 카메라 센서를 warm up시킴.

time.sleep(2.0)

# 6. 실시간 video를 읽어오고, q키를 누르면 video stop

In [None]:
while True:

    frame = vs.read()  #실시간 화면이 frame
    frame = imutils.resize(frame, width=1100)  #frame크기 조정

    (locs, preds) = detect_and_predict_mask(frame, faceNet, maskNet)   #frame(화면)과 4,5번에서 얻은 faceNet,maskNet을 함수에 통과시킴.

    maskCount = 0     #추가한 부분(8번째 줄~39번째 줄)
    nonMaskCount = 0      #실시간으로 사람 수를 세기 위해 매번 초기화함.
    for (box, pred) in zip(locs, preds):    #box의 좌표들이 있는 locs변수와 예측한 것이 모여있는 pred변수에서 각각 하나씩 세트로 보냄. 
        (startX, startY, endX, endY) = box   #box의 2점의 좌표
        (mask, withoutMask) = pred   #마스크를 착용했을 확률, 착용하지 않았을 확률을 pred에 저장

        if mask > withoutMask:   #반복문에 들어온 사람이 마스크를 착용했을 확률이 더 높다면 
            maskCount += 1    
        else:   
            nonMaskCount += 1   #이렇게 매 순간 마스크를 착용한 사람과 착용하지 않을 사람의 수를 헤아린다.

        label = "Mask" if mask > withoutMask else "No Mask"  #마스크를 착용했을 확률이 높다면 label에 Mask, 아니면 No Mask
        color = (0, 255, 0) if label == "Mask" else (0, 0, 255)   #전자의 경우라면 초록색으로, 후자라면 빨간색으로 글자를 표시한다.
        label = "{}: {:.2f}%".format(label, max(mask, withoutMask) * 100) 
        label2 = "Good Job" if mask > withoutMask else "Warning[Wear Mask]"   #착용 여부에 대한 반응을 해줌.

       

        
        cv2.putText(frame, label, (startX, startY - 10)   #frame에 위의 label꾸며서 보이게 함.,                           
            cv2.FONT_HERSHEY_SIMPLEX, 0.45, color, 2)     
        cv2.putText(frame, label2, (startX, endY + 20),   #frame에 위의 label2를 꾸며서 출력
            cv2.FONT_HERSHEY_SIMPLEX, 0.8, color, 2)      
        cv2.rectangle(frame, (startX, startY), (endX, endY),color, 2)   #frame에 꾸민 box를 올림.

    color2 = (0, 255, 0) if nonMaskCount == 0 else (0, 0, 255)    #한 명이라도 마스크를 착용하지 않았으면 빨간색으로 color지정
    label3 = "{}/{}".format(maskCount, nonMaskCount + maskCount)     #몇 명 중, 몇 명이 마스크를 착용했는지에 대한 확률 계산
    cv2.putText(frame, label3, (100, 130),cv2.FONT_HERSHEY_SIMPLEX, 0.45, color2, 2)   #frame위에 color2색을 이용해 label3을 보여줌.

    label4 = "# of Wearing Masks/# of Detected"   
    cv2.putText(frame, label4, (100, 100), 
        cv2.FONT_HERSHEY_SIMPLEX, 0.45, (255, 0, 0), 2)   #frame위에 label4를 보여줌.
    
    cv2.imshow("Frame", frame)
    key = cv2.waitKey(1) & 0xFF   #사용자가 종료할 때 까지 기다림.

    if key == ord("q"):
        break   #사용자가 'q'키를 누르면 실시간 비디오 종료된. 
        
cv2.destroyAllWindows()

vs.stop()   