In [1]:
!pip install mtcnn

Collecting mtcnn
  Downloading mtcnn-0.1.1-py3-none-any.whl (2.3 MB)
[K     |████████████████████████████████| 2.3 MB 6.6 MB/s 
Installing collected packages: mtcnn
Successfully installed mtcnn-0.1.1


In [2]:
cd /content/drive/MyDrive/컴퓨터비전

/content/drive/MyDrive/컴퓨터비전


# MTCNN 이미지 얼굴 인식

In [37]:
from mtcnn import MTCNN
import cv2
import numpy as np   
import os
from tensorflow.keras.preprocessing.image import img_to_array, ImageDataGenerator
from tensorflow.keras.models import load_model
from tqdm import tqdm

img = cv2.imread("./image/image.jpg", cv2.IMREAD_UNCHANGED)
model = load_model("./data/model/0.9011-0.6676.hdf5")
EMOTIONS = ["Angry" ,"Disgusting","Fearful", "Happy", "Sad", "Surpring", "Neutral"]
detector = MTCNN()
faces = detector.detect_faces(img)

for face in tqdm(faces):
    box = face.get("box")
    x, y, w, h = box

    img_ROI = img[y:y+h, x:x+w]   
    img_ROI = cv2.resize(img_ROI, (48, 48))  
    img_ROI = cv2.cvtColor(img_ROI, cv2.COLOR_BGR2GRAY)   
    img_ROI = img_ROI.astype('float') / 255.0  
    img_ROI = img_to_array(img_ROI)  
    img_ROI = np.expand_dims(img_ROI, axis=0)
    result = EMOTIONS[np.argmax(model.predict(img_ROI)[0])]
    
    cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2, 5)
    cv2.putText(img, result, (int(x), int(y-5)), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0,0,255), 2)

cv2.imwrite('./output/result_image.jpg', img)
cv2.waitKey()
cv2.destroyAllWindows()

100%|██████████| 8/8 [00:00<00:00, 17.28it/s]


# MTCNN 비디오 얼굴 인식

In [8]:
from mtcnn import MTCNN
import cv2
import numpy as np   
import os
from tensorflow.keras.preprocessing.image import img_to_array, ImageDataGenerator
from tensorflow.keras.models import load_model
import time

video_input_path = './video/test_video.mp4'
video_output_path = './output/result_video5.mp4'

cap = cv2.VideoCapture(video_input_path)
frame_cnt = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))    ## 프레임 갯수
print('총 Frame 갯수:', frame_cnt)

codec = cv2.VideoWriter_fourcc(*'XVID')
vid_size = (round(cap.get(cv2.CAP_PROP_FRAME_WIDTH)),round(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))) 
vid_fps = cap.get(cv2.CAP_PROP_FPS )
vid_writer = cv2.VideoWriter(video_output_path, codec, vid_fps, vid_size)     ## 비디오 저장

model = load_model("./data/model/0.9011-0.6676.hdf5", compile=False)
EMOTIONS = ["Angry" ,"Disgusting","Fearful", "Happy", "Sad", "Surpring", "Neutral"]
detector = MTCNN()
start= time.time()

cnt = 1
while True:
    ret, frame = cap.read()
    if not ret:
        print('더 이상 처리할 frame이 없습니다.')
        break
    frame_copy = frame.copy()
    frame_copy = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
    faces = detector.detect_faces(frame_copy)
    
    for face in faces:
        box = face.get("box")
        x, y, w, h = box
        
        img_ROI = frame[y:y+h, x:x+w]   
        img_ROI = cv2.resize(img_ROI, (48, 48))  
        img_ROI = cv2.cvtColor(img_ROI, cv2.COLOR_BGR2GRAY)   
        img_ROI = img_ROI.astype('float') / 255.0  
        img_ROI = img_to_array(img_ROI)  
        img_ROI = np.expand_dims(img_ROI, axis=0)
        result = EMOTIONS[np.argmax(model.predict(img_ROI)[0])]
        
        cv2.rectangle(frame, (x, y), (x+w, y+h), (0, 255, 0), 2, 5)
        cv2.putText(frame, result, (int(x), int(y-5)), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0,0,255), 2)
        
    print('{0} frame 수행 시간:'.format(cnt), round(time.time()-start, 2),'초')
    vid_writer.write(frame)
    cnt += 1

print('저장 완료 시간:', round(time.time()-start, 4),'초')
vid_writer.release()
cap.release()   

총 Frame 갯수: 256
1 frame 수행 시간: 1.27 초
2 frame 수행 시간: 1.89 초
3 frame 수행 시간: 2.52 초
4 frame 수행 시간: 3.17 초
5 frame 수행 시간: 3.79 초
6 frame 수행 시간: 4.48 초
7 frame 수행 시간: 5.14 초
8 frame 수행 시간: 5.8 초
9 frame 수행 시간: 6.49 초
10 frame 수행 시간: 7.19 초
11 frame 수행 시간: 7.87 초
12 frame 수행 시간: 8.57 초
13 frame 수행 시간: 9.28 초
14 frame 수행 시간: 9.97 초
15 frame 수행 시간: 10.65 초
16 frame 수행 시간: 11.33 초
17 frame 수행 시간: 11.99 초
18 frame 수행 시간: 12.66 초
19 frame 수행 시간: 13.37 초
20 frame 수행 시간: 14.07 초
21 frame 수행 시간: 14.76 초
22 frame 수행 시간: 15.45 초
23 frame 수행 시간: 16.16 초
24 frame 수행 시간: 16.85 초
25 frame 수행 시간: 17.52 초
26 frame 수행 시간: 18.42 초
27 frame 수행 시간: 19.1 초
28 frame 수행 시간: 19.79 초
29 frame 수행 시간: 20.49 초
30 frame 수행 시간: 21.19 초
31 frame 수행 시간: 21.92 초
32 frame 수행 시간: 22.6 초
33 frame 수행 시간: 23.29 초
34 frame 수행 시간: 24.01 초
35 frame 수행 시간: 24.7 초
36 frame 수행 시간: 25.42 초
37 frame 수행 시간: 26.12 초
38 frame 수행 시간: 26.8 초
39 frame 수행 시간: 27.51 초
40 frame 수행 시간: 28.2 초
41 frame 수행 시간: 28.89 초
42 frame 수행 시간: 29.59 초
43 fr