Usage example of MediaPipe Face Detection Solution API in Python (see also http://solutions.mediapipe.dev/face_detection).

## mediapipe 설치

In [1]:
!pip install mediapipe

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting mediapipe
  Downloading mediapipe-0.9.3.0-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (33.9 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m33.9/33.9 MB[0m [31m25.1 MB/s[0m eta [36m0:00:00[0m
Collecting sounddevice>=0.4.4
  Downloading sounddevice-0.4.6-py3-none-any.whl (31 kB)
Installing collected packages: sounddevice, mediapipe
Successfully installed mediapipe-0.9.3.0 sounddevice-0.4.6


## 이미지 업로드

- short range vs. full range
> - An integer index 0 or 1. (정수 인덱스 0 또는 1.)
> - Use 0 to select a **short-range model** that works best for faces within 2 meters from the camera, (카메라에서 2m 이내의 얼굴에 가장 적합한 단거리 모델을 선택하려면 0을 사용하고)
> - and 1 for a **full-range model** best for faces within 5 meters. (5m 이내의 얼굴에 가장 적합한 전체 범위 모델을 선택하려면 1을 사용합니다.)
> - For the **full-range option**, a sparse model is used for its improved inference speed. (전체 범위 옵션의 경우 향상된 추론 속도를 위해 희소 모델이 사용됩니다.)

- 참고: [Hugging Face](https://huggingface.co/spaces/kristyc/mediapipe-face-detection/blob/main/app.py)

In [2]:
# Upload images that contain face(s) within 2 meters from the camera.
from google.colab import files
uploaded_short_range = files.upload()

# Upload images that contain face(s) within 5 meters from the camera.
from google.colab import files
uploaded_full_range = files.upload()

Saving yes.png to yes.png


Saving yes.png to yes (1).png


## 이미지 사이즈 조절
- 동일한 이미지로 face detection 할 예정.
- Mediapipe의 Face tracking solution을 사용하였고, OpenCV를 사용하여 웹캠을 제어합니다.
> - 문장 참고: https://dynamikontrol.readthedocs.io/ko/latest/face_tracking_camera.html

In [3]:
import cv2
from google.colab.patches import cv2_imshow
import math
import numpy as np

DESIRED_HEIGHT = 480
DESIRED_WIDTH = 480
def resize_and_show(image):
  h, w = image.shape[:2]
  if h < w:
    img = cv2.resize(image, (DESIRED_WIDTH, math.floor(h/(w/DESIRED_WIDTH))))
  else:
    img = cv2.resize(image, (math.floor(w/(h/DESIRED_HEIGHT)), DESIRED_HEIGHT))
  cv2_imshow(img)

In [6]:
# Preview the images.
short_range_images = {name: cv2.imread(name) for name in uploaded_short_range.keys()}
for name, image in short_range_images.items():
  print(name)   

yes.png


<img src="img/mediapipe_short-range.png" height=400 width=500>


In [8]:
full_range_images = {name: cv2.imread(name) for name in uploaded_full_range.keys()}
for name, image in full_range_images.items():
  print(name)   

yes.png


<img src="img/mediapipe_full_range.png" height=400 width=500>

- 모든 MediaPipe Solutions Python API 예제는 mp.solutions 에 있다.
- MediaPipe Face Mesh 솔루션의 경우 `mp_face_detection = mp.solutions.face_detection` 으로 이 모듈에 액세스할 수 있다.
- 초기화 중에 `min_detection_confidence` 매개변수를 변경할 수 있다. 
> - 매개변수에 대한 자세한 정보를 얻으려면 help(mp_face_detection.FaceDetection)를 실행.

In [9]:
import mediapipe as mp
mp_face_detection = mp.solutions.face_detection

help(mp_face_detection.FaceDetection)

Help on class FaceDetection in module mediapipe.python.solutions.face_detection:

class FaceDetection(mediapipe.python.solution_base.SolutionBase)
 |  FaceDetection(min_detection_confidence=0.5, model_selection=0)
 |  
 |  MediaPipe Face Detection.
 |  
 |  MediaPipe Face Detection processes an RGB image and returns a list of the
 |  detected face location data.
 |  
 |  Please refer to
 |  https://solutions.mediapipe.dev/face_detection#python-solution-api
 |  for usage examples.
 |  
 |  Method resolution order:
 |      FaceDetection
 |      mediapipe.python.solution_base.SolutionBase
 |      builtins.object
 |  
 |  Methods defined here:
 |  
 |  __init__(self, min_detection_confidence=0.5, model_selection=0)
 |      Initializes a MediaPipe Face Detection object.
 |      
 |      Args:
 |        min_detection_confidence: Minimum confidence value ([0.0, 1.0]) for face
 |          detection to be considered successful. See details in
 |          https://solutions.mediapipe.dev/face_det

- MediaPipe 의 얼굴 인식은 엄청 빠른 얼굴 인식 솔루션입니다. 
> - 6개의 얼굴 랜드마크(오른쪽 눈, 왼쪽 눈, 코끝, 입 중심, 오른쪽 귀 윗가장자리 위의 점 및 왼쪽 귀 윗가장자리 위의 점)와 다중 얼굴 인식 기능을 지원합니다.
> - 이 모듈은 가볍고 성능이 뛰어난 얼굴 검출기인 BlazeFace 에 기반을 두었습니다.
> - 인식기의 초실시간 기능은 형상 추론(예: 얼굴 그물망)기능 같은 3D 얼굴 키포인트 추출, 얼굴의 특징 또는 표정 판별, 얼굴 부위 분할 같은 작업에 사용할 수 있습니다.
> - GPU 없이 CPU 만으로도 작업이 가능합니다. 
- model_selection (모델 선택)
> - 모델 인덱스는 0 또는 1
> - 0 을 사용하면 카메라 2m 이내의 부분적 모델 촬영에 적합하고,
> - 1은 5m 이내에서 전신 모델을 촬영하는 데 적합합니다.
> - 지정하지 않을 경우의 기본값은 0 입니다.
- min_detection_confidence (최소 감지 신뢰값)
> - 검출에 성공한 것으로 간주할 얼굴의 검출 모델의 신뢰값은 ([0.0, 1.0]) 입니다.
> - 기본값은 0.5 입니다. 

In [10]:
# Prepare DrawingSpec for drawing the face landmarks later.
# 점으로 6개의 얼굴 랜드마크 표시
mp_drawing = mp.solutions.drawing_utils 
drawing_spec = mp_drawing.DrawingSpec(thickness=1, circle_radius=1)

In [11]:
# Run MediaPipe Face Detection with short range model.
# min_detection_confidence(최소 감지 신뢰값): 기본값(0.5) => 0.2 => 0.8 => 1.2 로 조정.
with mp_face_detection.FaceDetection(
    min_detection_confidence=1.2, model_selection=0) as face_detection:
  for name, image in short_range_images.items():
    # Convert the BGR image to RGB and process it with MediaPipe Face Detection.
    results = face_detection.process(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))

    # Draw face detections of each face.
    print(f'Face detections of {name}:')
    if not results.detections:
      continue
    annotated_image = image.copy()
    for detection in results.detections:
      mp_drawing.draw_detection(annotated_image, detection)

Face detections of yes.png:


<img src="img/mediapipe_short_range-6-randmark.png" height=400 width=500>

In [12]:
# Run MediaPipe Face Detection with full range model.
# min_detection_confidence(최소 감지 신뢰값): 기본값(0.5) => 0.2 => 0.8 => 1.2로 조정.
with mp_face_detection.FaceDetection(
    min_detection_confidence=0.8, model_selection=1) as face_detection:
  for name, image in full_range_images.items():
    # Convert the BGR image to RGB and process it with MediaPipe Face Detection.
    results = face_detection.process(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))

    # Draw face detections of each face.
    print(f'Face detections of {name}:')
    if not results.detections:
      continue
    annotated_image = image.copy()
    for detection in results.detections:
      mp_drawing.draw_detection(annotated_image, detection)

Face detections of yes.png:


<img src="img/mediapipe_full_range-6-randmark.png" height=400 width=500>

## test 결과
- 마스크 쓴 사람의 경우 랜드마크를 감지하기 어렵기 때문에 얼굴을 잡기 힘들다는 것을 확인.
- model_selection (모델 선택, 0 또는 1)에 따라서 얼굴(6개의 랜드마크)을 탐지하는 결과에 차이가 나타타남.
- min_detection_confidence(얼굴 감지 모델의 최소 신뢰도 값, [0.0, 1.0])을 0.2, 0.5(기본값), 0.8, 1.2 등으로 조정했으나, 얼굴 탐지 결과가 동일하게 나옴.