### 딥러닝 얼굴인식

#### 딥러닝 얼굴인식 과정

1. 얼굴 검출(Face Detection)

먼저, 입력된 이미지에서 얼굴 영역을 찾아 추출합니다.

2. 얼굴 정렬(Face Alignment)

그리고 얼굴의 주요 랜드마크 포인트(눈, 코, 입, 얼굴 윤곽 등)를 추출합니다.

3. 얼굴 정규화(Face Normalization)

랜드마크 포인트를 기준으로 얼굴 영역을 회전시키고 얼굴 매칭이 가능한 상태로 변경합니다.

4. 얼굴 표현(Face Representation)

이후, 얼굴 영역을 임베딩 과정을 거쳐 N차원의 특징벡터로 표현합니다.

- 임베딩이란? 
고차원 데이터를 저체원 공간으로 변환(일정 크기의 벡터로 매핑)하는 것으로, 
인식에 필요한 정보만 남기는 과정

임베딩 과정을 거친 특정벡터는 사람마다 고유의 값을 가지므로, 이후에 서로 비교하는 방식으로 신원 확인이 가능합니다.

5. 얼굴 비교(Face Matching)

마지막 단계는 입력된 이미지 속 얼굴이 누구인지 판단하기 위해 특징 벡터 간의 유사도를 계싼하는 것으로, 
목적에 따라 두 종류로 구분할 수 있습니다.

- 얼굴 검증
두 이미지 속 얼굴이 같은 인물인지 검증(1:1 비교)

ex) 모바일 앱 로그인 및 간편 결제

- 얼굴 식별
이미지 속 얼굴이 누구인지 식별(1:N 비교)

ex) 인가된 직원의 건물 출입

### DeepFace의 주요 특징

얼굴 검출/표현/검증/식별/분석 기능을 Python 함수 및 API 형태로 제공

얼굴 검출 및 표현 단계에 다양한 딥러닝 SOTA 모델을 선택하여 조합 사용할 수 있음

- SOTA (State-of-the-art) 모델이란? : AI의 특정 분야에서 가장 높은 성능을 달성한 모델

검출 모델 : OpenCV, MTCNN, RetinaFace 등 총 6가지 모델 사용 가능

표현 모델 : Dlib, Facenet, ArcFace 등 총 9가지 모델 사용 가능

(실제 모델은 8가지이나, Facenet은 128, 512차원의 두 가지 버전 제공)

두 얼굴 특징벡터 간 유사도를 측정하기 위해 거리 기반 및 각도 기반의 메트릭(Metric) 사용 가능

#### 검출 모델

얼굴을 이미지에서 찾는 역할을 하는 모델

1. OPEN CV
- 방식 : Haar Cascade 기반
- 장점 : 빠름, CPU에서도 잘 돌아감
- 단점 : 정확도 낮음, 조명/각도에 취약
- 추천 상황 : 간단한 데모나 빠른 테스트용

2. SSD(Single Shot Detector)
- 백엔드 : TensorFlow
- 장점 : 속도와 정확도의 균형
- 단점 : RetinaFace나 MTCNN보다 덜 정확
- 추천 상황 : 실시간 얼굴 검출이 필요한 경우

3. Dlib
- 방식 : HOG + CNN 모델
- 장점 : 적당한 속도와 정확도
- 단점 : 조명이나 각도 변화에 민감할 수 있음
- 추천 상황 : 내장형 시스템이나 간단한 얼굴 인식

4. MTCNN (Multi-task Cascaded CNN)
- 특징 : 얼굴 검출 + 랜드마크 검출
- 장점 : 높은 정확도, 얼굴 각도와 크기에 잘 대응
- 단점 : 상대적으로 느릴 수 있음
- 추천 상황 : 고정된 이미지나 얼굴 크기가 작은 이미지

5. RetinaFace
- 특징: 가장 정교한 검출 모델 중 하나
- 장점: 정밀한 얼굴 경계 상자와 랜드마크 검출 가능
- 단점: GPU 없으면 느림
- 추천 상황: 정확도가 매우 중요한 프로젝트 (ex. 고해상도 이미지)

6. MediaPipe
- Google에서 만든 lightweight 모델
- 장점: 빠르고 리소스 적음, 얼굴 468개 랜드마크 검출
- 단점: 일부 특수 상황에서 정확도 떨어질 수 있음
- **추천 상황: 웹캠 기반 실시간 처리**




#### 표현 모델 (Face Recognition Models)

검출한 얼굴을 수치로 변환해 비교 및 인식하는 데 쓰이는 embedding 모델

1. VGG-Face
- 백엔드 : VGG-16 기반 CNN
- 벡터 차원 : 2622
- 장점 : DeepFace 기본값, 학습 데이터 풍부
- 단점 : 비교적 무겁고 느림
- 추천 상황 : 학습된 대형 얼굴 데이터셋 기반 인식

2. Facenet
- 특징 : Triplet loss를 이용한 학습
- 백터 차원 : 128
- 장점 : 높은 정확도, 대표적인 얼굴 인식 모델
- 추천 상황 : 대부분의 얼굴 인식 작업에 적합

3. Facenet512
- 특징 : Facenet의 확장 버전
- 벡터 차원 : 512
- 장점 : 더 높은 정밀도
- 단점: 속도와 메모리 비용 증가
- 추천 상황: 대규모 비교 작업

4. OpenFace
- 벡터 차원: 128
- 장점: 경량, 빠름
- 단점: 정확도는 약간 떨어짐
- 추천 상황: 리소스가 제한된 장치나 실시간 처리

5. DeepFace
- Facebook이 제안한 모델
- 벡터 차원: 4096
- 장점: 선구적인 모델
- 단점: 최신 모델 대비 정확도 떨어짐
- 추천 상황: 비교용 or 연구 목적으로 참고

6. Dlib
- 벡터 차원: 128
- 장점: 내장 모델, 빠르고 가볍다
- 단점: 조명이나 포즈 변화에 약함
- 추천 상황: 로컬에서 가볍게 돌릴 때

7. ArcFace
- 최신 모델 중 하나, 정확도 최고
- 벡터 차원: 512
- 장점: 얼굴 유사도 인식 정확도 최상
- 단점: 속도는 느릴 수 있음
- 추천 상황: 고정밀 인식 서비스

8. SFace
- Huawei에서 제안한 모델
- 장점: 고성능 + 고속성
- 추천 상황: 최신 리서치 기반 시스템에 적합

9. GhostFaceNet
- 경량화 모델
- 특징: 모바일 환경에 최적화
- 장점: 속도 빠름, 가볍고 실시간 가능
- 추천 상황: 모바일이나 IoT 장치



1. detector_backend (얼굴 검출기 선택)
- 역할: 이미지에서 얼굴을 찾는 데 사용하는 알고리즘

- 선택 가능 값: "opencv" (기본값), "ssd", "dlib", "mtcnn", "retinaface","mediapipe"



In [None]:
#예시 코드

DeepFace.analyze(img_path="img.jpg", detector_backend="retinaface")

2. model_name (얼굴 표현 모델 선택)
- 역할: 얼굴 임베딩 추출 (특징 벡터)
- 선택 가능 값: "VGG-Face" (기본값),"Facenet","Facenet512","OpenFace","DeepFace","Dlib","ArcFace","SFace", "GhostFaceNet"

In [None]:
# 예시코드

DeepFace.verify(img1_path, img2_path, model_name="ArcFace")


3. enforce_detection (얼굴이 없으면 오류 발생 여부)

역할: 얼굴이 검출되지 않을 때 예외 발생 여부

기본값: True

설정 예:

True: 얼굴이 없으면 오류 발생

False: 얼굴이 없어도 오류 없이 진행

In [None]:
DeepFace.analyze("img.jpg", enforce_detection=False)

4. align (얼굴 정렬 여부)

역할: 눈, 코, 입 위치를 기준으로 얼굴을 정렬할지 결정

기본값: True

설정 예:

True: 정렬 수행 (정확도 향상)

False: 원본 그대로 사용

In [None]:
DeepFace.verify(img1_path, img2_path, align=True)


5. target_size (이미지 리사이즈 크기)

역할: 모델 입력 사이즈에 맞게 이미지를 resize

자동 처리되지만 수동 조정도 가능

일반적으로 사용자가 직접 설정할 필요는 거의 없음

6. normalization (픽셀 정규화 방식)

일부 모델에서 내부적으로 사용

사용자 설정은 불가하지만 참고로:

base, raw, Facenet, VGGFace 등의 스케일링 방법 존재

actions (분석 항목 지정)

역할: 어떤 분석을 수행할지 지정

선택 가능 항목:

"emotion": 감정 분석

"age": 나이 추정

"gender": 성별 예측

"race": 인종 분류


In [None]:
from deepface import DeepFace

result = DeepFace.analyze(
    img_path="face.jpg",
    actions=["emotion", "age", "gender", "race"],
    detector_backend="retinaface",
    enforce_detection=True,
    align=True,
    model_name="ArcFace"
)
