- Google에서 개발한 실시간 컴퓨터 비전 라이브러리, 손/얼굴/몸 추적, 포즈 인식, 객체감지 등을 빠르게 수행
  - 경량모델로 모바일등에서도 사용가능
  - 딥러닝 기반 cpu에서도 실시간 동작 가능
  - google ai에서 최적화해서 제공하는 고성능 라이브러리

- MediaPipe 의 손 인식 원리
  - 손 감지(Palm Detectoin) - > YOLO 스타일의 경량 모델
  - 랜드마트 추출(Hand Landmark Detection) - > 손가락 관절 및 손목 위치 인식
  - 추적 및 안정화(Tracking & Smoothing) -> 이동 보정 및 좌표 보정

In [1]:
!pip install mediapipe opencv-python numpy

Collecting mediapipe
  Downloading mediapipe-0.10.20-cp311-cp311-manylinux_2_28_x86_64.whl.metadata (9.7 kB)
Collecting sounddevice>=0.4.4 (from mediapipe)
  Downloading sounddevice-0.5.1-py3-none-any.whl.metadata (1.4 kB)
Downloading mediapipe-0.10.20-cp311-cp311-manylinux_2_28_x86_64.whl (35.6 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m35.6/35.6 MB[0m [31m15.5 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading sounddevice-0.5.1-py3-none-any.whl (32 kB)
Installing collected packages: sounddevice, mediapipe
Successfully installed mediapipe-0.10.20 sounddevice-0.5.1


In [11]:
video_path = '/content/hand_sample2.mp4'

In [3]:
import cv2
import mediapipe as mp

In [12]:
# mediapipe 모델  초기화
mp_hands =  mp.solutions.hands
mp_drawing = mp.solutions.drawing_utils
hands = mp_hands.Hands(static_image_mode=False, max_num_hands=2, min_detection_confidence=0.5)

In [13]:
# 비디오 로드
cap = cv2.VideoCapture(video_path)

In [14]:
# 비디오 저장 설정
frame_width = int(cap.get(3))
frame_height = int(cap.get(4))
fps = int(cap.get(cv2.CAP_PROP_FPS))

fourcc = cv2.VideoWriter_fourcc(*'mp4v')
output_path = 'output_hand_tracking2.mp4'
out = cv2.VideoWriter(output_path, fourcc, fps, (frame_width, frame_height))

In [15]:
while cap.isOpened():
  ret, frame = cap.read()
  if not ret:  # 비디오 종료
    break
  # BGR->RGB(MediaPipe는 RGB 입력을 사용)
  rgb_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
  # 손검출 수행
  results = hands.process(rgb_frame)
  # 감지된 손이 있으면
  if results.multi_hand_landmarks:
    for hand_landmarks in results.multi_hand_landmarks:
      # 손가락 관절 그리기
      mp_drawing.draw_landmarks(frame, hand_landmarks, mp_hands.HAND_CONNECTIONS)
  # 결과 저장
  out.write(frame)

# 자원해제
cap.release()
out.release()
cv2.destroyAllWindows()