In [1]:
import cv2
import mediapipe as mp
import numpy as np
from sklearn.neighbors import KNeighborsClassifier # KNN 분류모델

In [2]:
# 10개의 제스터를 매핑해둔 데이터
gesture = {
    0:'fist', 1:'one', 2:'two', 3:'three', 4:'four', 5:'five',
    6:'six', 7:'rock', 8:'spiderman', 9:'yeah', 10:'ok'
}

# 가위바위보를 위한 제스처 
rsp_gesture = {
    0: 'rock',
    5: 'paper',
    9: 'scissors'
}

In [3]:
# 손을 찾아주는 모듈
mp_hands = mp.solutions.hands
# 특징점을 연결 및 관리해주는 모듈
mp_drawing = mp.solutions.drawing_utils

hands = mp_hands.Hands(max_num_hands =2,     # 찾는 손의 개수
               min_detection_confidence=0.5, # 정확하게 손을 찾아주는 역할     (0.5 => 신뢰도)
               min_tracking_confidence=0.5)  # 손의 위치(범위)를 찾아주는 역할 (0.5 => 신뢰도)

# knn 모델 활용하여 제스처 인식모델 학습
file = np.genfromtxt('./gesture_train.csv', delimiter= ',') #데이터

# 학습용 문제 데이터 나눠주기
X_train = file[:, :-1].astype(np.float32)
y_train = file[:, -1].astype(np.float32)

# 모델 생성
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train,y_train)

In [19]:
# 캠 켜기
cap = cv2.VideoCapture(0)

while cap.isOpened():
    res, img = cap.read()
    if not res:
        continue

    # 좌우반전
    img = cv2.flip(img,1)        
    # 색상채널 변경(손의 관절위치를 찾는 성능을 올리는데 도움이 된다)
    img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

    # 손 정보 추출해서 담아주기
    result = hands.process(img) 
    # 색상채널 원래대로 돌려주기
    img = cv2.cvtColor(img, cv2.COLOR_RGB2BGR)

    if result.multi_hand_landmarks is not None:
        # 가위바위보 정보를 담아줄 리스트
        rsp_result = []
        for res in result.multi_hand_landmarks:
            # 각 관절의 위치를 저장할 비어있는 배열 생성하기 (21, 3)
            joint = np.zeros((21,3))
            # 관절의 위치정보를 추출하기
            for j, lm in enumerate(res.landmark):
                joint[j] = [lm.x, lm.y, lm.z] # 관절의 위치를 numpy 배열에 저장
            
            # joint: 점의 위치값 > 통해서 관절값 구하
            # joint들로 관절값 구하기
            v1 = joint[[0,1,2,3,0,5,6,7,0,9,10,11,0,13,14,15,0,17,18,19],:] # Parent joint
            v2 = joint[[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20],:] # Child joint
            v = v2 - v1 # [20,3]
            # Normalize v 유클리디안 길이
            v = v / np.linalg.norm(v, axis=1)[:, np.newaxis]

            # 관절값으로 관절 각도 구하기
            angle = np.arccos(np.einsum('nt,nt->n',
                v[[0,1,2,4,5,6,8,9,10,12,13,14,16,17,18],:], 
                v[[1,2,3,5,6,7,9,10,11,13,14,15,17,18,19],:]))

            # radian > degree 각도 값으로 변경 해주는 작업이 필요
            angle = np.degrees(angle)

            # 모델에게 제스처 인식 시키기
            data = np.array([angle], dtype = np.float32)
            results = knn.predict(data)
            idx = int(results)
            
            # 제스쳐 인식되면 표시하기
            if idx in rsp_gesture.keys(): 
                org = (int(res.landmark[0].x * img.shape[1]), int(res.landmark[0].y * img.shape[0]))
                cv2.putText(img, text=rsp_gesture[idx].upper(), org=(org[0], org[1] + 20), fontFace=cv2.FONT_HERSHEY_SIMPLEX, fontScale=1, color=(255, 255, 255), thickness=2)

                rsp_result.append({ 
                    'rsp': rsp_gesture[idx],
                    'org': org
                })

            # 이미지에 각 관절끼리의 연결선 그어주기
            mp_drawing.draw_landmarks(img, res, mp_hands.HAND_CONNECTIONS)

            

            # 누가이겼는지 확인하는 코드
            if len(rsp_result) == 2:
                winner = None
                text = ''
                
                if rsp_result[0]['rsp'] == 'rock':
                    if rsp_result[1]['rsp'] == 'rock': 
                        text ='Tie'
                    elif rsp_result[1]['rsp'] == 'paper': 
                        text = 'Paper win!' ;
                        winner = 1
                    elif rsp_result[1]['rsp'] == 'scissors' : 
                        text = 'Rock win!';
                        winner = 0
                elif rsp_result[0]['rsp']  == 'paper':
                    if rsp_result[1]['rsp'] == 'rock' : 
                        text = 'Paper win!';
                        winner = 0
                    elif rsp_result[1]['rsp'] == 'paper' :
                        text = 'Tie'
                    elif rsp_result[1]['rsp'] == 'scissors' :
                        text = 'scissors win!';
                        winner = 1
                elif rsp_result[0]['rsp'] == 'scissors':
                    if rsp_result[1]['rsp'] == 'scissors':
                        text = 'Tie'
                    elif rsp_result[1]['rsp'] == 'rock' :
                        text = 'Rock win!';
                        winner = 1
                    elif rsp_result[1]['rsp'] == 'paper' :
                        text = 'Scissors win!';
                        winner = 0

                if winner is not None:
                    cv2.putText(img, text='Winner', org=(rsp_result[winner]['org'][0], rsp_result[winner]['org'][1] + 70), fontFace=cv2.FONT_HERSHEY_SIMPLEX, fontScale=2, color=(0, 255, 0), thickness=3)
                cv2.putText(img, text=text, org=(int(img.shape[1] / 3), 100), fontFace=cv2.FONT_HERSHEY_SIMPLEX, fontScale=2, color=(0, 0, 255), thickness=3)

    cv2.imshow('hand', img)
    if cv2.waitKey(1) == 49:
        cap.release()
        cv2.destroyAllWindows()
        break