# 1 - Instalando dependências

In [None]:
# Instalando para usar
!pip install mediapipe opencv-python



In [5]:
# Puxando elas

import cv2
# Itens do mp normalmente são chamados de soluções - solutions
import mediapipe as mp
import numpy as np
# mp_drawing nos da as utilidades de desenho dos objetos
mp_drawing = mp.solutions.drawing_utils
# Aqui a gente defini o modelo que vamos usar do mediapipe, pois existem vários, e vamos usar o para pose
mp_pose = mp.solutions.pose

In [6]:
# Pegando a câmera

# Pegando o vídeo de alguma câmera conectada, a primeira - 0
cap = cv2.VideoCapture(0)

while cap.isOpened():
  # Ret é só o retorno, nada útil por agora
  # Frame é o frame mesmo, o que nos mostra
  ret, frame = cap.read()
  # Aqui o primeiro é o nome da caixa que temos o frame(vídeo), e o segundo o que mostramos
  cv2.imshow("Treinador de Academia Personalizado", frame)

  if cv2.waitKey(10) & 0xFF == ord('q'):
    break

cap.release()
cv2.destroyAllWindows()

# 2 - Fazendo Detecções

In [18]:
# Pegando o vídeo de alguma câmera conectada, a primeira - 0
cap = cv2.VideoCapture(0)

# Criando uma nova instância do pose do mediapipe definindo que o mínimo de confidência de detecção como 50%
with mp_pose.Pose(min_detection_confidence=0.5, min_tracking_confidence=0.5) as pose:
    while cap.isOpened():
        # Ret é só o retorno, nada útil por agora
        # Frame é o frame mesmo, o que nos mostra
        ret, frame = cap.read()

        # Mudando a cor da imagem, pois fica melhor para o mediapipe, mandando na ordem certa, e transformando em RGB
        image = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
        image.flags.writeable = False
        
        # Fazendo detecções
        results = pose.process(image)
        
        image.flags.writeable = True
        # Recolorindo para mostrar a imagem to BGR
        image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR)

        # Rederizando as detecções
        mp_drawing.draw_landmarks(image, results.pose_landmarks, mp_pose.POSE_CONNECTIONS, 
                                  # Mudando a cor dos pontos, primeiro dos pontos
                                  mp_drawing.DrawingSpec(color=(0, 0, 255), thickness=2, circle_radius=2), 
                                  # Aqui das conexões
                                  mp_drawing.DrawingSpec(color=(0, 255, 0), thickness=2, circle_radius=2),
                                  )

        # Aqui o primeiro é o nome da caixa que temos o frame(vídeo), e o segundo o que mostramos
        cv2.imshow("Treinador de Academia Personalizado", image)

        if cv2.waitKey(10) & 0xFF == ord('q'):
            break

cap.release()
cv2.destroyAllWindows()

# 3 - Determinando as juntas

Aqui recomendo ver a imagem das juntas que o mediapipe pega

In [21]:
# Pegando o vídeo de alguma câmera conectada, a primeira - 0
cap = cv2.VideoCapture(0)

# Criando uma nova instância do pose do mediapipe definindo que o mínimo de confidência de detecção como 50%
with mp_pose.Pose(min_detection_confidence=0.5, min_tracking_confidence=0.5) as pose:
    while cap.isOpened():
        # Ret é só o retorno, nada útil por agora
        # Frame é o frame mesmo, o que nos mostra
        ret, frame = cap.read()

        # Mudando a cor da imagem, pois fica melhor para o mediapipe, mandando na ordem certa, e transformando em RGB
        image = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
        image.flags.writeable = False
        
        # Fazendo detecções
        results = pose.process(image)
        
        image.flags.writeable = True
        # Recolorindo para mostrar a imagem to BGR
        image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR)

        # Extraindo os pontos das juntas
        # Nem sempre dá certo e elas são visíveis, então fazemos dentro de um try para não quebrar
        try: 
            landmarks = results.pose_landmarks.landmark
            print(landmarks)
        except: 
            print("Erro ao pegar as landmarks")
            pass

        # Rederizando as detecções
        mp_drawing.draw_landmarks(image, results.pose_landmarks, mp_pose.POSE_CONNECTIONS, 
                                  # Mudando a cor dos pontos, primeiro dos pontos
                                  mp_drawing.DrawingSpec(color=(0, 0, 255), thickness=2, circle_radius=2), 
                                  # Aqui das conexões
                                  mp_drawing.DrawingSpec(color=(0, 255, 0), thickness=2, circle_radius=2),
                                  )

        # Aqui o primeiro é o nome da caixa que temos o frame(vídeo), e o segundo o que mostramos
        cv2.imshow("Treinador de Academia Personalizado", image)

        if cv2.waitKey(10) & 0xFF == ord('q'):
            break

cap.release()
cv2.destroyAllWindows()

[x: 0.617433667
y: 0.936561048
z: -1.08004022
visibility: 0.998656392
, x: 0.640217423
y: 0.851156771
z: -0.994308293
visibility: 0.998916745
, x: 0.658520281
y: 0.842456
z: -0.994593441
visibility: 0.998960733
, x: 0.676103413
y: 0.834870458
z: -0.994535267
visibility: 0.998882711
, x: 0.567583442
y: 0.875797033
z: -0.980792165
visibility: 0.998595417
, x: 0.542054534
y: 0.880106091
z: -0.980232358
visibility: 0.998440564
, x: 0.51843679
y: 0.884750247
z: -0.980629444
visibility: 0.998191893
, x: 0.704874873
y: 0.852230668
z: -0.478305399
visibility: 0.99936384
, x: 0.496725649
y: 0.916868329
z: -0.40205127
visibility: 0.998420835
, x: 0.667226493
y: 0.994604647
z: -0.883894742
visibility: 0.996956944
, x: 0.581954658
y: 1.0139302
z: -0.863721728
visibility: 0.995660365
, x: 0.905179143
y: 1.19832933
z: -0.337757617
visibility: 0.867064655
, x: 0.426296234
y: 1.30049336
z: -0.195834488
visibility: 0.742388785
, x: 1.00656247
y: 1.41680634
z: -1.13675058
visibility: 0.152128354
, x: 0.

In [22]:
landmarks

[x: 0.595902324
y: 0.694602907
z: -1.78276157
visibility: 0.997527122
, x: 0.626607
y: 0.615112364
z: -1.7167387
visibility: 0.994838238
, x: 0.647354782
y: 0.614058375
z: -1.71718156
visibility: 0.995753
, x: 0.669082761
y: 0.614008069
z: -1.7175715
visibility: 0.993223667
, x: 0.560779929
y: 0.617138207
z: -1.73040223
visibility: 0.995989382
, x: 0.533899128
y: 0.616545618
z: -1.72998488
visibility: 0.997271121
, x: 0.512030244
y: 0.61661011
z: -1.73062
visibility: 0.996757209
, x: 0.699388325
y: 0.632228553
z: -1.16765404
visibility: 0.99527657
, x: 0.470006794
y: 0.639700472
z: -1.21026134
visibility: 0.998333633
, x: 0.630625188
y: 0.771074533
z: -1.55691993
visibility: 0.99729836
, x: 0.557054937
y: 0.77274996
z: -1.57280242
visibility: 0.998729289
, x: 0.860476851
y: 0.987434
z: -0.730697274
visibility: 0.964988708
, x: 0.302783936
y: 0.998272538
z: -0.741286278
visibility: 0.978556275
, x: 0.99654752
y: 1.38296831
z: -0.744610846
visibility: 0.126903474
, x: 0.23031804
y: 1.526

In [23]:
len(landmarks)

33

In [27]:
for landmarkExist in mp_pose.PoseLandmark:
    print(landmarkExist, landmarkExist.name)

0 NOSE
1 LEFT_EYE_INNER
2 LEFT_EYE
3 LEFT_EYE_OUTER
4 RIGHT_EYE_INNER
5 RIGHT_EYE
6 RIGHT_EYE_OUTER
7 LEFT_EAR
8 RIGHT_EAR
9 MOUTH_LEFT
10 MOUTH_RIGHT
11 LEFT_SHOULDER
12 RIGHT_SHOULDER
13 LEFT_ELBOW
14 RIGHT_ELBOW
15 LEFT_WRIST
16 RIGHT_WRIST
17 LEFT_PINKY
18 RIGHT_PINKY
19 LEFT_INDEX
20 RIGHT_INDEX
21 LEFT_THUMB
22 RIGHT_THUMB
23 LEFT_HIP
24 RIGHT_HIP
25 LEFT_KNEE
26 RIGHT_KNEE
27 LEFT_ANKLE
28 RIGHT_ANKLE
29 LEFT_HEEL
30 RIGHT_HEEL
31 LEFT_FOOT_INDEX
32 RIGHT_FOOT_INDEX


In [32]:
landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value]

x: 0.860476851
y: 0.987434
z: -0.730697274
visibility: 0.964988708

In [33]:
landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value]

x: 0.99654752
y: 1.38296831
z: -0.744610846
visibility: 0.126903474

In [34]:
landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value]

x: 0.927152455
y: 1.67000723
z: -1.19536674
visibility: 0.0973388255

In [35]:
mp_pose.PoseLandmark.LEFT_SHOULDER

<PoseLandmark.LEFT_SHOULDER: 11>

# 4 - Calculando ângulos

In [50]:
def calculate_angle(a, b, c):
    a = np.array(a) # Primeiro - Ombro
    b = np.array(b) # Do meio - Cotovelo
    c = np.array(c) # Último - Mão

    radians = np.arctan2(c[1]-b[1], c[0]-b[0]) - np.arctan2(a[1]-b[1], a[0]-b[0])
    angle = np.abs(radians*180.0/np.pi)

    # Definindo o ângulo como máximo de 180, porque o braço não vai além
    if angle > 180.0:
        angle = 360 - angle

    return angle

In [42]:
if landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].visibility < 0.9:
    print("Pouca visibilidade do ombro, impossível calcular" , landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].visibility)
else:
    print("Legal", landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].visibility)

Legal 0.9649887084960938


In [46]:
# Pegando os valores da posição do ombro
shoulder = [
            landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].x, 
            landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].y,
            ]

# Pegando os valores da posição do cotovelo
elbow = [
            landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].x, 
            landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].y,
            ]

# Pegando os valores da posição da mão
wrist = [
            landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value].x, 
            landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value].y,
            ]

In [47]:
print(shoulder)
print(elbow)
print(wrist)

[0.8604768514633179, 0.9874340295791626]
[0.996547520160675, 1.3829683065414429]
[0.9271524548530579, 1.6700072288513184]


In [54]:
# Calculando o ângulo do braço
calculate_angle(shoulder, elbow, wrist)

147.42474751774154

In [55]:
hipTest = [
            landmarks[mp_pose.PoseLandmark.LEFT_HIP.value].x, 
            landmarks[mp_pose.PoseLandmark.LEFT_HIP.value].y,
            ]

shoulderTest = [
            landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].x, 
            landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].y,
            ]

wristTest = [
            landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].x, 
            landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].y,
            ]

In [57]:
print(hipTest, shoulderTest, wristTest)

[0.7855013608932495, 1.8252276182174683] [0.8604768514633179, 0.9874340295791626] [0.996547520160675, 1.3829683065414429]


In [58]:
# Calculando a distância do corpo entre outros itens, apenas mostrando que da pra fazer
calculate_angle(hipTest, shoulderTest, wristTest)

24.097976129129922

In [66]:
# Pegando as coordenadas normalizada pelo tamanho da imagem, nesse caso, com uma webcam de 640x480
tuple(np.multiply(elbow, [640, 480]).astype(int))

(580, 649)

In [70]:
# Pegando o tamanho da webcam de forma dinâmica em pixels para passar pro np.multiply
largura = cap.get(cv2.CAP_PROP_FRAME_WIDTH)
altura = cap.get(cv2.CAP_PROP_FRAME_HEIGHT)

print(f"Resolução atual: {int(largura)}x{int(altura)}")

Resolução atual: 0x0


In [None]:
# Pegando as posições do ângulo no vídeo e colocando no frame

# Pegando o vídeo de alguma câmera conectada, a primeira - 0
cap = cv2.VideoCapture(0)

# Criando uma nova instância do pose do mediapipe definindo que o mínimo de confidência de detecção como 50%
with mp_pose.Pose(min_detection_confidence=0.5, min_tracking_confidence=0.5) as pose:
    while cap.isOpened():
        largura = cap.get(cv2.CAP_PROP_FRAME_WIDTH)
        altura = cap.get(cv2.CAP_PROP_FRAME_HEIGHT)

        print(f"Resolução atual: {int(largura)}x{int(altura)}")

        # Ret é só o retorno, nada útil por agora
        # Frame é o frame mesmo, o que nos mostra
        ret, frame = cap.read()

        # Mudando a cor da imagem, pois fica melhor para o mediapipe, mandando na ordem certa, e transformando em RGB
        image = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
        image.flags.writeable = False
        
        # Fazendo detecções
        results = pose.process(image)
        
        image.flags.writeable = True
        # Recolorindo para mostrar a imagem to BGR
        image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR)

        # Extraindo os pontos das juntas
        # Nem sempre dá certo e elas são visíveis, então fazemos dentro de um try para não quebrar
        try: 
            landmarks = results.pose_landmarks.landmark

            # Pegando as coordenadas
            # Poderiamos fazer como fizemos a cima com outros pontos para calcular
            shoulder = [ landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].x, 
                        landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].y,
                        ]
            elbow = [ landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].x, 
                        landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].y,
                        ]
            wrist = [ landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value].x, 
                        landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value].y,
                        ]
            
            # Calculando o ângulo
            angle = calculate_angle(shoulder, elbow, wrist)

            # Visualizando o ângulo
            cv2.putText(image, 
                str(angle), 
                tuple(np.multiply(elbow, [int(largura), int(altura)]).astype(int)), 
                # A partir daqui, apenas mexemos no texto
                cv2.FONT_HERSHEY_SIMPLEX, 
                0.5, 
                (255, 255, 255), 
                2, 
                cv2.LINE_AA,
                )
        except: 
            print("Erro ao pegar as landmarks")
            pass

        # Rederizando as detecções
        mp_drawing.draw_landmarks(image, results.pose_landmarks, mp_pose.POSE_CONNECTIONS, 
                                  # Mudando a cor dos pontos, primeiro dos pontos
                                  mp_drawing.DrawingSpec(color=(0, 0, 255), thickness=2, circle_radius=2), 
                                  # Aqui das conexões
                                  mp_drawing.DrawingSpec(color=(0, 255, 0), thickness=2, circle_radius=2),
                                  )

        # Aqui o primeiro é o nome da caixa que temos o frame(vídeo), e o segundo o que mostramos
        cv2.imshow("Treinador de Academia Personalizado", image)

        if cv2.waitKey(10) & 0xFF == ord('q'):
            break

cap.release()
cv2.destroyAllWindows()

Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480
Resolução atual: 640x480


# 4 - Criando o contador de curl

In [85]:
# Pegando as posições do ângulo no vídeo e colocando no frame

# Pegando o vídeo de alguma câmera conectada, a primeira - 0
cap = cv2.VideoCapture(0)

# Variáveis para o contador
counter = 0
stage = None

# Criando uma nova instância do pose do mediapipe definindo que o mínimo de confidência de detecção como 50%
with mp_pose.Pose(min_detection_confidence=0.5, min_tracking_confidence=0.5) as pose:
    while cap.isOpened():
        largura = cap.get(cv2.CAP_PROP_FRAME_WIDTH)
        altura = cap.get(cv2.CAP_PROP_FRAME_HEIGHT)

        # Ret é só o retorno, nada útil por agora
        # Frame é o frame mesmo, o que nos mostra
        ret, frame = cap.read()

        # Mudando a cor da imagem, pois fica melhor para o mediapipe, mandando na ordem certa, e transformando em RGB
        image = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
        image.flags.writeable = False
        
        # Fazendo detecções
        results = pose.process(image)
        
        image.flags.writeable = True
        # Recolorindo para mostrar a imagem to BGR
        image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR)

        # Extraindo os pontos das juntas
        # Nem sempre dá certo e elas são visíveis, então fazemos dentro de um try para não quebrar
        try: 
            landmarks = results.pose_landmarks.landmark

            # Pegando as coordenadas
            # Poderiamos fazer como fizemos a cima com outros pontos para calcular
            shoulder = [ landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].x, 
                        landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].y,
                        ]
            elbow = [ landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].x, 
                        landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].y,
                        ]
            wrist = [ landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value].x, 
                        landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value].y,
                        ]
            
            # Calculando o ângulo
            angle = calculate_angle(shoulder, elbow, wrist)

            # Visualizando o ângulo
            cv2.putText(image, 
                str(angle), 
                tuple(np.multiply(elbow, [int(largura), int(altura)]).astype(int)), 
                # A partir daqui, apenas mexemos no texto
                cv2.FONT_HERSHEY_SIMPLEX, 
                0.5, 
                (255, 255, 255), 
                2, 
                cv2.LINE_AA,
                )
            
            # Criando a lógica para o contador
            if angle > 160:
                stage = "down"
            if angle < 30 and stage == "down":
                stage = "up"
                counter += 1
                print(counter)
        except: 
            print("Erro ao pegar as landmarks")
            pass

        # Renderizando o contador
        # Criando uma caixa
        cv2.rectangle(image, 
                      (0, 0), 
                      (225, 73), 
                      (245, 117, 16), 
                      -1,
                      )

        # Colocando os dados
        cv2.putText(image, 
                    "Reps", 
                    (15, 12), 
                    cv2.FONT_HERSHEY_SIMPLEX, 
                    0.5, 
                    (0, 0, 0), 
                    1, 
                    cv2.LINE_AA,
                    )
        cv2.putText(image, 
                    str(counter), 
                    (10, 60), 
                    cv2.FONT_HERSHEY_SIMPLEX, 
                    2, 
                    (255, 255, 255), 
                    2, 
                    cv2.LINE_AA,
                    )
        
        # Colocando o estado
        cv2.putText(image, 
                    "Estado", 
                    (65, 12), 
                    cv2.FONT_HERSHEY_SIMPLEX, 
                    0.5, 
                    (0, 0, 0), 
                    1, 
                    cv2.LINE_AA,
                    )
        cv2.putText(image, 
                    stage, 
                    (60, 60), 
                    cv2.FONT_HERSHEY_SIMPLEX, 
                    2, 
                    (255, 255, 255), 
                    2, 
                    cv2.LINE_AA,
                    )

        # Rederizando as detecções
        mp_drawing.draw_landmarks(image, results.pose_landmarks, mp_pose.POSE_CONNECTIONS, 
                                  # Mudando a cor dos pontos, primeiro dos pontos
                                  mp_drawing.DrawingSpec(color=(0, 0, 255), thickness=2, circle_radius=2), 
                                  # Aqui das conexões
                                  mp_drawing.DrawingSpec(color=(0, 255, 0), thickness=2, circle_radius=2),
                                  )

        # Aqui o primeiro é o nome da caixa que temos o frame(vídeo), e o segundo o que mostramos
        cv2.imshow("Treinador de Academia Personalizado", image)

        if cv2.waitKey(10) & 0xFF == ord('q'):
            break

cap.release()
cv2.destroyAllWindows()

Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
1
2
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
3
4
5
6
7
8
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pegar as landmarks
Erro ao pega