In [1]:
!pip install opencv-python
!pip install mediapipe --user
!pip show mediapipe
!pip install matplotlib

Name: mediapipe
Version: 0.9.0.1
Summary: MediaPipe is the simplest way for researchers and developers to build world-class ML solutions and applications for mobile, edge, cloud and the web.
Home-page: https://github.com/google/mediapipe
Author: The MediaPipe Authors
Author-email: mediapipe@google.com
License: Apache 2.0
Location: c:\users\raque\appdata\roaming\python\python37\site-packages
Requires: absl-py, attrs, flatbuffers, matplotlib, numpy, opencv-contrib-python, protobuf
Required-by: 


In [2]:
import cv2
import mediapipe as mp
import numpy as np
from IPython.display import Image

La función calculate_angle(a, b, c) calcula el ángulo formado por tres puntos en un plano 2D.

Los parámetros a, b y c son las coordenadas de los tres puntos en forma de listas o arrays NumPy.

La función realiza los siguientes pasos para calcular el ángulo:

Convierte las coordenadas a, b y c en arrays NumPy para facilitar los cálculos.

Calcula el ángulo en radianes utilizando la función np.arctan2() para encontrar la diferencia de ángulo entre el vector bc y el vector ba.

Convierte el ángulo de radianes a grados multiplicando por 180.0/np.pi.

Verifica si el ángulo calculado es mayor a 180 grados. En caso afirmativo, resta el ángulo de 360 grados para obtener el ángulo complementario.

Devuelve el ángulo calculado.

En resumen, esta función te permite calcular el ángulo formado por tres puntos en un plano 2D, teniendo en cuenta la dirección y sentido de los vectores formados por los puntos.

In [3]:
def calculate_angle(a,b,c):
    a = np.array(a)
    b = np.array(b)
    b = np.array(c)
    
    radians = np.arctan2(c[1]-b[1], c[0]-b[0]) - np.arctan2(a[1]-b[1], a[0]-b[0])
    angle = np.abs(radians*180.0/np.pi)
    
    if angle > 180.0:
        angle = 360-angle
    return angle    

mp_drawing y mp_pose son alias o variables que se utilizan para acceder a las funcionalidades y utilidades proporcionadas por los módulos mp.solutions.drawing_utils y mp.solutions.pose de la biblioteca Mediapipe.

mp_drawing es una variable que proporciona utilidades para dibujar en imágenes utilizando Mediapipe. Se utiliza para dibujar landmarks (puntos de referencia) y conexiones entre ellos en una imagen.

mp_pose es una variable que proporciona la funcionalidad para realizar detección de poses utilizando Mediapipe. Se utiliza para procesar imágenes y detectar poses humanas, extrayendo información como las coordenadas de los landmarks corporales.

Al asignar mp.solutions.drawing_utils a mp_drawing y mp.solutions.pose a mp_pose, se hace más fácil y conciso acceder a las funcionalidades de dibujo y detección de poses proporcionadas por Mediapipe en el código.

In [4]:
mp_drawing = mp.solutions.drawing_utils
mp_pose = mp.solutions.pose

Este código utiliza OpenCV para capturar video de una fuente de video (generalmente la cámara web) y mostrarlo en una ventana llamada 'Mediapipe Feed'. El bucle while se ejecuta mientras la captura de video esté abierta (cap.isOpened()).

Dentro del bucle, se utiliza cap.read() para leer un fotograma de la fuente de video. La función cap.read() devuelve dos valores: ret, que indica si la lectura del fotograma fue exitosa, y frame, que contiene el fotograma capturado.

Después de leer el fotograma, se muestra utilizando cv2.imshow(). Esto abre una ventana con el título 'Mediapipe Feed' y muestra el contenido del fotograma en ella.

La función cv2.waitKey(10) espera 10 milisegundos y verifica si se ha presionado la tecla 'r' mediante la expresión & 0xFF == ord('r'). Si se presiona la tecla 'r', se rompe el bucle y se sale del programa.

Al finalizar el bucle, se libera la captura de video utilizando cap.release() y se cierran todas las ventanas abiertas mediante cv2.destroyAllWindows().

In [5]:
cap = cv2.VideoCapture(0)
while cap.isOpened():
    ret, frame = cap.read()
    cv2.imshow('Mediapipe Feed', frame)
    
    if cv2.waitKey(10) & 0xFF == ord('r'):
        break
        
cap.release()
cv2.destroyAllWindows

<function destroyAllWindows>

import cv2
from IPython.display import display, Image

cap = cv2.VideoCapture(0)
while cap.isOpened():
    ret, frame = cap.read()

    # Mostrar la imagen utilizando IPython.display.display
    _, img_encoded = cv2.imencode('.jpg', frame)
    display(Image(data=img_encoded))
    
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
        
cap.release()
cv2.destroyAllWindows()

Se utiliza Mediapipe y OpenCV para capturar video de una fuente de video (por ejemplo, la cámara web), procesar los fotogramas utilizando la detección de poses de Mediapipe y mostrar los resultados en una ventana.

Aquí se muestra una mejora con respecto al código anterior:

Se crea una instancia de mp_pose.Pose con los parámetros min_detection_confidence y min_tracking_confidence. Estos parámetros controlan la confianza mínima requerida para detectar y seguir las poses.

Dentro del bucle while, se lee un fotograma de la fuente de video y se convierte a formato RGB utilizando cv2.cvtColor().

Se establece la bandera writeable del objeto image en False para mejorar el rendimiento.

Se procesa el fotograma utilizando pose.process(image) para obtener los resultados de la detección de poses.

Se vuelve a establecer la bandera writeable en True para permitir la escritura en la imagen.

Se convierte la imagen de vuelta a formato BGR utilizando cv2.cvtColor().

Se utiliza mp_drawing.draw_landmarks() para dibujar los landmarks (puntos de referencia) y las conexiones en la imagen procesada.

Finalmente, se muestra la imagen en una ventana llamada 'Mediapipe Feed' utilizando cv2.imshow().

El bucle se repite hasta que se presione la tecla 'r', momento en el que se libera la captura de video y se cierran todas las ventanas.

Se muestra en tiempo real los resultados de la detección de poses en el video capturado, resaltando los landmarks y las conexiones entre ellos.

In [6]:
cap = cv2.VideoCapture(0)
pose = mp_pose.Pose(min_detection_confidence=0.5, min_tracking_confidence=0.5)
while cap.isOpened():
        ret, frame = cap.read()
    
        image = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
        image.flags.writeable = False
        results = pose.process(image)
        image.flags.writeable = True
        image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR)
        
        mp_drawing.draw_landmarks(image, results.pose_landmarks, mp_pose.POSE_CONNECTIONS,
                                 mp_drawing.DrawingSpec(color=(255,0,51), thickness=3, circle_radius=4),
                                 mp_drawing.DrawingSpec(color=(102,255,204), thickness=3, circle_radius=4)
                                 )
    
        
    
    
        cv2.imshow('Mediapipe Feed', image)

        if cv2.waitKey(10) & 0xFF == ord('r'):
            break

cap.release()
cv2.destroyAllWindows

<function destroyAllWindows>

In [8]:
mp_drawing.draw_landmarks??

results.pose_landmarks es una variable que contiene la información de los landmarks (puntos de referencia) detectados en la pose del cuerpo humano. Estos landmarks representan puntos clave en el cuerpo, como las articulaciones y las partes principales del cuerpo, como la cabeza, los hombros, los codos, las muñecas, las caderas, las rodillas y los tobillos.

El atributo pose_landmarks de results proporciona acceso a la lista de landmarks detectados. Cada landmark tiene las siguientes propiedades:

landmark.x: La coordenada X normalizada del landmark en el rango de [0.0, 1.0].
landmark.y: La coordenada Y normalizada del landmark en el rango de [0.0, 1.0].
landmark.z: La coordenada Z normalizada del landmark en el rango de [0.0, 1.0]. No siempre está disponible y puede ser NaN en algunos casos.
    landmark.visibility: La visibilidad del landmark, que indica qué tan visible está el landmark en la imagen, en el rango de [0.0, 1.0].

Se puede acceder a los landmarks individuales utilizando el índice de la lista. Por ejemplo, results.pose_landmarks.landmark[0] representa el primer landmark en la lista.

Estos landmarks son utilizados para realizar análisis y seguimiento de poses humanas en tiempo real utilizando Mediapipe.

In [7]:
results.pose_landmarks

landmark {
  x: 0.5168871879577637
  y: 0.38395291566848755
  z: -0.8905149698257446
  visibility: 0.9997060298919678
}
landmark {
  x: 0.549595296382904
  y: 0.31574052572250366
  z: -0.8704546689987183
  visibility: 0.9992647767066956
}
landmark {
  x: 0.5686877965927124
  y: 0.3145505487918854
  z: -0.8702437281608582
  visibility: 0.9992325901985168
}
landmark {
  x: 0.5850378274917603
  y: 0.3141530454158783
  z: -0.8706000447273254
  visibility: 0.9991756081581116
}
landmark {
  x: 0.4901958107948303
  y: 0.3172246515750885
  z: -0.8660755157470703
  visibility: 0.9993460178375244
}
landmark {
  x: 0.4725281596183777
  y: 0.31748291850090027
  z: -0.8657220602035522
  visibility: 0.9993852376937866
}
landmark {
  x: 0.4594532549381256
  y: 0.31813639402389526
  z: -0.8661054372787476
  visibility: 0.9994263648986816
}
landmark {
  x: 0.6130703687667847
  y: 0.3324238359928131
  z: -0.5574836134910583
  visibility: 0.9992164373397827
}
landmark {
  x: 0.44398218393325806
  y: 0.33

mp_pose.POSE_CONNECTIONS es una lista que define las conexiones entre los landmarks en una pose humana detectada por Mediapipe. Cada elemento de la lista es una tupla que especifica un par de índices de landmarks que están conectados.

Las conexiones se definen en términos de los índices de landmarks. Cada landmark en la pose tiene un índice único que corresponde a su posición en la lista de landmarks. Estos índices son utilizados para establecer las conexiones entre los landmarks.

Por ejemplo, la tupla (0, 1) representa una conexión entre el primer y el segundo landmark en la lista de landmarks. Esto puede indicar una conexión entre la cabeza y el cuello. Del mismo modo, (1, 2) podría representar una conexión entre el cuello y el hombro derecho.

La lista mp_pose.POSE_CONNECTIONS se utiliza en conjunto con la función mp_drawing.draw_landmarks() para dibujar las conexiones entre los landmarks en una imagen o un fotograma. Al pasar esta lista como argumento a la función, Mediapipe dibujará las líneas que representan las conexiones entre los landmarks correspondientes.

Las conexiones entre landmarks son útiles para visualizar y analizar las poses humanas detectadas, proporcionando una representación gráfica de la estructura y las relaciones espaciales entre las partes del cuerpo.

In [8]:
mp_pose.POSE_CONNECTIONS

frozenset({(0, 1),
           (0, 4),
           (1, 2),
           (2, 3),
           (3, 7),
           (4, 5),
           (5, 6),
           (6, 8),
           (9, 10),
           (11, 12),
           (11, 13),
           (11, 23),
           (12, 14),
           (12, 24),
           (13, 15),
           (14, 16),
           (15, 17),
           (15, 19),
           (15, 21),
           (16, 18),
           (16, 20),
           (16, 22),
           (17, 19),
           (18, 20),
           (23, 24),
           (23, 25),
           (24, 26),
           (25, 27),
           (26, 28),
           (27, 29),
           (27, 31),
           (28, 30),
           (28, 32),
           (29, 31),
           (30, 32)})

In [11]:
mp_drawing.DrawingSpec??

In [9]:
Image(url='https://developers.google.com/static/mediapipe/images/solutions/pose_landmarks_index.png', width=300)

Se crea una instancia de cv2.VideoCapture para capturar el video de la cámara. Luego, se crea una instancia de mp.solutions.pose.Pose para detectar poses humanas en cada fotograma.

Dentro del bucle while, se lee cada fotograma del video mediante cap.read(). Se realiza el procesamiento de la pose en el fotograma utilizando pose.process(image), donde image es la imagen en formato RGB. Luego, se dibujan los landmarks y las conexiones de la pose utilizando mp_drawing.draw_landmarks(). Los landmarks se obtienen de results.pose_landmarks.landmark, y se imprime la lista de landmarks en cada iteración.

Finalmente, se muestra el fotograma procesado en una ventana con cv2.imshow(). El bucle se ejecuta hasta que se presione la tecla 'r' para salir.

In [10]:
cap = cv2.VideoCapture(0)
pose = mp_pose.Pose(min_detection_confidence=0.5, min_tracking_confidence=0.5)
while cap.isOpened():
        ret, frame = cap.read()
    
        image = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
        image.flags.writeable = False
        results = pose.process(image)
        
        image.flags.writeable = True
        image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR)
        
        try:
            landmarks = results.pose_landmarks.landmark
            print(landmarks)
        except:
            pass
        
        mp_drawing.draw_landmarks(image, results.pose_landmarks, mp_pose.POSE_CONNECTIONS,
                                 mp_drawing.DrawingSpec(color=(255,0,51), thickness=3, circle_radius=4),
                                 mp_drawing.DrawingSpec(color=(102,255,204), thickness=3, circle_radius=4)
                                 )
    
        
    
    
        cv2.imshow('Mediapipe Feed', image)

        if cv2.waitKey(10) & 0xFF == ord('r'):
            break

cap.release()
cv2.destroyAllWindows 

[x: 0.5004196763038635
y: 0.3930600881576538
z: -0.9245368242263794
visibility: 0.9998165965080261
, x: 0.5395925045013428
y: 0.32229727506637573
z: -0.9083296060562134
visibility: 0.9995535016059875
, x: 0.5586948394775391
y: 0.321739137172699
z: -0.9079967737197876
visibility: 0.9994624257087708
, x: 0.5750577449798584
y: 0.3226788640022278
z: -0.9083071947097778
visibility: 0.9995204210281372
, x: 0.47838157415390015
y: 0.32363319396972656
z: -0.8974412679672241
visibility: 0.9995433688163757
, x: 0.4603935182094574
y: 0.3230637311935425
z: -0.8971745371818542
visibility: 0.9994619488716125
, x: 0.44660240411758423
y: 0.3225032687187195
z: -0.8974340558052063
visibility: 0.9995354413986206
, x: 0.6121348142623901
y: 0.3450910449028015
z: -0.6566770672798157
visibility: 0.9994971752166748
, x: 0.43994608521461487
y: 0.3408862352371216
z: -0.5907360911369324
visibility: 0.9995983242988586
, x: 0.5363321900367737
y: 0.4557756185531616
z: -0.8211290240287781
visibility: 0.99984371662139

<function destroyAllWindows>

len(landmarks) devuelve el número de landmarks detectados en una pose humana. Los landmarks son puntos clave que representan las diferentes partes del cuerpo, como las articulaciones, los extremos de los miembros, la cabeza, etc.

En el contexto del código proporcionado, landmarks es una variable que almacena los landmarks extraídos de la detección de pose en cada fotograma. Al llamar a len(landmarks), se obtiene la cantidad de landmarks detectados en ese fotograma específico.

La longitud de landmarks puede variar dependiendo de la calidad de la detección y del posicionamiento del cuerpo en el cuadro de la cámara. En general, se espera que el número de landmarks sea consistente para una pose humana estándar y completa, pero puede ser menor si algunas partes del cuerpo no están claramente visibles o están ocultas.

In [11]:
len(landmarks)

33

La variable mp_pose.PoseLandmark es un enumerador que contiene los nombres de los landmarks disponibles en el modelo de pose de Mediapipe. Al recorrer el enumerador utilizando un bucle for, se obtendrán los nombres de los landmarks uno por uno y se imprimirán en la consola.

In [12]:
for lk in mp_pose.PoseLandmark:
    print(lk)

PoseLandmark.NOSE
PoseLandmark.LEFT_EYE_INNER
PoseLandmark.LEFT_EYE
PoseLandmark.LEFT_EYE_OUTER
PoseLandmark.RIGHT_EYE_INNER
PoseLandmark.RIGHT_EYE
PoseLandmark.RIGHT_EYE_OUTER
PoseLandmark.LEFT_EAR
PoseLandmark.RIGHT_EAR
PoseLandmark.MOUTH_LEFT
PoseLandmark.MOUTH_RIGHT
PoseLandmark.LEFT_SHOULDER
PoseLandmark.RIGHT_SHOULDER
PoseLandmark.LEFT_ELBOW
PoseLandmark.RIGHT_ELBOW
PoseLandmark.LEFT_WRIST
PoseLandmark.RIGHT_WRIST
PoseLandmark.LEFT_PINKY
PoseLandmark.RIGHT_PINKY
PoseLandmark.LEFT_INDEX
PoseLandmark.RIGHT_INDEX
PoseLandmark.LEFT_THUMB
PoseLandmark.RIGHT_THUMB
PoseLandmark.LEFT_HIP
PoseLandmark.RIGHT_HIP
PoseLandmark.LEFT_KNEE
PoseLandmark.RIGHT_KNEE
PoseLandmark.LEFT_ANKLE
PoseLandmark.RIGHT_ANKLE
PoseLandmark.LEFT_HEEL
PoseLandmark.RIGHT_HEEL
PoseLandmark.LEFT_FOOT_INDEX
PoseLandmark.RIGHT_FOOT_INDEX


El código landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value] accede al landmark correspondiente al hombro izquierdo en la lista landmarks.

mp_pose.PoseLandmark.LEFT_SHOULDER.value devuelve el valor numérico asociado al landmark del hombro izquierdo en el enumerador mp_pose.PoseLandmark. Este valor numérico representa la posición del landmark en la lista de landmarks.

Al utilizar landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value], se accede al elemento de la lista landmarks que corresponde al landmark del hombro izquierdo.

El resultado de esta expresión será el landmark específico del hombro izquierdo, que contendrá información sobre su posición en coordenadas (x, y, z) y su visibilidad.

In [13]:
landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value]

x: 0.7368322610855103
y: 0.6247309446334839
z: -0.2688068151473999
visibility: 0.9995037317276001

mp_pose.PoseLandmark.LEFT_SHOULDER es una constante que representa el landmark del hombro izquierdo en el modelo de pose de Mediapipe.

El objeto mp_pose.PoseLandmark es un enumerador que contiene los nombres de los landmarks disponibles en el modelo de pose. La constante LEFT_SHOULDER representa el landmark del hombro izquierdo.

Este valor se puede utilizar para acceder al landmark específico del hombro izquierdo en la lista de landmarks obtenidos del modelo de pose. Por ejemplo, puedes usar landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value] para acceder al landmark del hombro izquierdo en la lista landmarks.

In [14]:
mp_pose.PoseLandmark.LEFT_SHOULDER

<PoseLandmark.LEFT_SHOULDER: 11>

landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value] accede al landmark correspondiente a la muñeca izquierda en la lista landmarks.

mp_pose.PoseLandmark.LEFT_WRIST.value devuelve el valor numérico asociado al landmark de la muñeca izquierda en el enumerador mp_pose.PoseLandmark. Este valor numérico representa la posición del landmark en la lista de landmarks.

Al utilizar landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value], se accede al elemento de la lista landmarks que corresponde al landmark de la muñeca izquierda.

In [15]:
landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value]

x: 0.9779294729232788
y: 1.307942271232605
z: -0.35810351371765137
visibility: 0.1122780367732048

In [16]:
mp_pose.PoseLandmark.LEFT_WRIST

<PoseLandmark.LEFT_WRIST: 15>

Se asigna las coordenadas (x, y) del landmark del hombro izquierdo, codo izquierdo y muñeca izquierda a las variables shoulder, elbow y wrist, respectivamente.

In [17]:
shoulder = [landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].x,landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].y,]
elbow = [landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].x,landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].y,]
wrist = [landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value].x,landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value].y,]

In [18]:
shoulder, elbow, wrist

([0.7368322610855103, 0.6247309446334839],
 [0.8527897000312805, 0.9562177062034607],
 [0.9779294729232788, 1.307942271232605])

 Se calcula el ángulo formado por los puntos shoulder, elbow y wrist y almacenará el resultado en la variable angle. Luego, se imprimirá el valor del ángulo.

In [19]:
calculate_angle(shoulder, elbow, wrist)

109.43733542063842

In [20]:
hip = [landmarks[mp_pose.PoseLandmark.LEFT_HIP.value].x,landmarks[mp_pose.PoseLandmark.LEFT_HIP.value].y,]
shouldr = [landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].x,landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].y,]
elb = [landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].x,landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].y,]

In [21]:
hip, shouldr, elb

([0.647586464881897, 1.3816521167755127],
 [0.7368322610855103, 0.6247309446334839],
 [0.8527897000312805, 0.9562177062034607])

In [22]:
calculate_angle(hip, shouldr, elb)

115.74978536628778

tuple(np.multiply(elbow, [640, 480]).astype(int)) está escalando y convirtiendo las coordenadas del punto elbow a enteros y creando una tupla con los resultados.

In [23]:
tuple(np.multiply(elbow,[640, 480]).astype(int))

(545, 458)

Captura el video de la cámara y realiza el seguimiento de los puntos clave del cuerpo utilizando el modelo de pose de MediaPipe. Calcula el ángulo formado por los puntos del hombro, codo y muñeca del brazo izquierdo y lo muestra en la imagen del video.

Aquí está el flujo de trabajo del código:

Se crea un objeto cv2.VideoCapture para capturar el video desde la cámara.
Se configura el objeto mp_pose.Pose con las configuraciones de detección y seguimiento de MediaPipe.
En un bucle while, se lee cada fotograma del video capturado.
Se convierte el fotograma de BGR a RGB.
Se procesa la imagen con el modelo de pose de MediaPipe para obtener los puntos clave del cuerpo.
Se verifica si se detectaron los puntos clave del cuerpo en la imagen.
Si se detectaron los puntos clave, se obtienen las coordenadas del hombro, codo y muñeca izquierdos.
Se calcula el ángulo formado por estos puntos utilizando la función calculate_angle.
Se muestra el ángulo en la imagen utilizando la función cv2.putText.
Se dibujan los puntos clave del cuerpo y las conexiones en la imagen utilizando la función mp_drawing.draw_landmarks.
Se muestra la imagen del video en una ventana llamada "Mediapipe Feed".
Si se presiona la tecla "q", se sale del bucle while y se cierra el video y las ventanas.
Permite ver en tiempo real los puntos clave del cuerpo detectados y el ángulo formado por el hombro, codo y muñeca izquierdos en el video de la cámara.

In [24]:
cap = cv2.VideoCapture(0)
pose = mp_pose.Pose(min_detection_confidence=0.5, min_tracking_confidence=0.5)
while cap.isOpened():
        ret, frame = cap.read()
    
        image = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
        image.flags.writeable = False
        results = pose.process(image)
        
        image.flags.writeable = True
        image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR)
        
        try:
            landmarks = results.pose_landmarks.landmark
            shoulder = [landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].x,landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].y,]
            elbow = [landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].x,landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].y,]
            wrist = [landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value].x,landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value].y,]
            
            angle = calculate_angle(shoulder, elbow, wrist)
            
            cv2.putText(image, str(angle),
                       tuple(np.multiply(elbow, [640, 480]).astype(int)),
                       cv2.FONT_HERSHEY_SIMPLEX, 0.5, (102, 0, 255), 2, cv2.LINE_AA
                           )
            
            print(landmarks)
        except:
            pass
        
        mp_drawing.draw_landmarks(image, results.pose_landmarks, mp_pose.POSE_CONNECTIONS,
                                 mp_drawing.DrawingSpec(color=(255,0,51), thickness=3, circle_radius=4),
                                 mp_drawing.DrawingSpec(color=(102,255,204), thickness=3, circle_radius=4)
                                 )
    
        
    
    
        cv2.imshow('Mediapipe Feed', image)

        if cv2.waitKey(10) & 0xFF == ord('r'):
            break

cap.release()
cv2.destroyAllWindows  

[x: 0.36276179552078247
y: 0.4011080861091614
z: -0.8076490163803101
visibility: 0.9967206120491028
, x: 0.3933207392692566
y: 0.3353685140609741
z: -0.8616754412651062
visibility: 0.9909489750862122
, x: 0.4074874520301819
y: 0.33508050441741943
z: -0.8612757921218872
visibility: 0.9908562898635864
, x: 0.4243845045566559
y: 0.33374983072280884
z: -0.8614527583122253
visibility: 0.9925183057785034
, x: 0.3624762296676636
y: 0.3312985301017761
z: -0.7830091714859009
visibility: 0.9861935973167419
, x: 0.35531044006347656
y: 0.3286357522010803
z: -0.7828842401504517
visibility: 0.98326575756073
, x: 0.3489540219306946
y: 0.3259549140930176
z: -0.7832377552986145
visibility: 0.9857240319252014
, x: 0.5225260257720947
y: 0.3417603671550751
z: -0.8840080499649048
visibility: 0.993599534034729
, x: 0.4072549343109131
y: 0.3425159454345703
z: -0.5095298290252686
visibility: 0.9900603294372559
, x: 0.39919358491897583
y: 0.4542028307914734
z: -0.8002724647521973
visibility: 0.9983232617378235

<function destroyAllWindows>

Aqui se amplia el código anterior al agregar una funcionalidad para contar repeticiones de un ejercicio basado en el ángulo del brazo. Aquí está el flujo de trabajo adicional:

Se agrega una variable counter para mantener el recuento de las repeticiones.
Se agrega una variable stage para mantener el estado actual del movimiento (arriba o abajo).
Dentro del bucle while, después de calcular el ángulo, se verifica si el ángulo supera los 160 grados, lo que indica que el brazo está en la posición "abajo".
Si el ángulo es inferior a 30 grados y el stage es "abajo", se considera que se ha completado una repetición. Se incrementa el contador y se actualiza el stage a "arriba".
Se dibujan dos rectángulos en la imagen para mostrar el contador y el estado actual.
Se muestra el contador de repeticiones y el estado actual en la imagen utilizando la función cv2.putText.
Se muestra la imagen del video con los puntos clave y las conexiones en la ventana "Mediapipe Feed".

Aqui se puede contar las repeticiones de un ejercicio basado en el ángulo del brazo izquierdo y mostrar el contador y el estado actual en tiempo real en el video de la cámara.

In [34]:
cap = cv2.VideoCapture(0)

counter = 0
stage = None

pose = mp_pose.Pose(min_detection_confidence=0.5, min_tracking_confidence=0.5)
while cap.isOpened():
        ret, frame = cap.read()
    
        image = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
        image.flags.writeable = False
        results = pose.process(image)
        
        image.flags.writeable = True
        image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR)
        
        try:
            landmarks = results.pose_landmarks.landmark
            shoulder = [landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].x,landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].y,]
            elbow = [landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].x,landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].y,]
            wrist = [landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value].x,landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value].y,]
            
            angle = calculate_angle(shoulder, elbow, wrist)
            
            cv2.putText(image, str(angle),
                       tuple(np.multiply(elbow, [640, 480]).astype(int)),
                       cv2.FONT_HERSHEY_SIMPLEX, 0.5, (102, 0, 255), 2, cv2.LINE_AA
                           )
            
            if angle > 160:
                stage = "down"
            if angle < 30 and stage == 'down':
                stage="up"
                counter +=1
                print(counter)
            
        except:
            pass
        
        
        cv2.rectangle(image, (0,0), (225,73), (102,204,0), -1)
        
        cv2.putText(image, 'REPS', (15,12),
                   cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0,0,0), 1, cv2.LINE_AA)
        cv2.putText(image, str(counter),
                    (10,60),
                   cv2.FONT_HERSHEY_SIMPLEX, 2, (255,255,255), 2, cv2.LINE_AA)
        
        cv2.putText(image, 'STAGE', (65,12),
                   cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0,0,0), 1, cv2.LINE_AA)
        cv2.putText(image, stage,
                    (60,60),
                   cv2.FONT_HERSHEY_SIMPLEX, 2, (255,255,255), 2, cv2.LINE_AA)
        
        
        mp_drawing.draw_landmarks(image, results.pose_landmarks, mp_pose.POSE_CONNECTIONS,
                                 mp_drawing.DrawingSpec(color=(255,0,51), thickness=3, circle_radius=4),
                                 mp_drawing.DrawingSpec(color=(102,255,204), thickness=3, circle_radius=4)
                                 )
    
        
    
    
        cv2.imshow('Mediapipe Feed', image)

        if cv2.waitKey(10) & 0xFF == ord('r'):
            break

cap.release()  
cv2.destroyAllWindows

1
2
3
4


<function destroyAllWindows>