## 1. Dependencias

In [3]:
!pip install mediapipe
!pip install opencv-python



In [5]:
import mediapipe as mp
import cv2
import numpy as np
#from google.colab.patches import cv2_imshow
import uuid # Para generar ids unicos
import os 

## 2. Deteccion de Manos

In [6]:
# Permite renderizar las salidas de los puntos de la mano
mp_drawing = mp.solutions.drawing_utils
# Modelo de manos
mp_hands = mp.solutions.hands

### Deteccion de manos con Webcam

Presionar q para salir

In [7]:
# Webcam feed, usamos el dispositivo 0 de captura, puede ser diferente
cap = cv2.VideoCapture(0)

# Instanciamos el modelo de las manos, detection y tracking son los dos modelos que se usan
with mp_hands.Hands(min_detection_confidence=0.8, min_tracking_confidence=0.5, max_num_hands=2) as hands:
  # Mientas estamos conectados a la webcam
  while cap.isOpened():
    # Leemos cada cuadro, no usamos ret, frame es el cuadro
    ret, frame = cap.read()

    #DETECCION CON MEDIAPIPE
    # Recoloreamos el feed obtenido de cv2 de BGR a RGB para usarlo en mediapipe
    image = cv2.cvtColor(frame,cv2.COLOR_BGR2RGB)
    #Invertimos la imagen de manera horizontal, para detectar de manera correcta cual mano es derecha y cual izquierda
    image = cv2.flip(image,1)
    # Evita que podamos dibujar sobre la imagen
    image.flags.writeable = False
    # Realizamos la deteccion
    results = hands.process(image)
    # Nos permite dibujar sobre la imagen de nuevo
    image.flags.writeable = True

    # Convertimos de RGB a BGR
    image = cv2.cvtColor(image,cv2.COLOR_RGB2BGR)
    # print(results)

    # Renderizar los resultados si detecta akgi (en la variable results)
    if results.multi_hand_landmarks:
      for num, hand in enumerate(results.multi_hand_landmarks):
        mp_drawing.draw_landmarks(image,hand, mp_hands.HAND_CONNECTIONS,
                                  mp_drawing.DrawingSpec(color=(0, 0, 255), thickness=2, circle_radius=2),
                                  mp_drawing.DrawingSpec(color=(224, 224, 224), thickness=2, circle_radius=2))

    # Mostramos frame
    cv2.imshow('Hand Tracking', image)

    if cv2.waitKey(10) & 0xFF == ord('q'):
      break

cap.release()
cv2.destroyAllWindows()

### Ejemplos de datos obtenidos

multi_hand_landmarks

In [11]:
print(results.multi_hand_landmarks)

[landmark {
  x: 0.6046357154846191
  y: 0.8187534213066101
  z: 4.4169800617055444e-07
}
landmark {
  x: 0.5402639508247375
  y: 0.7942764759063721
  z: -0.02468423917889595
}
landmark {
  x: 0.4876232147216797
  y: 0.7256060242652893
  z: -0.03511936590075493
}
landmark {
  x: 0.4490585923194885
  y: 0.6730635166168213
  z: -0.0437522828578949
}
landmark {
  x: 0.41153767704963684
  y: 0.6478210687637329
  z: -0.052935026586055756
}
landmark {
  x: 0.5338413715362549
  y: 0.5960366725921631
  z: -0.017761103808879852
}
landmark {
  x: 0.5109515190124512
  y: 0.5127018690109253
  z: -0.03300157189369202
}
landmark {
  x: 0.4975605607032776
  y: 0.45701584219932556
  z: -0.04694559425115585
}
landmark {
  x: 0.48792821168899536
  y: 0.4091030955314636
  z: -0.058943480253219604
}
landmark {
  x: 0.5768252611160278
  y: 0.5835236310958862
  z: -0.021877290681004524
}
landmark {
  x: 0.5759693384170532
  y: 0.4844900965690613
  z: -0.03422805666923523
}
landmark {
  x: 0.5761561989784241

HAND_CONNECTIONS

In [5]:
mp_hands.HAND_CONNECTIONS

frozenset({(0, 1),
           (0, 5),
           (0, 17),
           (1, 2),
           (2, 3),
           (3, 4),
           (5, 6),
           (5, 9),
           (6, 7),
           (7, 8),
           (9, 10),
           (9, 13),
           (10, 11),
           (11, 12),
           (13, 14),
           (13, 17),
           (14, 15),
           (15, 16),
           (17, 18),
           (18, 19),
           (19, 20)})

![hands](resource/img/hand-landmarks.png)

## 3. Imagenes

In [11]:
os.mkdir('Output_images')

Esta version del codigo guarda cada cuadro de la imagen dentro de un folder local ('Output_images')

In [None]:
# Webcam feed, usamos el dispositivo 0 de captura, puede ser diferente
cap = cv2.VideoCapture(0)

# Instanciamos el modelo de las manos, detection y tracking son los dos modelos que se usan
with mp_hands.Hands(min_detection_confidence=0.8, min_tracking_confidence=0.5, max_num_hands=2) as hands:
  # Mientas estamos conectados a la webcam
  while cap.isOpened():
    # Leemos cada cuadro, no usamos ret, frame es el cuadro
    ret, frame = cap.read()

    #DETECCION CON MEDIAPIPE
    # Recoloreamos el feed obtenido de cv2 de BGR a RGB para usarlo en mediapipe
    image = cv2.cvtColor(frame,cv2.COLOR_BGR2RGB)
    #Invertimos la imagen de manera horizontal, para detectar de manera correcta cual mano es derecha y cual izquierda
    image = cv2.flip(image,1)
    # Evita que podamos dibujar sobre la imagen
    image.flags.writeable = False
    # Realizamos la deteccion
    results = hands.process(image)
    # Nos permite dibujar sobre la imagen de nuevo
    image.flags.writeable = True

    # Convertimos de RGB a BGR
    image = cv2.cvtColor(image,cv2.COLOR_RGB2BGR)
    # print(results)

    # Renderizar los resultados si detecta akgi (en la variable results)
    if results.multi_hand_landmarks:
      for num, hand in enumerate(results.multi_hand_landmarks):
        mp_drawing.draw_landmarks(image,hand, mp_hands.HAND_CONNECTIONS,
                                  mp_drawing.DrawingSpec(color=(0, 0, 255), thickness=2, circle_radius=2),
                                  mp_drawing.DrawingSpec(color=(224, 224, 224), thickness=2, circle_radius=2))
    
    # Para guardar la imagen
    cv2.imwrite(
      os.path.join(
        'Output_images',
        '{}.jpg'.format(uuid.uuid1())),
        image)
    
    # Mostramos frame
    cv2.imshow('Hand Tracking', image)

    if cv2.waitKey(10) & 0xFF == ord('q'):
      break

cap.release()
cv2.destroyAllWindows()

ejemplo uuid1

In [14]:
os.path.join(
        'Output_images',
        '{}.jpg'.format(uuid.uuid1()))

'Output_images\\f35c6690-d33b-11ee-9aa5-3c58c2bc1ad2.jpg'