# Detectando landmarks de la cara y de las manos

En este notebook, utilizaremos la biblioteca Mediapipe Python para detectar puntos de referencia de caras y manos. Usaremos un modelo holístico de las soluciones mediapipe para detectar todos los puntos de referencia (landmarks) de la cara y las manos. También veremos cómo podemos acceder a diferentes puntos de referencia de la cara y las manos que pueden usarse para diferentes aplicaciones de visión por computadora, como detección de lenguaje de señas, detección de somnolencia, etc.

Bibliotecas requeridas
Mediapipe es una biblioteca multiplataforma desarrollada por Google que proporciona increíbles soluciones de aprendizaje automático listas para usar para tareas de visión por computador.
La biblioteca OpenCV en Python es una biblioteca de visión por computador que se usa ampliamente para análisis de imágenes, procesamiento de imágenes, detección, reconocimiento, etc.

In [1]:
# Import Libraries
import cv2
import time
import mediapipe as mp

Inicializando el modelo holístico y las utilidades de dibujo para detectar y dibujar puntos de referencia en la imagen.

**static_image_mode:** se utiliza para especificar si las imágenes de entrada deben tratarse como imágenes estáticas o como una transmisión de video. El valor predeterminado es False.

**model_complexity:** se utiliza para especificar la complejidad del modelo de punto de referencia: 0, 1 o 2. A medida que la complejidad del modelo aumenta, la precisión del punto de referencia y la latencia aumentan. El valor predeterminado es 1.

**smooth_landmarks:** este parámetro se utiliza para reducir la fluctuación en la predicción filtrando puntos de referencia de pose en diferentes imágenes de entrada. El valor por defecto es True.

**min_detection_confidence:** se utiliza para especificar el valor mínimo de confianza con el que la detección del modelo de detección de personas debe considerarse exitosa. Puede especificar un valor en [0.0,1.0]. El valor predeterminado es 0,5.

**min_tracking_confidence:**  se utiliza para especificar el valor mínimo de confianza con el que la detección del modelo de seguimiento (tracking) de puntos de referencia debe considerarse exitosa. Puede especificar un valor en [0.0,1.0]. El valor predeterminado es 0,5.

In [2]:
# Grabbing the Holistic Model from Mediapipe and
# Initializing the Model
mp_holistic = mp.solutions.holistic
holistic_model = mp_holistic.Holistic(
    min_detection_confidence=0.5,
    min_tracking_confidence=0.5
)
 
# Initializing the drawing utils for drawing the facial landmarks on image
mp_drawing = mp.solutions.drawing_utils

El modelo holístico procesa la imagen y produce puntos de referencia para la cara, la mano izquierda, la mano derecha y también detecta la postura.

El siguiente codigo realiza lo siguiente:

1. Captura los fotogramas continuamente desde la cámara usando OpenCV.
2. Convierte la imagen BGR en una imagen RGB y se hace las predicciones utilizando un modelo holístico inicializado.
3. Las predicciones realizadas por el modelo holístico se guardan en la variable de resultados desde la que podemos acceder a los puntos de referencia usando results.face_landmarks, results.right_hand_landmarks, results.left_hand_landmarks respectivamente.
4. Dibuja los puntos de referencia detectados en la imagen usando la función draw_landmarks de las utilidades de dibujo.
5. Muestre la imagen resultante.

In [3]:
# (0) in VideoCapture is used to connect to your computer's default camera
capture = cv2.VideoCapture(0)
 
# Initializing current time and precious time for calculating the FPS
previousTime = 0
currentTime = 0
 
while capture.isOpened():
    # capture frame by frame
    ret, frame = capture.read()
 
    # resizing the frame for better view
    frame = cv2.resize(frame, (800, 600))
 
    # Converting the from BGR to RGB
    image = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
 
    # Making predictions using holistic model
    # To improve performance, optionally mark the image as not writeable to
    # pass by reference.
    image.flags.writeable = False
    results = holistic_model.process(image)
    image.flags.writeable = True
 
    # Converting back the RGB image to BGR
    image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR)
 
    # Drawing the Facial Landmarks
    mp_drawing.draw_landmarks(
      image,
      results.face_landmarks,
      mp_holistic.FACEMESH_CONTOURS,
      mp_drawing.DrawingSpec(
        color=(255,0,255),
        thickness=1,
        circle_radius=1
      ),
      mp_drawing.DrawingSpec(
        color=(0,255,255),
        thickness=1,
        circle_radius=1
      )
    )
 
    # Drawing Right hand Land Marks
    mp_drawing.draw_landmarks(
      image, 
      results.right_hand_landmarks, 
      mp_holistic.HAND_CONNECTIONS
    )
 
    # Drawing Left hand Land Marks
    mp_drawing.draw_landmarks(
      image, 
      results.left_hand_landmarks, 
      mp_holistic.HAND_CONNECTIONS
    )
     
    # Calculating the FPS
    currentTime = time.time()
    fps = 1 / (currentTime-previousTime)
    previousTime = currentTime
     
    # Displaying FPS on the image
    cv2.putText(image, str(int(fps))+" FPS", (10, 70), cv2.FONT_HERSHEY_COMPLEX, 1, (0,255,0), 2)
 
    # Display the resulting image
    cv2.imshow("Facial and Hand Landmarks", image)
 
    # Enter key 'q' to break the loop
    if cv2.waitKey(5) & 0xFF == ord('q'):
        break
 
# When all the process is done
# Release the capture and destroy all windows
capture.release()
cv2.destroyAllWindows()

KeyboardInterrupt: 

In [4]:
# Code to access landmarks
for landmark in mp_holistic.HandLandmark:
    print(landmark, landmark.value)
 
print(mp_holistic.HandLandmark.WRIST.value)

0 0
1 1
2 2
3 3
4 4
5 5
6 6
7 7
8 8
9 9
10 10
11 11
12 12
13 13
14 14
15 15
16 16
17 17
18 18
19 19
20 20
0


In [6]:
print(results)

<class 'mediapipe.python.solution_base.SolutionOutputs'>


: 