# HANDS

# Índice

[Enunciado](#Enunciado)

[Solución](#Solución)

[Explicación de la fórmula para el cálculo de la distancia de la mano a la cámara](#Explicación-de-la-fórmula-para-el-cálculo-de-la-distancia-de-la-mano-a-la-cámara)

[Ejecución del código: Ejemplo de funcionamiento](#Ejecución-del-código:-Ejemplo-de-funcionamiento)

[Tardanza del código](#Tardanza-del-código)

[Bibliografía usada](#Bibliografía-usada)

## Enunciado

Amplia el ejemplo `code/DL/hands/mano.py` hecho en clase para reconocer gestos simples, como por ejemplo contar el n´umero de dedos extendidos. Haz un controlador sin contacto de varios grados de libertad que mida, al menos, distancia de la mano a la cámara y ángulo de orientación. Utilízalo para controlar alguno de tus programas.


## Solución

La solución está en `HANDS/mano.py`. La aplicación que controla está en `HANDS/programa.py`.

Este programa realiza las siguientes tareas:

- **Mostrar una cámara**

  Se captura cada fotograma, se procesa para realizar las tareas indicadas posteriormente, y se muestra.

- **Dibujar la palma de la mano y los dedos**

  Obteniendo los puntos de la mano con la herramienta `MediaPipe Hands`, se han realizado líneas entre el principio y el final de los dedos de la mano. 

  Para la palma, primero se ha obtenido el centro de tres puntos que se encuentran en el borde de la palma, de forma que se obtiene el centro de la palma. En segundo lugar, se obtiene el radio, calculado como la distancia entre el centro y un punto que está al borde de la palma. De esta forma, se puede dibujar un círculo en la palma con el centro y radio calculados.

- **Calcular qué dedos hay levantados**

  Para los dedos índice, corazón, anular y meñique, se ha calculado si se encuentran abiertos o cerrados usando la distancia entre el punto más bajo de la palma y el principio o el final del dedo. Si el dedo se encuentra cerrado, la distancia entre el punto más bajo de la palma y el final del dedo será menor que la distancia entre el punto más bajo de la palma y el principio del dedo. Si está abierto, es al contrario (es mayor).

  Para el dedo pulgar, se ha considerado abierto si el principio del índice está más cerca del final de la mano que el final del pulgar. Si está más lejos, el dedo pulgar está cerrado.

- **Calcular el ángulo de orientación de la mano**

  Para calcular el ángulo de orientación de la mano, se ha calculado el ángulo entre dos vectores, el vector horizontal y el vector que se encuentra entre el final de la palma y el principio del dedo corazón. El segundo vector debe formar 0 grados con el horizontal si la mano está horizontal, y si esta empieza a girar, se calcula el ángulo.

  Si el principio de la palma está más a la izquierda que el principio del dedo corazón, entonces el ángulo es negativo. Esto se realiza comparando la componente x de los puntos.

- **Controlar una aplicación**

  Si todos los dedos están levantados, se abre la aplicación, y si todos están cerrados se cierra. La condición ya estaba calculada en el cálculo de los dedos levantados.

- **Calcular la distancia de la mano a la cámara**

  Se usa la palma de la mano para calcular la distancia. Se calcula con la fórmula siguiente:

  $$\frac{\text{distancia focal} * \text{ancho de la palma en centímetros}}{\text{ancho de la palma en píxeles}} = \text{distancia a la cámara en centímetros}$$

  Para calcular la distancia focal, se ha utilizado la herramienta `calibrate.py`, que se puede encontrar en [el material de la asignatura](https://github.com/albertoruiz/umucv/tree/master/code/calibrate). Las fotografías tomadas para el cálculo de la distancia focal se encuentran en la carpeta `HANDS/pattern`.

## Explicación de la fórmula para el cálculo de la distancia de la mano a la cámara

La distancia focal es la distancia (en píxeles) desde el centro del objetivo de la cámara hasta el sensor de esta. El objetivo es el lugar donde se encuentra la lente de la cámara, y el sensor es donde se proyecta la luz de la imagen para poder procesarla o almacenarla.

La distancia focal se obtiene realizando la calibración de la cámara. Su obtención es muy útil, debido a que con esta se puede calcular la distancia de la cámara a un objeto (dada una fotografía), si se sabe el tamaño de este en la realidad y en la fotografía.

Para explicar la fórmula para obtener la distancia, se necesita un objeto. Es este caso, se va a explicar con un esquema cuyo objeto es una botella:

<img src="./img/formula1.jpeg" style="width:20%"/>

Como se puede observar: X es la altura de la botella en el mundo real, Z es la distancia de la cámara a la botella, x es la altura de la botella en la fotografía tomada, y f es la distancia focal.

Se puede observar como se forman dos triángulos (uno con lados f y x, y otro con lados X y Z). Los triángulos se encuentran en posición de Thales, por lo que se obtiene la siguiente fórmula:

$$\frac{X}{Z}=\frac{x}{f}$$

Si se quiere obtener más información sobre el teorema de Thales, se puede observar la siguiente url: https://www.superprof.es/apuntes/escolar/matematicas/geometria/basica/triangulos-en-posicion-de-thales.html.

## Ejecución del código: Ejemplo de funcionamiento

Para ejecutar el código de HANDS, se debe de ejecutar el código de `mano.py` desde la carpeta `HANDS` en el entorno de anaconda prompt explicado al inicio de la asignatura.

Una vez abierta la aplicación, se debe mostrar una mano en la cámara (si se muestra más de una, sólo se tendrá una en cuenta, y en esta se dibujarán líneas en los dedos y un circulo azul en la palma).

- **Dedos levantados**:

  Si se levantan o bajan los dedos, se indica en la pantalla qué dedos están levantados:
  
  <table><tr>
  <td> <img src="img/dedos-en-alto.png"/> </td>
  <td> <img src="img/4-dedos-en-alto.png"/> </td>
  <td> <img src="img/dedos-hacia-delante.png"/> </td>
  <td> <img src="img/dedos-hacia-atras.png"/> </td>
  </tr></table>

  Como se puede observar, el programa diferencia los dedos indiferentemente de la posición de la mano.

- **Grados**:

  También se puede observar el ángulo de la mano, de forma que va desde 180 hasta -180 grados:

  <table><tr>
  <td> <img src="img/0-grados.png"/> </td>
  <td> <img src="img/90-grados.png"/> </td>
  <td> <img src="img/179-grados.png"/> </td>
  <td> <img src="img/-90-grados.png"/> </td>
  </tr></table>

- **Distancia a la cámara**:

  Como se puede observar, se indica la distancia a la cámara (se muestra un video donde se acerca y se aleja la mano para que se va de mejor forma:

  <video src="img/distancia-mano.mp4" controls='play' style="width:50%">
  </video>

- **Abrir y cerrar una aplicación**:

  Se presenta un vídeo en el que se ve cómo se abre (cinco dedos arriba) y se cierra (cinco dedos abajo) una aplicación con `mano.py`:

  <video src="img/abrir-cerrar-aplicacion.mp4" controls='play' style="width:50%">
  </video>

## Tardanza del código

Para ver cuanto tarda en ejecutar el código se va a añadir las siguientes líneas de código cuando se captura y cuando se muestra el frame:

In [None]:
import time
# ...
inicio = time.time()

# Código que se hace cada frame

fin = time.time()
print(fin-inicio)

Como se puede observar, este código tarda 0 segundos porque no hace nada en medio, pero al añadirlo a `mano.py`, el tiempo aumenta:

- Al no mostrar manos, cada frame tarda unos 0.07 segundos en mostrarse.

- Como es de esperar, al mostrar una mano, el hecho de tener que hacer más cálculos hace que el frame tarde más en mostrarse (unos 0.12 segundos).

- El hecho de mover las manos hace que en algunos frames sea más dificil calcular el frame resultante a mostrar (0.19 segundos), y en otros más sencillo (0.06 segundos). Los frames más sencillos tienen un tiempo similar a los tiempos al no mostrar manos, por lo que se puede intuir que en esos frames no se mostraron manos (o estas no fueron reconocidas al no verse de forma correcta por la velocidad).

## Bibliografía usada

[Comprender Hand Landmark - MediaPipe](https://github.com/google/mediapipe/blob/master/docs/solutions/hands.md)

[Aprender a dibujar cuadrados](https://docs.opencv.org/3.4/d6/d6e/group__imgproc__draw.html#ga07d2f74cadcf8e305e810ce8eed13bc9)

[Aprender a escribir texto](https://docs.opencv.org/3.4/d6/d6e/group__imgproc__draw.html#ga5126f47f883d730f633d74f07456c576)

[Aprender a dibujar círculos: cv.circle](https://docs.opencv.org/3.4/d6/d6e/group__imgproc__draw.html#gaf10604b069374903dbd0f0488cb43670)

[Funciones de math](https://docs.python.org/3/library/math.html)

[Ángulo entre dos vectores (para calcular la orientación de la mano)](https://www.superprof.es/apuntes/escolar/matematicas/analitica/vectores/angulo-de-dos-vectores.html)

[Material de la asignatura](https://github.com/albertoruiz/umucv/blob/master/notebooks/imagen.ipynb)

[Entender qué es la distancia focal](https://www.sony.es/electronics/support/articles/00267921)

[Entender qué es un sensor](https://www.blogdelfotografo.com/tipos-caracteristicas-ventajas-sensores-camaras-fotos/)

[Teorema de Thales](https://www.superprof.es/apuntes/escolar/matematicas/geometria/basica/triangulos-en-posicion-de-thales.html)

También se ha usado ChatGPT para crear el programa llamado `programa.py`, el cual crea una ventana. Este se utilizó para controlarlo con `mano.py`, de forma que se vea la ventana abrirse y cerrarse según el gesto de la mano.