# Explorant el mon de les cares amb Intel·ligència Artificial

**DevFest Menorca 2024**, 24 octubre 2024

<a target="_blank" href="https://colab.research.google.com/github/bmalcover/devFest24/blob/main/df1.ipynb">
  <img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/>
</a>

## Sobre mi

*   Soy **Biel Moyà** (gabriel.moya *at* uib.es)y trabajo como profesor e investigador en la UIB.
*   Doy clases de Inteligencia Artificial y de Aprendizaje Automàtico en el grado de informática. También de introducción a la programación en el grado de Matemáticas.
*   Investigo en técnicas de IA  normalmente aplicadas a imágenes médicas: radiografías, resonancias magnéticas, heridas, pies con úlceras, uñas enfermas ... este tipo de problemas tienen ciertas similitudes.
* Tambien intento ayudar a entender como funcionan las redes neuronales profundas, ya que de momento para nosotros son similares a cajas oscuras que nos resultan imposibles de interpretar.
* Me encanta el lenguaje Python. Y aunque no soy el mejor programador de la historia me entretiene (y me gusta) mucho hacerlo.

## Sobre el taller de hoy

* Os explicaré porque he elegido la temática de las caras, cuando existen otros infinitos problemas que podría haber propuesto.
* Entenderemos que una imágen es una representación visual de alta dimensionalidad.
* Aplicaremos diversas técnicas de IA a imágenes de caras para extraer información de su contenido y veremos que es posible hacerlo sin la necesidad de realizar código muy complicado.
* Veremos como podemos reutilizar trabajo ya hecho y aplicar un cambio de estilo a una imagen.











# Contexto
## **El reconocimiento de caras en humanos**

El cerebro del recién nacido está programado, desde su nacimiento, para buscar y detectar rostros. Algo que resulta importante para su supervivencia y desarrollo.

En una investigación, desarrollada por psicólogos de la Universidad Emory en Atlanta, Estados Unidos, se analizó el córtex visual de bebés recién nacidos a través de imágenes de resonancia magnética funcional. A través del escáner pudieron demostrar que desde el sexto día tras el nacimiento, el cerebro de los bebés está programado con las tareas específicas de buscar y observar rostro
[enlace](https://www.criarconsentidocomun.com/el-cerebro-del-recien-nacido-detecta-rostros/).

## **Caras y su apariencia**

![Cares](figuras/faces.png "caras")

# Caras en las imágenes

El reconocimiento de caras ha jugado un papel central en la historia de la IA, tanto en su evolución como en su aplicación. Esta tecnología ha sido clave en diversos momentos históricos por su impacto tanto en el ámbito técnico como en el social.


1. **Inicio del estudio y desarrollo de patrones**

El reconocimiento de caras fue uno de los primeros campos de aplicación de la **visión por computador**, una rama de la IA dedicada a que las máquinas puedan **ver y comprender imágenes y vídeos**. Ya en los años 60, se empezaron a estudiar métodos para reconocer patrones en imágenes, incluyendo caras humanas. Uno de los primeros intentos consistió en comparar medidas geométricas de las caras, como la distancia entre los ojos o el contorno facial, para clasificarlas.

2. **Evolución gracias a los algoritmos de machine learning**

A medida que los algoritmos de machine learning avanzaron, el reconocimiento facial se benefició enormemente.

Hacia los años 90, se desarrollaron técnicas como el **análisis de componentes principales (PCA)** y el algoritmo conocido como [Eigenfaces](https://scikit-learn.org/stable/auto_examples/applications/plot_face_recognition.html), que representaban a las caras como combinaciones lineales de una serie de "componentes principales". Éste fue un gran salto hacia la precisión, ya que permitió representar una cara de manera más robusta y matemática.


El algoritmo Viola-Jones es una de las técnicas más conocidas y utilizadas para la **detección** (que no el reconocimiento) de caras en imágenes. Creado por Paul Viola y Michael Jones en 2001, este algoritmo fue uno de los primeros que permitió una detección de caras en tiempo real de forma efectiva. Aunque ya han surgido técnicas más avanzadas como las redes neuronales convolucionales, Viola-Jones sigue siendo importante gracias a su velocidad y eficiencia para la detección de caras frontales.

![viola](figuras/viola_jones.png "Viola Jones")



3. **Introducción de redes neuronales**

El gran avance del reconocimiento de caras llegó con la aparición de las redes neuronales y el deep learning (profundo aprendizaje). Las redes neuronales convolucionales (CNNs) se mostraron particularmente efectivas para la tarea de reconocer caras, puesto que son excelentes para la detección de patrones en imágenes. Los sistemas modernos de reconocimiento facial, como los utilizados por empresas como Facebook (Meta), Amazon, Google o Apple, se basan en estas redes neuronales para aprender características faciales de forma automática, mejorando la eficiencia y precisión del reconocimiento en entornos realistas.

![CNN](figuras/alexNet.png "cnn")



## Aplicaciones prácticas

 Seguridad: El reconocimiento facial se ha utilizado ampliamente en sistemas de vigilancia, control de acceso y aplicaciones de identificación. Por ejemplo, muchos aeropuertos utilizan sistemas de reconocimiento facial para verificar la identidad de los pasajeros.

 Dispositivos móviles: Con la popularidad de smartphones como el iPhone con Face ID, el reconocimiento de caras se ha convertido en una de las formas más comunes de autenticación biométrica.

 Identificación en redes sociales: Plataformas como Facebook han utilizado el reconocimiento facial para ayudar a etiquetar a personas automáticamente en fotos.

## Impulso a la investigación en ética y privacidad

El reconocimiento de caras también ha generado un importante debate sobre la privacidad y derechos civiles. A medida que la tecnología se ha vuelto más precisa, sus aplicaciones en la vigilancia masiva han sido objeto de críticas por parte de diversas organizaciones de derechos humanos.

Esto ha estimulado la creación de marcos legales y éticos en torno a la IA, dando lugar a discusiones sobre transparencia y control de datos personales.



# Que son las imágenes digitales?

Las imágenes digitales son una representación bidimensional de una imagen en una estructura de datos (una matriz). Estan formadas por números que siguen una organización determinada.

In [None]:
import cv2
import matplotlib.pyplot as plt

In [None]:
img = cv2.imread("img/test.png")

plt.imshow(img);

A continuación inspeccionaremos e intentaremos entender como es una imágen digital:

* Que tamaño tiene? Cuantos datos manejamos? Que tipo de datos usa?
* Como puedo seleccionar trozos de la imagen?
* Puedo modificar partes de la imagen de manera senzilla?


In [None]:
# TODO: Explorar imagen

## DeepFace


DeepFace es un sistema de reconocimiento facial de aprendizaje profundo creado por un equipo de desarrollo en Facebook. Este define rostros humanos en imágenes digitales. Emplea una red neuronal de 9 capas con más de 120 millones de conexiones, y ha sido entrenado en 4 millones de imágenes subidas por los usuarios de Facebook. Se ha mencionado que el sistema tiene un 97% de aciertos, comparado con el 85% del sistema Next Generation Identification del FBI. [wikipedia](https://es.wikipedia.org/wiki/DeepFace).

El repositorio de código de esta libreria es el [siguiente](https://github.com/serengil/deepface). En el podemos encontrar más información de sus diferentes funcionalidades.


In [None]:
#!pip install opencv-python deepface # tenemos que instalarla

In [None]:
# Librerias que nos permiten realizar tareas sin tener que programarlas
import cv2
from deepface import DeepFace
import matplotlib.pyplot as plt

Empezaremos con una tarea sencilla, encontrar una cara en una imagen y dibujar la región que ocupa.



In [None]:
IMG_PATH = "/content/img/facel.png"
detected_faces = DeepFace.extract_faces(img_path=IMG_PATH)

face_data = detected_faces[0]['facial_area']
#print(face_data)

cv_img = cv2.imread(IMG_PATH)

inicio = (face_data["x"], face_data["y"])
final = (face_data["x"] + face_data["w"], face_data["y"] + face_data["h"])
color = (0, 255, 0) 
grosor = 4 # pixeles

face_with_box = cv2.rectangle(cv_img, inicio, final, color, grosor)

# Mostramos la figura con la caja alrededor de la cara
plt.imshow(face_with_box);

DeepFace  nos permite realizar un montón de tareas:

### Análisis de los atributos de una persona

A partir de la detección de una cara, se pueden estimar (que no conocer) características de una persona por ejemplo:
- La edad
- El género
- La raza
- Su emoción predominante

Veamos como podemos hacerlo:

In [None]:
objs = DeepFace.analyze(
  img_path = IMG_PATH,
  actions = ['age', 'gender', 'race', 'emotion'],
);

print("")
print(f"Que podemos saber? {list(objs[0].keys())}")

#### Comprobar el envejecimiento de una persona

Vamos a ver que predicciones realiza este método respecto a la edad de una persona quue conocemos bien.

In [None]:
leo_joven = "/content/img/Leonardo_DiCaprio.jpeg"
leo_menos_joven = "/content/img/Leonardo_DiCaprio_2010.jpg"
leo_2024 = "/content/img/Leonardo_DiCaprio_2024.jpeg"

objs = DeepFace.analyze(
  img_path = leo_joven,
  actions = ['age'],
)

objs1 = DeepFace.analyze(
  img_path = leo_menos_joven,
  actions = ['age'],
)

objs2 = DeepFace.analyze(
  img_path = leo_2024,
  actions = ['age'],
)


lj   = cv2.imread(leo_joven)
lj = cv2.cvtColor(lj, cv2.COLOR_BGR2RGB)
lj_m = cv2.imread(leo_menos_joven)
lj_m = cv2.cvtColor(lj_m, cv2.COLOR_BGR2RGB)
lj_2024 = cv2.imread(leo_2024)
lj_2024 = cv2.cvtColor(lj_2024, cv2.COLOR_BGR2RGB)


f, ax = plt.subplots(1, 3)
ax[0].imshow(lj)
ax[0].set_title(f"Leo joven {objs[0]['age']}")
xax = ax[0].axes.get_xaxis()
xax = xax.set_visible(False)
yax = ax[0].axes.get_yaxis()
yax = yax.set_visible(False)

ax[1].imshow(lj_m)
ax[1].set_title(f"Leo menos joven {objs1[0]['age']}")
xax = ax[1].axes.get_xaxis()
xax = xax.set_visible(False)
yax = ax[1].axes.get_yaxis()
yax = yax.set_visible(False)

ax[2].imshow(lj_2024)
ax[2].set_title(f"Menos menos joven {objs2[0]['age']}")
xax = ax[2].axes.get_xaxis()
xax = xax.set_visible(False)
yax = ax[2].axes.get_yaxis()
yax = yax.set_visible(False)
plt.show()

### Quien se parece a Leonardo?

Dicen que Leonardo di Caprio se parece a Jack Nicholson, será verdad?

La libreria DeepFace permite que sus funciones internamente usen diferentes métodos. Esto se llama backend y tenemos los siguientes: `backends = ['opencv', 'ssd', 'dlib', 'mtcnn', 'retinaface', 'mediapipe']` entre otros.

In [None]:
mi_imagen = "/content/img/jo_mateix.jpg"
leo_verano = "/content/img/Leonardo_DiCaprio_verano.png"
jack = "/content/img/jack_nicholson.png"
res = DeepFace.verify(leo_verano, jack) #, detector_backend="retinaface")


Que información tenemos en la variable `res`?

In [None]:
res

In [None]:
#Hacemos una función para que el código quede más digno
def dibujar_cara(path, face_data, aX):

  inicio = (face_data["x"], face_data["y"])
  final = (face_data["x"] + face_data["w"], face_data["y"] + face_data["h"])
  color = (0, 255, 0) 
  grosor = 4 # pixeles
  face_with_box = cv2.rectangle(img, inicio, final, color, grosor)

  return face_with_box

cara1 = res["facial_areas"]["img1"]
cara2 = res["facial_areas"]["img2"]


f, ax = plt.subplots(1, 2)
ax[0].imshow(dibujar_cara(leo_verano, cara1))
ax[0].set_title(f"Leo")
xax = ax[0].axes.get_xaxis()
xax = xax.set_visible(False)
yax = ax[0].axes.get_yaxis()
yax = yax.set_visible(False)

ax[1].imshow(dibujar_cara(jack, cara2))
ax[1].set_title(f"Jack")
xax = ax[1].axes.get_xaxis()
xax = xax.set_visible(False)
yax = ax[1].axes.get_yaxis()
yax = yax.set_visible(False)

# Encontrando los puntos claves de las caras

Los puntos de referencia faciales de Dlib se refieren a puntos específicos en un rostro que se identifican para ayudar con las tareas de análisis facial. Estos puntos, a menudo llamados puntos de referencia, generalmente se colocan alrededor de rasgos faciales clave, como los ojos, la nariz, la boca y la línea de la mandíbula.

Dlib proporciona un modelo entrenado previamente que puede detectar 68 puntos de referencia faciales, que se utilizan comúnmente para tareas como la alineación de rostros, el reconocimiento de emociones o el intercambio de rostros. 

[Enlace a la base de datos original](https://ibug.doc.ic.ac.uk/resources/facial-point-annotations/)


![Cares](figuras/facial_landmarks.jpg "caras")


In [None]:
#!pip install dlib

In [None]:
import dlib
import numpy as np
PREDICTOR_PATH = "shape_predictor_68_face_landmarks.dat"
predictor = dlib.shape_predictor(PREDICTOR_PATH)
detector = dlib.get_frontal_face_detector()


class TooManyFaces(Exception):
    pass

class NoFaces(Exception):
    pass

def get_landmarks(im):
    rects = detector(im, 1)

    if len(rects) > 1:
        raise TooManyFaces
    if len(rects) == 0:
        raise NoFaces

    return np.matrix([[p.x, p.y] for p in predictor(im, rects[0]).parts()])

def annotate_landmarks(im, landmarks):
    im = im.copy()
    for idx, point in enumerate(landmarks):
        pos = (point[0, 0], point[0, 1])
        cv2.putText(im, str(idx), pos,
                    fontFace=cv2.FONT_HERSHEY_SCRIPT_SIMPLEX,
                    fontScale=0.4,
                    color=(0, 0, 255))
        cv2.circle(im, pos, 3, color=(0, 255, 255))
    return im


detected_faces = DeepFace.extract_faces(img_path=IMG_PATH)



image = cv2.imread("/content/img/facel.jpg")

landmarks = get_landmarks(image)
image_with_landmarks = annotate_landmarks(image, landmarks)
image_with_landmarks = cv2.cvtColor(image_with_landmarks, cv2.COLOR_RGB2BGR)

plt.imshow(image_with_landmarks);
