<img src="Imagenes/preparado_aff.jpeg" alt="Imagen creada con inteligencia artificial y editada con Microsoft Paint" style="border-radius: 15px">


*Imagen creada con inteligencia artificial.*

## **INTRODUCCIÓN**

El **dataset** **‘fer2013’** se presenta en un archivo **CSV** en el cual no tenemos las **fotografías**, sino que tenemos una columna, ‘**pixels**’, que contiene una cadena de números separados por espacios, siendo estos números los colores (en escala de grises) de las **fotografías**. **A partir** de las **fotografías** del dataset **'AffectNet'** crearemos **7 datasets**, uno por cada **expresión facial**, y al final los uniremos para que tengan un formato similar a **'FER2013'**.


## **BIBLIOTECAS USADAS:**

In [1]:
import os
import cv2
import pandas as pd
import numpy as np 
import math


## **CODIGO COLUMNAS 'emotion' Y 'pixels'**

In [2]:
ruta_base = "datos/AffectNet/AffectNet_original/archive/"
def leer_imagenes(carpeta):
    lista_imagenes = []
    ruta_carpeta = os.path.join(ruta_base, str(carpeta))
    for filename in os.listdir(ruta_carpeta):
        if filename.lower().endswith((".jpg", ".jpeg", ".png")):
            ruta_imagen = os.path.join(ruta_carpeta, filename)
            img = cv2.imread(ruta_imagen, cv2.IMREAD_GRAYSCALE)  
            img_resized = cv2.resize(img, (48, 48)) 
            img_string = ' '.join(map(str, img_resized.flatten()))  
            lista_imagenes.append(img_string)
    return lista_imagenes

df_5= pd.DataFrame(columns=['emotion', 'pixels']) #Iremos cambiado el nombre del dataframe
df_5['emotion'] = [5] * len(os.listdir(os.path.join(ruta_base, "5"))) #Cambiar el nombre del dataframe, el numero entre corchetes y el que sigue a ruta base.
df_5['pixels'] = leer_imagenes(5)#Iremos cambiado el nombre del dataframe y el numero entre parentesis


>La función **leer_imagenes** procesa imágenes a partir de una carpeta especificada. Cada imagen se carga en color, luego se convierte a escala de grises, se redimensiona a 48x48 píxeles y se convierte en una cadena de píxeles. Estas cadenas se almacenan en una lista que se devuelve como resultado.

## **CODIGO COLUMNA 'Usage'**

In [3]:
total_rows = len(df_5) #Iremos cambiado el nombre del dataframe

num_training = int(np.ceil(0.8 * total_rows))  
num_public_test = int(np.floor(0.1 * total_rows))  
num_private_test = total_rows - num_training - num_public_test

while num_training + num_public_test + num_private_test != total_rows:
    num_training += 1

usage_values = np.array(['Training'] * num_training + ['PublicTest'] * num_public_test + ['PrivateTest'] * num_private_test)


np.random.seed(42)  
df_5['Usage'] = np.random.choice(usage_values, size=total_rows, replace=False)#Iremos cambiado el nombre del dataframe

>Se asignan etiquetas de uso ('Training', 'PublicTest', 'PrivateTest') a las filas del DataFrame df_6 basándose en porcentajes predefinidos (80%, 10%, 10%). Se utiliza una semilla aleatoria para garantizar la aleatoriedad en la asignación de etiquetas.

## **COMPROBACION**

In [4]:
"""num_filas = df_4.shape[0] #Iremos cambiado el nombre del dataframe
print(f"El DataFrame tiene {num_filas} filas.")"""

'num_filas = df_4.shape[0] #Iremos cambiado el nombre del dataframe\nprint(f"El DataFrame tiene {num_filas} filas.")'

>Vemos que hay tantas filas como fotografias hay en la carpeta correspondiente.

In [5]:
"""df_4['Usage'].value_counts(True)"""

"df_4['Usage'].value_counts(True)"

> Queda muy balanceado.

In [6]:
"""# Obtener el tamaño en píxeles de las imágenes
df_4['num_pixels'] = df_4['pixels'].apply(lambda x: len(x.split()))

# Calcular estadísticas sobre el tamaño en píxeles
min_pixels = df_4['num_pixels'].min()
max_pixels = df_4['num_pixels'].max()


print(f"Tamaño mínimo de imagen en píxeles: {min_pixels}")
print(f"Tamaño máximo de imagen en píxeles: {max_pixels}")

print(f"Por lo que las imagenes son de {int(math.sqrt(max_pixels))}x{int(math.sqrt(max_pixels))} ")"""

'# Obtener el tamaño en píxeles de las imágenes\ndf_4[\'num_pixels\'] = df_4[\'pixels\'].apply(lambda x: len(x.split()))\n\n# Calcular estadísticas sobre el tamaño en píxeles\nmin_pixels = df_4[\'num_pixels\'].min()\nmax_pixels = df_4[\'num_pixels\'].max()\n\n\nprint(f"Tamaño mínimo de imagen en píxeles: {min_pixels}")\nprint(f"Tamaño máximo de imagen en píxeles: {max_pixels}")\n\nprint(f"Por lo que las imagenes son de {int(math.sqrt(max_pixels))}x{int(math.sqrt(max_pixels))} ")'

In [7]:
"""ejemplo_pixels = df_4['pixels'].iloc[0] #Sabemos que todas las filas, tienen las misma caracteristicas, asi que cogemos una cualquiera.

# Dividimos la cadena de píxeles en valores individuales y convertimos a enteros
valores_pixeles = list(map(int, ejemplo_pixels.split()))

# Verificamos si todos los valores están dentro del rango de 0 a 255
todos_en_rango = all(0 <= pixel <= 255 for pixel in valores_pixeles)

if todos_en_rango:
    print("Las imágenes del dataset 'df_4' son en escala de grises.")
else:
    print("Las imágenes del dataset 'df_4' son a color (o tienen valores fuera del rango 0-255).")"""

'ejemplo_pixels = df_4[\'pixels\'].iloc[0] #Sabemos que todas las filas, tienen las misma caracteristicas, asi que cogemos una cualquiera.\n\n# Dividimos la cadena de píxeles en valores individuales y convertimos a enteros\nvalores_pixeles = list(map(int, ejemplo_pixels.split()))\n\n# Verificamos si todos los valores están dentro del rango de 0 a 255\ntodos_en_rango = all(0 <= pixel <= 255 for pixel in valores_pixeles)\n\nif todos_en_rango:\n    print("Las imágenes del dataset \'df_4\' son en escala de grises.")\nelse:\n    print("Las imágenes del dataset \'df_4\' son a color (o tienen valores fuera del rango 0-255).")'

>Puedes descomentar estas comprobaciones y verificar que está saliendo bien.

## **GUARDADO DEL DATAFRAME**

In [8]:
df_5.to_csv('datos/AffectNet/expresiones individuales/df_5.csv', index=False) #Iremos cambiado el nombre del dataframe y del bombre con el que lo guardamos.

In [9]:
df_5.head(5)

Unnamed: 0,emotion,pixels,Usage
0,5,61 62 63 63 64 65 65 64 65 65 65 65 65 65 65 6...,Training
1,5,220 221 222 220 220 219 214 215 213 213 213 21...,Training
2,5,69 58 68 68 60 62 73 60 56 54 52 50 49 58 50 4...,Training
3,5,69 68 68 68 69 68 68 69 69 69 69 68 68 67 67 6...,Training
4,5,238 241 241 240 240 245 243 238 234 232 227 22...,Training


## **CONCATENADO Y GUARDADO DE LOS DATASETS**

In [11]:
"""df_0 = pd.read_csv('datos/AffectNet/expresiones individuales/df_0.csv')
df_1 = pd.read_csv('datos/AffectNet/expresiones individuales/df_1.csv')
df_2 = pd.read_csv('datos/AffectNet/expresiones individuales/df_2.csv')
df_3 = pd.read_csv('datos/AffectNet/expresiones individuales/df_3.csv')
df_4 = pd.read_csv('datos/AffectNet/expresiones individuales/df_4.csv')
df_5 = pd.read_csv('datos/AffectNet/expresiones individuales/df_5.csv')
df_6 = pd.read_csv('datos/AffectNet/expresiones individuales/df_6.csv') 

df_unido = pd.concat([df_0,df_1, df_2, df_3, df_4, df_5, df_6], ignore_index=True) 

df_unido.to_csv('datos/AffectNet/df_AffectNet_formato.csv', index=False)"""

## **COMENTARIO FINAL**

**Reconocer expresiones faciales** no es una tarea fácil para una red neuronal. A los **humanos** nos resulta relativamente sencilla dicha tarea, pero aunque las redes neuronales intentan imitar el **cerebro** humano, estas pueden tener dificultades para alcanzar precisiones altas en dicha tarea.   

El dataset "**FER2013**" es bastante reconocido, es de fácil acceso y **ha sido muy usado para entrenar distintos modelos**, por esto es **la base** del presente proyecto. La parte negativa es que pese a ser un buen dataset, se queda corto, no es facil obtener buenos resultados, al menos no con ordenadores domesticos. Después de balancearlo usando métodos de data augmentation, no logramos alcanzar precisiones que satisfarían nuestras expectativas. Podríamos haber continuado con más procesos de data augmentation, pero esto supondría únicamente cambios en las mismas fotografías, lo que podría llevar, con bastante seguridad, a que el modelo generalice mal. Sería algo así como enseñar a alguien que nunca ha visto un perro lo que es un perro mostrándole únicamente fotografías de yorkshires y chihuahuas… ¿**Reconocería** un mastín como un perro? ¿Y una hiena o un lobo? Para solventar esto y tras una investigación, encontramos esta [versión](https://www.kaggle.com/datasets/noamsegal/affectnet-training-data) del dataset '**AffectNet**'. La version completa de "**AffectNet**" es demasiado grande para trabajar con el con un ordenador personal, en cambio la version con la que estamos trabajando resulta casi idonea, tiene  las mismas etiquetas (realmente una más, '**contempt**', que significa 'desprecio' o 'desdén') solo que, a diferencia de "**fer2013**", no teníamos un csv con tres columnas: la etiqueta de la emoción, la cadena que representa los píxeles y una tercera para el uso de cada fotografía. Precisamente esto es lo que se ha abordado en este notebook: tener un dataset con el mismo formato que '**fer2013**' para poder unirlos y entrenar un modelo con mayor variedad de entradas, permitiendo así un mejor aprendizaje.
