<img src="Imagenes/pablo/th.jpg" alt="Imagen creada con inteligencia artificial y editada con Microsoft Paint" style="border-radius: 15px">


*Imagen creada con inteligencia artificial.*

## **INTRODUCCIÓN**

El **dataset** **‘fer2013’** se presenta en un archivo **CSV** en el cual no tenemos las **fotografías**, sino que tenemos una columna, ‘**pixels**’, que contiene una cadena de números separados por espacios, siendo estos números los colores (en escala de grises) de las **fotografías**. **A partir** de las **fotografías** del dataset **'AffectNet'** crearemos **7 datasets**, uno por cada **expresión facial**, y al final los uniremos para que tengan un formato similar a **'FER2013'**.


## **BIBLIOTECAS USADAS:**

In [15]:
import os
import cv2
import pandas as pd
import numpy as np 
import math


## **CODIGO COLUMNAS 'emotion' Y 'pixels'**

In [20]:
ruta_base = "datos/AffectNet/AffectNet_original/archive/"
def leer_imagenes(carpeta):
    lista_imagenes = []
    ruta_carpeta = os.path.join(ruta_base, str(carpeta))
    for filename in os.listdir(ruta_carpeta):
        if filename.lower().endswith((".jpg", ".jpeg", ".png")):
            ruta_imagen = os.path.join(ruta_carpeta, filename)
            img = cv2.imread(ruta_imagen, cv2.IMREAD_GRAYSCALE)  
            img_resized = cv2.resize(img, (48, 48)) 
            img_string = ' '.join(map(str, img_resized.flatten()))  
            lista_imagenes.append(img_string)
    return lista_imagenes

df_6= pd.DataFrame(columns=['emotion', 'pixels']) #Iremos cambiado el nombre del dataframe
df_6['emotion'] = [6] * len(os.listdir(os.path.join(ruta_base, "6"))) #Cambiar el nombre del dataframe, el numero entre corchetes y el que sigue a ruta base.
df_6['pixels'] = leer_imagenes(6)#Iremos cambiado el nombre del dataframe y el numero entre parentesis


>La función **leer_imagenes** procesa imágenes a partir de una carpeta especificada. Cada imagen se carga en color, luego se convierte a escala de grises, se redimensiona a 48x48 píxeles y se convierte en una cadena de píxeles. Estas cadenas se almacenan en una lista que se devuelve como resultado.

## **CODIGO COLUMNA 'Usage'**

In [22]:
total_rows = len(df_6) #Iremos cambiado el nombre del dataframe

num_training = int(np.ceil(0.8 * total_rows))  
num_public_test = int(np.floor(0.1 * total_rows))  
num_private_test = total_rows - num_training - num_public_test

while num_training + num_public_test + num_private_test != total_rows:
    num_training += 1

usage_values = np.array(['Training'] * num_training + ['PublicTest'] * num_public_test + ['PrivateTest'] * num_private_test)


np.random.seed(42)  
df_6['Usage'] = np.random.choice(usage_values, size=total_rows, replace=False)#Iremos cambiado el nombre del dataframe

>Se asignan etiquetas de uso ('Training', 'PublicTest', 'PrivateTest') a las filas del DataFrame df_6 basándose en porcentajes predefinidos (80%, 10%, 10%). Se utiliza una semilla aleatoria para garantizar la aleatoriedad en la asignación de etiquetas.

## **COMPROBACION**

In [13]:
"""num_filas = df_4.shape[0] #Iremos cambiado el nombre del dataframe
print(f"El DataFrame tiene {num_filas} filas.")"""

El DataFrame tiene 3091 filas.


>Vemos que hay tantas filas como fotografias hay en la carpeta correspondiente.

In [11]:
"""df_4['Usage'].value_counts(True)"""

Usage
Training       0.800065
PublicTest     0.099968
PrivateTest    0.099968
Name: proportion, dtype: float64

> Queda muy balanceado.

In [23]:
"""# Obtener el tamaño en píxeles de las imágenes
df_4['num_pixels'] = df_4['pixels'].apply(lambda x: len(x.split()))

# Calcular estadísticas sobre el tamaño en píxeles
min_pixels = df_4['num_pixels'].min()
max_pixels = df_4['num_pixels'].max()


print(f"Tamaño mínimo de imagen en píxeles: {min_pixels}")
print(f"Tamaño máximo de imagen en píxeles: {max_pixels}")

print(f"Por lo que las imagenes son de {int(math.sqrt(max_pixels))}x{int(math.sqrt(max_pixels))} ")"""

'# Obtener el tamaño en píxeles de las imágenes\ndf_4[\'num_pixels\'] = df_4[\'pixels\'].apply(lambda x: len(x.split()))\n\n# Calcular estadísticas sobre el tamaño en píxeles\nmin_pixels = df_4[\'num_pixels\'].min()\nmax_pixels = df_4[\'num_pixels\'].max()\n\n\nprint(f"Tamaño mínimo de imagen en píxeles: {min_pixels}")\nprint(f"Tamaño máximo de imagen en píxeles: {max_pixels}")\n\nprint(f"Por lo que las imagenes son de {int(math.sqrt(max_pixels))}x{int(math.sqrt(max_pixels))} ")'

In [12]:
"""ejemplo_pixels = df_4['pixels'].iloc[0] #Sabemos que todas las filas, tienen las misma caracteristicas, asi que cogemos una cualquiera.

# Dividimos la cadena de píxeles en valores individuales y convertimos a enteros
valores_pixeles = list(map(int, ejemplo_pixels.split()))

# Verificamos si todos los valores están dentro del rango de 0 a 255
todos_en_rango = all(0 <= pixel <= 255 for pixel in valores_pixeles)

if todos_en_rango:
    print("Las imágenes del dataset 'df_4' son en escala de grises.")
else:
    print("Las imágenes del dataset 'df_4' son a color (o tienen valores fuera del rango 0-255).")"""

Las imágenes del dataset 'df_1' son en escala de grises.


>Puedes descomentar estas comprobaciones y verificar que está saliendo bien.

## **GUARDADO DEL DATAFRAME**

In [24]:
df_6.to_csv('datos/AffectNet/expresiones individuales/df_6.csv', index=False) #Iremos cambiado el nombre del dataframe y del bombre con el que lo guardamos.

In [25]:
df_6.head(5)

Unnamed: 0,emotion,pixels,Usage
0,6,89 91 88 85 84 83 79 78 77 77 72 69 57 62 47 3...,PublicTest
1,6,184 184 180 184 184 186 187 181 171 168 169 16...,Training
2,6,10 9 13 20 13 39 67 70 66 63 45 83 81 70 96 93...,PrivateTest
3,6,199 198 199 197 192 180 165 158 157 156 158 15...,Training
4,6,157 148 131 121 108 90 96 77 55 59 83 93 78 53...,Training


## **CONCATENADO Y GUARDADO DE LOS DATASETS**

In [28]:
"""df_0 = pd.read_csv('datos/AffectNet/expresiones individuales/df_0.csv')
df_1 = pd.read_csv('datos/AffectNet/expresiones individuales/df_1.csv')
df_2 = pd.read_csv('datos/AffectNet/expresiones individuales/df_2.csv')
df_3 = pd.read_csv('datos/AffectNet/expresiones individuales/df_3.csv')
df_4 = pd.read_csv('datos/AffectNet/expresiones individuales/df_4.csv')
df_5 = pd.read_csv('datos/AffectNet/expresiones individuales/df_5.csv')
df_6 = pd.read_csv('datos/AffectNet/expresiones individuales/df_6.csv') 

df_unido = pd.concat([df_0,df_1, df_2, df_3, df_4, df_5, df_6], ignore_index=True) 

df_unido.to_csv('datos/AffectNet/df_AffectNet_formato.csv', index=False)"""