## Descripción del Código en Python

Se empezará con el procesamiento de imágenes y la preparación de datos para un modelo de aprendizaje automático de reconocimiento de emociones.

### Importación de Bibliotecas

En esta sección, se importan las bibliotecas necesarias para el procesamiento de imágenes y la manipulación de datos. Las bibliotecas incluyen:

- `os`: Para operaciones relacionadas con el sistema operativo.
- `cv2` (OpenCV): Para el procesamiento de imágenes.
- `numpy` (abreviado como `np`): Para la manipulación de arreglos numéricos multidimensionales.
- `train_test_split` de `sklearn.model_selection`: Para dividir los datos en conjuntos de entrenamiento y validación.

### Definición del Directorio de Datos

Se establece el directorio que contiene las imágenes y etiquetas de entrenamiento en la variable `data_dir`.

### Especificación del Tamaño de las Imágenes de Entrada

Se define el tamaño deseado para las imágenes de entrada en la variable `img_size`.

### Enumeración de Emociones Disponibles

Se crea una lista llamada `emotions` que contiene las emociones disponibles como clases a predecir.

### Lectura de Imágenes y Etiquetas

El código realiza las siguientes acciones:

- Itera sobre cada emoción en la lista `emotions`.
- Para cada emoción, itera a través de los archivos en el directorio correspondiente.
- Lee las imágenes en escala de grises (usando `cv2.imread`) y las redimensiona al tamaño especificado en `img_size`.
- Las imágenes se almacenan en la lista `images`.
- Las etiquetas se almacenan en la lista `labels` como el índice de la emoción correspondiente en la lista `emotions`.

### Conversión de Listas a Arrays Numpy

Las listas `images` y `labels` se convierten en arrays numpy para su posterior procesamiento. Además, las imágenes se normalizan dividiendo sus valores de píxeles por 255.0.

### División de Datos en Conjuntos de Entrenamiento y Validación

Los datos se dividen en conjuntos de entrenamiento (`train_images` y `train_labels`) y validación (`val_images` y `val_labels`) utilizando la función `train_test_split` de scikit-learn. El 20% de los datos se asigna al conjunto de validación, y el generador de números aleatorios se inicializa con una semilla de 42 para asegurar la reproducibilidad.


In [None]:
import os
import cv2
import numpy as np
from sklearn.model_selection import train_test_split

# Directorio que contiene las imágenes de caras y las etiquetas
data_dir = 'DataSet/images/images/train/'

# Tamaño de las imágenes de entrada
img_size = (48, 48)

# Lista de emociones disponibles
emotions = ['angry', 'disgust', 'fear', 'happy', 'neutral', 'sad', 'surprise']

# Leer las imágenes y las etiquetas
images = []
labels = []
for emotion in emotions:
    emotion_dir = os.path.join(data_dir, emotion)
    for filename in os.listdir(emotion_dir):
        if filename.endswith('.jpg'):
            img = cv2.imread(os.path.join(emotion_dir, filename), cv2.IMREAD_GRAYSCALE)
            img = cv2.resize(img, img_size)
            images.append(img)
            labels.append(emotions.index(emotion))

# Convertir las listas a arrays numpy
images = np.array(images)
images = images / 255.0
labels = np.array(labels)

# Dividir los datos en conjuntos de entrenamiento y validación
train_images, val_images, train_labels, val_labels = train_test_split(images, labels, test_size=0.2, random_state=42)


## Descripción del Modelo de Red Neuronal Convolucional (CNN)

A continuación se compila un modelo de Red Neuronal Convolucional (CNN) utilizando las bibliotecas TensorFlow y Keras para el reconocimiento de emociones en imágenes. A continuación, se presenta una descripción formal de lo que hace el código:

### Creación del Modelo CNN

1. **Capa Convolucional 1**: Se añade una capa convolucional con 32 filtros y una función de activación ReLU. La entrada de la capa tiene el tamaño especificado en `img_size`. Esta capa realiza la detección de características en las imágenes.

2. **Capa de Agrupación 1 (MaxPooling)**: Se añade una capa de agrupación (pooling) MaxPooling para reducir el tamaño de la representación y conservar las características más importantes.

3. **Capa Convolucional 2**: Se agrega otra capa convolucional con 64 filtros y función de activación ReLU.

4. **Capa de Agrupación 2 (MaxPooling)**: Se añade otra capa de agrupación MaxPooling.

5. **Capa Convolucional 3**: Se agrega una tercera capa convolucional con 128 filtros y función de activación ReLU.

6. **Capa de Agrupación 3 (MaxPooling)**: Se incluye una tercera capa de agrupación MaxPooling.

7. **Capa de Aplanamiento (Flatten)**: La salida de la última capa de agrupación se aplana para prepararla para las capas completamente conectadas.

8. **Capa Completamente Conectada 1**: Se añade una capa completamente conectada con 256 neuronas y función de activación ReLU.

9. **Capa de Dropout**: Para evitar el sobreajuste, se agrega una capa de dropout que desactiva aleatoriamente un 50% de las neuronas durante el entrenamiento.

10. **Capa Completamente Conectada 2 (Capa de Salida)**: La capa de salida tiene un número de neuronas igual a la cantidad de emociones disponibles. Utiliza la función de activación softmax para realizar la clasificación multiclase de las emociones.

### Compilación del Modelo

El modelo se compila utilizando las siguientes configuraciones:

- **Función de Pérdida**: Se utiliza la función de pérdida 'sparse_categorical_crossentropy' para problemas de clasificación multiclase.

- **Optimizador**: Se emplea el optimizador 'adam' para ajustar los pesos de la red durante el entrenamiento.

- **Métrica de Evaluación**: La métrica de evaluación se establece como 'accuracy' para supervisar la precisión del modelo durante el entrenamiento.

Este modelo de CNN se utilizaría para entrenar un clasificador de emociones basado en imágenes y se podría ajustar y entrenar utilizando los datos de entrenamiento y validación previamente preparados.


In [None]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Dropout, Flatten, Dense
#import tf.keras.applications.resnet

# Crear el modelo
model = Sequential()

# Capa convolucional
model.add(Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=(img_size[0], img_size[1], 1)))

# Capa de agrupación
model.add(MaxPooling2D(pool_size=(2, 2)))

# Capa convolucional
model.add(Conv2D(64, kernel_size=(3, 3), activation='relu'))

# Capa de agrupación
model.add(MaxPooling2D(pool_size=(2, 2)))

# Capa convolucional
model.add(Conv2D(128, kernel_size=(3, 3), activation='relu'))

# Capa de agrupación
model.add(MaxPooling2D(pool_size=(2, 2)))

# Capa completamente
model.add(Flatten())
model.add(Dense(256, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(len(emotions), activation='softmax'))

# Compilar el modelo
model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])


## Entrenamiento del Modelo de Red Neuronal Convolucional (CNN)

Se entrena modelo de Red Neuronal Convolucional (CNN) utilizando los datos de entrenamiento y validación que han sido preparados previamente.
### Entrenamiento del Modelo

1. `model.fit(train_images, train_labels, epochs=30, validation_data=(val_images, val_labels))`

   - El método `fit` se utiliza para entrenar el modelo.
   - `train_images` y `train_labels` son los datos de entrenamiento de las imágenes y las etiquetas asociadas.
   - `epochs=30` indica que el modelo se entrenará durante 30 épocas completas. Una época es un ciclo a través de todo el conjunto de datos de entrenamiento.
   - `validation_data=(val_images, val_labels)` especifica el conjunto de datos de validación que se utilizará para evaluar el rendimiento del modelo después de cada época de entrenamiento.



In [None]:
# Entrenar el modelo
model.fit(train_images, train_labels, epochs=30, validation_data=(val_images, val_labels))


Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<keras.callbacks.History at 0x23205b978b0>

In [None]:
# Cargar los datos de prueba
test_dir = 'DataSet/images/validation/'
test_images = []
test_labels = []
for emotion in emotions:
    emotion_dir = os.path.join(test_dir, emotion)
    for filename in os.listdir(emotion_dir):
        if filename.endswith('.jpg'):
            img = cv2.imread(os.path.join(emotion_dir, filename), cv2.IMREAD_GRAYSCALE)
            img = cv2.resize(img, img_size)
            test_images.append(img)
            test_labels.append(emotions.index(emotion))
test_images = np.array(test_images)
test_labels = np.array(test_labels)

# Evaluar el modelo en los datos de prueba
loss, accuracy = model.evaluate(test_images, test_labels)
print('Test accuracy:', accuracy)


Test accuracy: 0.4196150600910187


In [7]:
# Cargar una imagen de cara nueva
import os
import cv2
import numpy as np
from sklearn.model_selection import train_test_split



# Tamaño de las imágenes de entrada
img_size = (48, 48)

# Lista de emociones disponibles
emotions = ['angry', 'disgust', 'fear', 'happy', 'neutral', 'sad', 'surprise']
new_img = cv2.imread('face0.png', cv2.IMREAD_GRAYSCALE)
new_img = cv2.resize(new_img, img_size)

# Hacer una predicción sobre la emoción de la cara
prediction = model.predict(np.array([new_img]))
predicted_emotion = emotions[np.argmax(prediction)]
print('Predicted emotion:', predicted_emotion)


Predicted emotion: surprise


In [6]:
from tensorflow.keras.models import load_model
model = load_model('my_model.h5')


In [6]:
import cv2
import numpy as np
from tensorflow.keras.models import load_model

# Cargar el modelo
model = load_model('my_model.h5')

# Definir las emociones y colores correspondientes
emotions = ['angry', 'disgusted', 'fearful', 'happy', 'neutral', 'sad', 'surprised']
colors = [(255,0,0), (0,255,0), (0,0,255), (255,255,0), (255,255,255), (0,0,0), (255,0,255)]

# Cargar el clasificador de Haar Cascade para la detección de rostros
face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_frontalface_default.xml')

# Usar la cámara predeterminada
cap = cv2.VideoCapture(0) 

while True:
    # Capturar el siguiente cuadro del video
    ret, frame = cap.read() 
    if not ret:
        break
        
    # Convertir a escala de grises
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) 
    
    # Detectar rostros en la imagen
    faces = face_cascade.detectMultiScale(gray, 1.3, 5)
    
    # Recortar la región de interés (ROI) de la imagen original
    for (x,y,w,h) in faces:
        face_img = gray[y:y+h, x:x+w]
        face_img = cv2.resize(face_img, (48, 48)) # Redimensionar a 48x48 (tamaño de entrada del modelo)
        prediction = model.predict(np.array([face_img]))
        predicted_emotion = emotions[np.argmax(prediction)]
        color = colors[np.argmax(prediction)]
        cv2.putText(frame, predicted_emotion, (x, y-10), cv2.FONT_HERSHEY_SIMPLEX, 1, color, 2)
        cv2.rectangle(frame,(x,y),(x+w,y+h),color,2)
    
    cv2.imshow('Emotion Detection', frame) # Mostrar el cuadro con la emoción detectada
    
    # Salir con la tecla 'q'
    if cv2.waitKey(1) & 0xFF == ord('q'): 
        break

cap.release()
cv2.destroyAllWindows()

In [24]:
# Cargar una imagen de cara nueva
import os
import cv2
import numpy as np
from tensorflow.keras.models import load_model

model = load_model('my_model.h5')


# Load the cascade
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_alt.xml')

img = cv2.imread('Images/Triste.jpg')
img_height, img_width, _ = img.shape
aspect_ratio = img_width / img_height
new_height = 256
new_width = int(new_height * aspect_ratio)
img_resized = cv2.resize(img, (new_width, new_height))
gray = cv2.cvtColor(img_resized, cv2.COLOR_BGR2GRAY)

faces = face_cascade.detectMultiScale(gray, 1.06, 4)
print(faces)


i = 0
# Crear una copia de la imagen original
img_copy = img_resized.copy()
for (x, y, w, h) in faces:
    # Dibujar el rectángulo en la copia
    cv2.rectangle(img_copy, (x, y), (x + w, y + h), (255, 0, 0), 2)
    # Ampliar la ROI
    roi_x = max(x - int(w*0.1), 0)
    roi_y = max(y - int(h*0.1), 0)
    roi_w = min(int(w*1.2), img_resized.shape[1]-roi_x)
    roi_h = min(int(h*1.2), img_resized.shape[0]-roi_y)
    # Extraer la ROI de la imagen original
    face_img = img_resized[roi_y:roi_y+roi_h, roi_x:roi_x+roi_w]
    # Guardar la imagen de la cara sin el rectángulo
    cv2.imwrite(f'face{i}.png', face_img)
    # Incrementar el contador
    i += 1
    
# Tamaño de las imágenes de entrada
img_size = (48, 48)



for foto in range(i):
    filename = f"face{i}.png"
    if os.path.isfile(filename):
        # Lista de emociones disponibles
        emotions = ['angry', 'disgust', 'fear', 'happy', 'neutral', 'sad', 'surprise']
        new_img = cv2.imread(filename, cv2.IMREAD_GRAYSCALE)
        new_img = cv2.resize(new_img, img_size)

        # Hacer una predicción sobre la emoción de la cara
        prediction = model.predict(np.array([new_img]))
        predicted_emotion = emotions[np.argmax(prediction)]
        print('Predicted emotion:', predicted_emotion)


[[ 72   5 179 179]]
Predicted emotion: happy
