<a href="https://colab.research.google.com/github/RodolfoFerro/dl-facilito-g2/blob/main/notebooks/Deep_Learning_Clase_4.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Drowsiness Detection

> **Descripción:** Este proyecto consiste en el entrenamiento de una red neuronal para determinar la somnolencia de conductos a través de la detección de los ojos cerrados.<br>
> **Autor:** [Pablo Juárez del Valle] <br>
> **Contacto:** [Gmail](pablo.juarezdelvalle@gmail.com) 


## Contenido

### Preámbulo

- Reconocimiento de imagenes

### Definición del problema

La Organización Mundial de la Salud (OMS) estima que anualmente 1,35 millones de personas en el mundo resultan víctimas mortales por lesiones del tránsito y entre 20 y 50 millones padecen secuelas físicas y psicológicas, siendo esta una de las principales causas de discapacidad [1]. En Argentina, considerando el año 2019 por ser el último anterior a la aparición de la pandemia a causa del COVID-19 (hecho que modificó los datos de movilidad a nivel nacional), la Agencia Nacional de Seguridad Vial (ANSV) registró 99.221 siniestros viales con víctimas [2], los cuales dejaron como consecuencia 4.911 personas fallecidas a causa de la inseguridad vial en Argentina.

El estrés es la reacción del cuerpo a un desafío o demanda que puede provenir de cualquier situación o pensamiento de furia, ansiedad, nervios o frustración. En cambio, la fatiga, si bien coloquialmente es sinónimo de cansancio y ambas palabras se utilizan indistintamente, se encuentra acompañada de otros síntomas generales como dolor generalizado, ansiedad, depresión, apatía, alteraciones del sueño, o alteraciones de la memoria o de la concentración; mientras que el cansancio se origina como consecuencia de una actividad física [3].

El estrés y la fatiga son factores de riesgo que, en general, son difíciles de medir y ser admitidos por las/os parecientes; mucho más cuando se presentan en rubros laborales donde la conducción de vehículos es la tarea principal y la prolongación del horario tras el volante reditúa económicamente. Conducir es una tarea compleja que involucra aspectos como la percepción, el tiempo de respuesta y la capacidad física, haciendo de la coordinación moto-sensorial un punto fundamental para realizar maniobras que requieren de varios movimientos simultáneos y de manera coordinada. En tal sentido, y en línea con la literatura especializada, se entiende a la conducción de vehículos bajo fatiga y/o estrés como uno de los principales factores de riesgo de la siniestralidad vial [4].

### Objetivos

El objetivo del proyecto consiste en diseñar una ANN convolucional y entrenarla para la detección de somnolencia mediante la obtención de fotos. Los datos de entrenamiento son obtenidos de Kaggle. [5]
1. Se implementará una red convolucional siguiendo el modelo LeNet5 de Yann LeCun para su entrenamiento y posterior predicción.
2. Se desarrollará una API para cargar fotos de ojos y detectar la somnolencia.
3. Sentar las bases del prototipo para implementarlo en un dispositivo que pueda instalarse en un vehiculo y mediante la toma de fotos pueda detectar si el conductor tiene sueño.

#### Referencias

1. <a href="www.who.int/publications/i/item/9789241565684">OMS (2018): Global Status Report on Road Safety.</a>
2. <a href="www.argentina.gob.ar/sites/default/files/2018/12/ansv_ov_anuario_estadistico_2019_final.pdf">Anuario nuario Estadístico de la Seguridad Vial 2019 de la ANSV.</a>
3. <a href="https://www.infosalus.com/salud-investigacion/noticia-fatiga-cuando-debemos-sospechar-algo-no-va-bien-20210720083435.html">Publicación del 20-7-2021 en el sitio Infosalus.com, editado por Europapress, España.</a>
4. <a href="www.argentina.gob.ar/sites/default/files/ansv_observatorio_situacion_seguridad_vial_arg.pdf">ANSV (2018): Situación de la seguridad vial en Argentina.</a> 
5. <a href="https://www.kaggle.com/datasets/prasadvpatil/mrl-dataset">Detección de somnolencia en conductores</a>




## **Preámbulo**

### Redes Convolucionales


Una red neuronal convolucional es un tipo de red neuronal artificial donde las neuronas artificiales, corresponden a campos receptivos de una manera muy similar a las neuronas en la corteza visual primaria de un cerebro biológico, es decir distintas capas. Donde cada capa en la que el modelo convoluciona, aplica un filtro por ejemplo, aportando información.
Este tipo de redes son muy efectivas para tareas de visión artificial, como en la clasificación y segmentación de imágenes, entre otras aplicaciones.​ 

Un modelo de red neuronal convolucional profunda, muy difundido por el investigador Yann LeCun, es el modelo LeNet5.

<center>
    <img src="https://www.datasciencecentral.com/wp-content/uploads/2021/10/1lvvWF48t7cyRWqct13eU0w.jpeg" width="60%">
</center>

### Código

In [3]:
#Importación de librerias
import numpy as np 
import pandas as pd 
import os
import tensorflow as tf

from glob import glob
from tqdm import tqdm

import matplotlib.pyplot as plt
from PIL import Image

ModuleNotFoundError: No module named 'numpy'

In [4]:
#CARGA DE IMAGENES
from google.colab import drive
drive.mount('/content/drive')

dir="drive/MyDrive/train"

X = []
Y = []

for i in tqdm(glob(dir + '/Open_Eyes/*')):
    temp = np.array(Image.open(i).resize((64,64)))
    X.append(temp)
    Y.append(1)
    
for i in tqdm(glob(dir + '/Closed_Eyes/*')):
    temp = np.array(Image.open(i).resize((64,64)))
    X.append(temp)
    Y.append(0)

NameError: name 'tqdm' is not defined

In [None]:
#NORMALIZANDO LAS IMAGENES

# SIN ALGORITMO
# X = np.array(X)
# X = X/255.0
# Y = np.array(Y)

# MIN-MAX SCALING ALGORITHM
X = (np.array(X) - np.min(X)) / (np.max(X) - np.min(X))
X = X/255.0
Y = (np.array(Y) - np.min(Y)) / (np.max(Y) - np.min(Y))

# zERO STORE ALGORITHM
# 'X = (np.array(X) - np.mean(X)) / np.std(X)
# X = X/255.0
# Y = (np.array(Y) - np.mean(Y)) / np.std(Y)'

In [None]:
#EXPANDIENDO LAS DIMENSIONES DEL VECTOR
X = np.expand_dims(X,-1)

In [None]:
#DIVIDIENDO LOS DATOS EN DATOS DE ENTRANAMIENTO Y PRUEBA
from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(X, Y, test_size=0.33, random_state=42)

In [None]:
#MODELO DE LA RED NEURONAL
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Input, Conv2D, BatchNormalization, MaxPooling2D,Dropout, Flatten

model = tf.keras.models.Sequential([
      Input(shape=(64, 64, 1)),

      Conv2D(filters = 32, kernel_size = 5, strides = 1, activation = 'relu'),
      Conv2D(filters = 32, kernel_size = 5, strides = 1, activation = 'relu', use_bias=False),
      BatchNormalization(),
      MaxPooling2D(strides = 2),
      Dropout(0.3),

      Conv2D(filters = 64, kernel_size = 3, strides = 1, activation = 'relu'),
      Conv2D(filters = 64, kernel_size = 3, strides = 1, activation = 'relu', use_bias=False),
      BatchNormalization(),
      MaxPooling2D(strides = 2),
      Dropout(0.3),

      Flatten(),
      Dense(units  = 256, activation = 'relu', use_bias=False),
      BatchNormalization(),

      Dense(units = 128, use_bias=False, activation = 'relu'),

      Dense(units = 84, use_bias=False, activation = 'relu'),
      BatchNormalization(),
      Dropout(0.3),

      Dense(units = 1, activation = 'sigmoid')
  ])

COMPILANDO EL MODELO.

In [None]:
model.compile(loss='binary_crossentropy',optimizer='adam', metrics=['accuracy'])

In [None]:
#ENTRENANDO EL MODELO
callback = tf.keras.callbacks.ModelCheckpoint(
    filepath= dir + 'bestModel.h5',
    save_weights_only=False,
    monitor='val_loss',
    mode='min',
    save_best_only=True,
    verbose =1)
model.fit(x_train, y_train, validation_split=0.2, epochs=30, batch_size=32, callbacks=callback)

In [None]:
#EVALUANDO EL MODELO
model.evaluate(x_test, y_test)

In [None]:
#PERFORMANCE DEL MODELO
from keras.models import load_model
best_model = load_model(dir + '/bestModel.h5')
best_model.evaluate(x_test, y_test)

In [None]:
#Predecir Fotos Reales
for i in tqdm(glob(dir + '/Pruebas/*')):
    temp = np.array(Image.open(i).resize((64,64)))
    #temp = (np.array(temp) - np.min(temp)) / (np.max(temp) - np.min(temp))
    temp = temp/255.0
    plt.imshow(temp)
    plt.show()
    print(temp)
    plt.imshow(x_test[322])
    plt.show()
    print(x_test[322])
    #result = best_model.predict(temp)
    #print(result)

In [None]:
#CAMBIANDO LAS DIMENSIONES Y REEPLOTEANDO LAS IMAGENES
for i in x_test[0:5]:
    result = best_model.predict(np.expand_dims(i,0))
    plt.imshow(i)
    plt.show()
    
    if result > 0.5:
        print('Open')
    else:
        print("Closed")

In [None]:
#PREDICCION Y MATRIZ CONFUSION
from sklearn.metrics import confusion_matrix
import seaborn as sns

plt.figure(figsize=(15, 5))

preds = best_model.predict(x_test)
preds = (preds >= 0.5).astype(np.int32)
cm = confusion_matrix(y_test, preds)
df_cm = pd.DataFrame(cm, index=['closed', 'Open'], columns=['Closed', 'Open'])
plt.subplot(121)
plt.title("Confusion matrix\n")
sns.heatmap(df_cm, annot=True, fmt="d", cmap="YlGnBu")
plt.ylabel("Predicted")
plt.xlabel("Actual")

In [None]:
#PRESICION
accuracy = best_model.evaluate(x_test, y_test)[1]
print("Accuracy:", accuracy)