<img src="images/iebs-logo.jpg" alt="Logo IEBS" align="center">
<br><br>
<h1><font color="#113D68" size=5>Análisis predictivo con Deep Learning</font></h1>



<h1><font color="#113D68" size=6>Caso Práctico: Análisis problema de clasificación con Deep Learning</font></h1>


<br><br>
<div style="text-align: right">
<font size=3>Laura Cristina López Bedoya</font><br>
<font size=3>Caso práctico</font><br>
<font size=3>IEBS</font>
</div>

---

<a id="indice"></a>
<h2><font color="#004D7F" size=5>Índice</font></h2>

* [Caso práctico](#section1)
    - [Parte obligatoria](#section1.1)
    - [Parte opcional](#section1.2)
    - [Objetivos](#section1.3)
    - [Criterios de entrega](#section1.4)
    - [Temporalización](#section1.5)
* [CIFAR10 Dataset](#section2)
* [Experimentos con redes neuronales densas](#section3)
    - [Experimento 1](section3.1)
    - [Experimento 2](section3.2)
* [Experimentos con CNNs](#section4)
    - [Experimento 3](section4.1)
    - [Experimento 4](section4.2)
* [Experimento Opcional](#section5)
* [Conclusión](#section6)

In [None]:
import tensorflow as tf
import numpy as np

# Para mostrar gráficas
import matplotlib.pyplot as plt
%matplotlib inline

# Anaconda fixing problem
import os
os.environ['KMP_DUPLICATE_LIB_OK']='True'

<a id="section1"></a>
# <font color="#004D7F" size=5>Caso práctico</font>

El objetivo de este caso práctico es simular como se haría un análisis completo de un problema para resolverlo con Deep Learning. Nos pondremos en la piel de un *data scientist* dedicado a analizar y crear modelos de Deep Learning para pasarlos a producción y ser desplegados en una aplicación.

Imaginemos que tenemos un dataset completo que queremos explotar, nuestra labor será coger este dataset de imágenes (CIFAR10) y realizar varios experimentos con distintas redes para descubrir cual funciona mejor y cual elegimos para pasar a producción. Por lo que además de tener que entrerar distintas redes y entender qué ha pasado en cada entrenamiento explicando el resultado, al final deberemos justificar cual de todos los modelos entrenados es el más óptimo para pasar a producción.

Cada experimento que tendremos que realizar estará bien definido, la red que deberéis crear y entrenar será proporcionada por lo que solamente tendréis que crear la red que se nos indica con TensorFlow y realizar el entrenamiento de la misma. Por cada experimento deberéis de sacar conclusiones de cómo de bueno o malo ha sido ese entrenamiento. Al final de todos los experimentos, deberemos de generar una pequeña documentación donde justificamos cual de los modelos entrenados es el más óptimo para pasar a producción.

<a id="section1.1"></a>
# <font color="#004D7F" size=4>Parte obligatoria</font>

Será obligatorio realizar cada uno de los experimentos que están definidos. En cada experimento está definida la red que se tiene que crear y la configuración con la que se tiene que entrenar, por lo que solamente tendréis que pasar esa definición a código con TensorFlow. Al finalizar cada experimento se deberá genera una pequeña documentación explicando cómo ha sido el entrenamiento y sacando conclusiones de los resultados.

Al final, después de realizar cada uno de los experimentos, se deberá de generar una pequeña documentación justificando cual de los modelos entreados es el óptimo para ser desplegado en producción.

Es muy importante destacar que el objetivo de este caso práctico no es que obtengáis unos resultados muy buenos, de echo los resultados que obtendréis son los pre-definidos por las redes que tenéis que hacer. El objetivo principal es que veáis como se aborda un problema para ser resuelto con Deep Learning, donde partimos de un dataset y un objetivo, y vamos realizando diferentes experimentos hasta encontrar la solución más óptima que podemos llegar a desplegar en producción. Además, otro objetivo es que entendáis que estáis haciendo y los resultados que obtenéis con cada experimento: sin son buenos o malos, si hay sobreajuste en los datos de entrenamiento, si nuestra red no termina por aprender, si nuestra red se estanca en algún punto y ya no aprende más, etc.

Para tener una buena práctica en la realización de este caso práctico se ofrecen esta recomendaciones:

- Utiliza correctamente el sistema de celdas de jupyter. La libreta está realizada de tal forma que solo tendréis que completar las celdas que se indican, ya sea con código o con texto en markdown. Se recomienda rellenar solamente las celdas indicadas para que quede un informe limpio y fácil de seguir. Si fuera necesario incluir más celdas por cualquier motivo se puede hacer pero realizarlo con cuidado para no ensuciar demasiado la libreta.
<br><br>
- Las redes que tendréis que crear en cada experimento son las vistas en clase, por lo que os podéis inspirar en los ejemplos vistos en los tutoriales. Os recomiendo que no copiéis y peguéis código tal cual, sino que lo escribáis por vuestra cuenta y entendáis lo que estáis haciendo en cada momento. Tomaros el tiempo que haga falta para entender cada paso.
<br><br>
- Comprueba que todo se ejecuta correctamente antes de enviar tu trabajo. La mejor forma de enviarlo es exportando la libreta a pdf o html para enviarla en un formato más profesional.


<a id="section1.2"></a>
# <font color="#004D7F" size=4>Parte opcional</font>
La parte opcional se trata de que vosotros creéis vuestra propia red neuronal para obtener mejores resultados que los de la parte obligatoria. Obviamente no es obligatorio conseguir mejores resultados. Se os indicarán algunan pautas adicionales para poder crear vuestra propia red de la nada. ¡Esta parte podéis verla como un reto!

<a id="section1.3"></a>
# <font color="#004D7F" size=4>Objetivos</font>
* Cargar y entender los datos del dataset CIFAR10 con los que se trabajarán.
* Crear cada una de las redes indicadas en los experimentos.
* Entrenar cada una de las redes creadas en los experimentos.
* Escribir un pequeño texto explicando el resultado de cada entrenamiento.
* Escribir un pequeño texto de conclusión al final del cuaderno justificando el modelo elegido para desplegar.

<a id="section1.4"></a>
# <font color="#004D7F" size=4>Criterios de entrega</font>
Se deberá entregar una libreta de jupyter en formato html o pdf, el trabajo debe estar autocontenido, incluyendo código y texto explicativo para cada sección. 

<a id="section1.5"></a>
# <font color="#004D7F" size=4>Temporalización</font>
* Fase 1: Instala y familiarizate con todo el entorno de trabajo.
* Fase 2: Cargar los datos y familizarizarse con ellos.
* Fase 3: Realizar cada uno de los experimentos indicados.
* Fase 4: Escribir un texto de conclusión al final.

<a id="section2"></a>
# <font color="#004D7F" size=5>CIFAR10 dataset</font>

Este dataset es el que hemos visto en la clase anterior y con el que trabajaremos en el caso práctico. Para refresarlo, es un dataset que contiene imágenes en color de objetos que tenemos que clasificar.

El dataset de de imágenes CIFAR10 tiene las siguintes características:
- Imágenes de 10 tipos de objetos: aviones, automóbiles, pájaros, gatos, ciervos, perros, ranas, caballos, barcos y camiones.
- Imágenes en color, es decir, cada pixel tiene 3 valores entre 0 y 255, esos valores corresponden a los valores de RGB (Red, Green, Blue).
- Imágenes de tamaño 32x32x3, 32x32 píxeles y 3 valores por pixel.
- 50.000 imágenes para el entrenamiento y 10.000 imágenes para el test.

<br><br>
<img src="images/rgb-image.png" align="center" width="400">

Para empezar debemos descargar los datos de las bases de datos de Tensorflow.

In [None]:
cifar10 = tf.keras.datasets.cifar10
(x_train, y_train), (x_test, y_test) = cifar10.load_data()
labels = ['airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']

Normalizamos los valores entre 0 y 1.

In [None]:
x_train = x_train / 255.0
x_test = x_test / 255.0

#### COMPLETAR: familiarizate con el dataset accediendo a los elementos, viendo los tamaños, los valores, etc.

In [None]:
#Visualizar los datos
def visualizar_img (imagen):
    elem = plt.figure(figsize=(20,20))
    index = np.random.randint(len(imagen), size=100)
    for i in range(100):
        elem.add_subplot(20,20,i+1)
        plt.axis("off")
        plt.imshow(imagen[index[i]].reshape([32,32,3]))
    plt.show()
    
visualizar_img(x_train)

In [None]:
print("Numero de imagenes usadas para entrenamiento: ", x_train.shape[0])
print("Tamaño de las imagenes de entrenamiento: ",x_train.shape[1:])
print("Numero de imagenes usadas para prueba: ", x_test.shape[0])
print("Tamaño de las imagenes de prueba: ", x_test.shape[1:])
print("Tamaño del dato que se obtiene como resultado: ", y_train.shape[1])

### Visualizar un dato:

In [None]:
print("Dato: ",labels[y_train[21][0]])

dato=plt.figure(figsize=(2,2))
plt.imshow(x_train[21].reshape([32, 32, 3]))
plt.show()

<a id="section3"></a>
# <font color="#004D7F" size=5>Experimentos con redes neuronales densas</font>
A continuación, realizar 2 experimentos usando redes neuronales densas con las redes que se te indican en cada sección.

<a id="section3.1"></a>
# <font color="#004D7F" size=4>Experimento 1</font>

Arquitectura de la red:

- Capa de aplanado `Flatten` con entrada `(32,32,3)`
- Capa densa `Dense` con 10 neuronas y función de activación _ReLU_
- Capa de salida densa `Dense` con 10 neuronas y función de activación _Softmax_

Configuración del entrenamiento:

- Optimizador: Adam con factor de entrenamiento 0.01
- Función de error: `sparce_categorical_crossentropy`
- Métricas: `accuracy`
- Número de *epochs*: 20

#### COMPLETAR: crear y entrena la red neuronal indicada arriba

### Modelo

In [None]:
model1 = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape = (32,32,3)),
    tf.keras.layers.Dense(10, activation='relu'),
    tf.keras.layers.Dense(10, activation='softmax')
])

model1.summary()

### Entrenamiento

In [None]:
#Optimizador
opt = tf.keras.optimizers.Adam(learning_rate=0.01)

#Compilar modelo
model1.compile(optimizer=opt,
               loss='sparse_categorical_crossentropy',
               metrics=['accuracy'])

#Entrenar el modelo
modelfit = model1.fit(x_train, y_train, validation_data=(x_test,y_test), epochs=20)

In [None]:
#Evaluar el modelo
fig=plt.figure(figsize=(70, 30))

fig.add_subplot(10, 10, 1)
plt.plot(modelfit.history['loss'], label='loss')
plt.plot(modelfit.history['val_loss'], label='val_loss')
plt.legend()

fig.add_subplot(10, 10, 2)
plt.plot(modelfit.history['accuracy'], label='acc')
plt.plot(modelfit.history['val_accuracy'], label='val_acc')
plt.legend()

plt.show()

#### COMPLETAR: escribe un pequeño texto con los resultado obtenidos

Para la red neuronal anterior se entrenaron 30,840 parámetros.
Los resultados obtenidos en el entrenamiento tienen una precisión entre 9% y 10% para el conjunto de entrenamiento y un 10% para el conjunto de validación. 
En las gráficas podemos observar que el error varia poco para el conjunto de entrenamiento y prueba, sin embargo, el rendimiento del modelo para el conjunto de entrenamiento tiene grandes cambios y el de prueba permanece constante.
Este modelo no presenta buenos resultados dado que la precisión es muy baja y el porcentaje de error es muy alto.

<a id="section3.2"></a>
# <font color="#004D7F" size=4>Experimento 2</font>

Arquitectura de la red:

- Capa de aplanado `Flatten` con entrada `(32,32,3)`.
- Capa densa `Dense` con 32 neuronas y función de activación _ReLU_.
- Capa densa `Dense` con 64 neuronas y función de activación _ReLU_.
- Capa densa `Dense` con 128 neuronas y función de activación _ReLU_.
- Capa de salida densa `Dense` con 10 neuronas y función de activación _Softmax_.

Configuración del entrenamiento:

- Optimizador: Adam con factor de entrenamiento 0.001
- Función de error: `sparce_categorical_crossentropy`.
- Métricas: `accuracy`.
- Número de _epochs_: 40

#### COMPLETAR: crear y entrena la red neuronal indicada arriba

### Modelo

In [None]:
model2 = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape = (32,32,3)),
    tf.keras.layers.Dense(32, activation='relu'),
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(10, activation='softmax')
])

model2.summary()

### Entrenamiento

In [None]:
#Optimizador
opt = tf.keras.optimizers.Adam(learning_rate=0.001)

#Compilar modelo
model2.compile(optimizer=opt,
               loss='sparse_categorical_crossentropy',
               metrics=['accuracy'])

#Entrenar el modelo
modelfit2 = model2.fit(x_train, y_train, validation_data=(x_test,y_test), epochs=40)

In [None]:
#Evaluar el modelo
fig=plt.figure(figsize=(70, 30))

fig.add_subplot(10, 10, 1)
plt.plot(modelfit2.history['loss'], label='loss')
plt.plot(modelfit2.history['val_loss'], label='val_loss')
plt.legend()

fig.add_subplot(10, 10, 2)
plt.plot(modelfit2.history['accuracy'], label='acc')
plt.plot(modelfit2.history['val_accuracy'], label='val_acc')
plt.legend()

plt.show()

#### COMPLETAR: escribe un pequeño texto con los resultado obtenidos

Para la red neuronal anterior se entrenaron 110,058 parámetros.
Los resultados obtenidos en el entrenamiento tienen una precisión de 45% para el conjunto de entrenamiento y un 41% para el conjunto de validación. 
En las gráficas podemos observar que el error disminuye para el conjunto de entrenamiento y prueba en cada iteración, además, el rendimiento del modelo para el conjunto de entrenamiento y el de prueba aumenta.
Este modelo presenta mejores resultados que el anterior (ejercicio 1), sin embargo, en las gráficas se observa un sobreajuste dado que la precisión y el error presentan valores óptimos para los datos de entrenamiento que para los datos de prueba y en estos últimos la precisión disminuye y el error incrementar en las últimas iteraciones.

<a id="section4"></a>
# <font color="#004D7F" size=5>Experimentos con CNNs</font>
A continuación, realizar 2 experimentos usando redes convolucionales con las redes que se te indican en cada sección.

<a id="section4.1"></a>
# <font color="#004D7F" size=4>Experimento 3</font>

Arquitectura de la red:

- Capa convolucional `Conv2D` con 16 filtros/kernels, padding con relleno, activación *ReLU* y con entrada `(32,32,3)`
- Capa pooling `MaxPool2D` con reducción de 2 tanto en tamaño como en desplazamiento (stride) y padding con relleno.
- Capa de aplanado `Flatten`.
- Capa densa `Dense` con 64 neuronas y función de activación _ReLU_.
- Capa densa `Dense` con 32 neuronas y función de activación _ReLU_.
- Capa de salida densa `Dense` con 10 neuronas y función de activación _Softmax_.

Configuración del entrenamiento:

- Optimizador: Adam con factor de entrenamiento 0.0001
- Función de error: `sparce_categorical_crossentropy`.
- Métricas: `accuracy`.
- Número de _epochs_: 10

#### COMPLETAR: crear y entrena la red neuronal indicada arriba

In [None]:
#Definir la red:
model3 = tf.keras.models.Sequential([
    tf.keras.layers.Conv2D(16, (3, 3), padding="same", activation="relu", input_shape=(32,32,3)),
    tf.keras.layers.MaxPool2D(pool_size=(2, 2), strides=(2, 2), padding="same"),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dense(32, activation='relu'),
    tf.keras.layers.Dense(10, activation='softmax')
])

#Optimizador
opt = tf.keras.optimizers.Adam(learning_rate=0.0001)

#Compilar el modelo
model3.compile(optimizer=opt,
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

#Entrenar el modelo
modelfit3 = model3.fit(x_train, y_train, validation_data=(x_test,y_test), epochs=10)

#Visualizar el modelo
model3.summary()

In [None]:
#Evaluar el modelo
fig=plt.figure(figsize=(70, 30))

fig.add_subplot(10, 10, 1)
plt.plot(modelfit3.history['loss'], label='loss')
plt.plot(modelfit3.history['val_loss'], label='val_loss')
plt.legend()

fig.add_subplot(10, 10, 2)
plt.plot(modelfit3.history['accuracy'], label='acc')
plt.plot(modelfit3.history['val_accuracy'], label='val_acc')
plt.legend()

plt.show()

#### COMPLETAR: escribe un pequeño texto con los resultado obtenidos

Para la red neuronal anterior se entrenaron 265,066 parámetros.
Los resultados obtenidos tienen una precisión de 59% para el conjunto de entrenamiento y un 57% para el conjunto de validación. 
En las gráficas podemos observar que el error disminuye para el conjunto de entrenamiento y prueba en cada iteración, además, el rendimiento del modelo para el conjunto de entrenamiento y el de prueba aumenta.
Aunque los resultados obtenidos han sido buenos, el error presentado en el entrenamiento y en la validación es mayor a 1, por lo que no se recomienda el uso de este modelo.
Este modelo presenta mejores resultados que los anteriores (ejercicio 1 y 2), en este caso la precisión aumenta con cada iteración y el modelo puede seguir aprendiendo, asimismo, el error disminuye con cada iteración para el entrenamiento y la validación del modelo.

<a id="section4.2"></a>
# <font color="#004D7F" size=4>Experimento 4</font>

Arquitectura de la red:

- Capa convolucional `Conv2D` con 32 filtros/kernels, padding con relleno, activación *ReLU* y con entrada `(32,32,3)`
- Capa pooling `MaxPool2D` con reducción de 2 tanto en tamaño como en desplazamiento (stride) y padding con relleno.
- Capa convolucional `Conv2D` con 64 filtros/kernels, padding con relleno y activación *ReLU*
- Capa pooling `MaxPool2D` con reducción de 2 tanto en tamaño como en desplazamiento (stride) y padding con relleno.
- Capa convolucional `Conv2D` con 64 filtros/kernels, padding con relleno y activación *ReLU*
- Capa pooling `MaxPool2D` con reducción de 2 tanto en tamaño como en desplazamiento (stride) y padding con relleno.
- Capa de aplanado `Flatten`.
- Capa densa `Dense` con 64 neuronas y función de activación _ReLU_.
- Capa de salida densa `Dense` con 10 neuronas y función de activación _Softmax_.

Configuración del entrenamiento:

- Optimizador: Adam con factor de entrenamiento 0.001
- Función de error: `sparce_categorical_crossentropy`.
- Métricas: `accuracy`.
- Número de _epochs_: 20


#### COMPLETAR: crear y entrena la red neuronal indicada arriba

In [None]:
#Definir la red:
model4 = tf.keras.models.Sequential([
    tf.keras.layers.Conv2D(32, (3, 3), padding="same", activation="relu", input_shape=(32,32,3)),
    tf.keras.layers.MaxPool2D(pool_size=(2, 2), strides=(2, 2), padding="same"),
    tf.keras.layers.Conv2D(64, (3, 3), padding="same", activation="relu", input_shape=(32,32,3)),
    tf.keras.layers.MaxPool2D(pool_size=(2, 2), strides=(2, 2), padding="same"),
    tf.keras.layers.Conv2D(64, (3, 3), padding="same", activation="relu", input_shape=(32,32,3)),
    tf.keras.layers.MaxPool2D(pool_size=(2, 2), strides=(2, 2), padding="same"),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dense(10, activation='softmax')
])

#Optimizador
opt = tf.keras.optimizers.Adam(learning_rate=0.001)

#Compilar el modelo
model4.compile(optimizer=opt,
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

#Entrenar el modelo
modelfit4 = model4.fit(x_train, y_train, validation_data=(x_test,y_test), epochs=20)

#Visualizar el modelo
model4.summary()

In [None]:
#Evaluar el modelo
fig=plt.figure(figsize=(70, 30))

fig.add_subplot(10, 10, 1)
plt.plot(modelfit4.history['loss'], label='loss')
plt.plot(modelfit4.history['val_loss'], label='val_loss')
plt.legend()

fig.add_subplot(10, 10, 2)
plt.plot(modelfit4.history['accuracy'], label='acc')
plt.plot(modelfit4.history['val_accuracy'], label='val_acc')
plt.legend()

plt.show()

#### COMPLETAR: escribe un pequeño texto con los resultado obtenidos

Para la red neuronal anterior se entrenaron 122,570 parámetros.
Los resultados obtenidos en el entrenamiento tienen una precisión del 90% para el conjunto de entrenamiento y un 73% para el conjunto de validación. 
En las gráficas podemos observar que el error disminuye para el conjunto de entrenamiento, pero aumenta para el conjunto de prueba en cada iteración, además, el rendimiento del modelo para el conjunto de entrenamiento aumenta y para el conjunto de prueba disminuye.
El error del modelo es menor a 1 para el conjunto de entrenamiento, pero mayor a 1 para el conjunto de prueba.
Aunque los resultados obtenidos han sido buenos, en las gráficas se observa un sobreajuste dado que la precisión y el error presentan valores óptimos para los datos de entrenamiento y no para los datos de prueba.

<a id="section4"></a>
# <font color="#004D7F" size=5>Parte Opcional</font>
Esta parte es totalmente opcional, se trata de realizar vuestra propia red neuronal con lo aprendido en clase para intentar mejorar lo aprendido en las anteriores redes o al menos acercarse a la red que mejor ha funcionado. El objetivo es que penséis en una posible red que creáis que puede funcionar y la pongáis en práctica para ver como funciona y expliquéis los resultados conseguido.

También os animos a que utilicéis otro tipo de capas que no hemos visto en clase (aquí tenéis todas: https://www.tensorflow.org/api_docs/python/tf/keras/layers). Y en especial os recomiendo la capa de tipo `Dropout` (podéis saber más sobre esta capa aquí y como utilizarla aquí: https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dropout).

A grandes rasgos, la capa `Dropout` hace que determinadas neuronas no se activen/usen durante el proceso de entrenamiento en momentos determinados. De esta forma incitamos a que las neuronas que no aprenden tanto, lo hagan. De esta forma tenemos un entrenamiento más completo distribuido por todas las neuronas. Esta capa ayuda a evitar el problema de sobreajuste, es decir, que el entrenamiento sea demasiado ajustado al conjunto de *train* pero no sea tan óptimo en el conjunto de test.

La capa `Dropout` se suele utilizar después de las capas de *Pooling*, y el valor que se suele dar es entre 0.1 y 0.5, que es el porcentaje de neuronas de la capa anterior que de forma aleatoria no se activan para ser entrendada. Por ejemplo, una capa `Dropout` tiene este aspecto:

```
...
tf.keras.layers.Dropout(0.5)
...
```

Podés saber más sobre este tipo de capa en este artículo: https://medium.com/@amarbudhiraja/https-medium-com-amarbudhiraja-learning-less-to-learn-better-dropout-in-deep-machine-learning-74334da4bfc5

In [None]:
#Definir la red:
modelx = tf.keras.models.Sequential([
    tf.keras.layers.Conv2D(32, (3, 3), padding="same", activation="relu", input_shape=(32,32,3)),
    tf.keras.layers.MaxPool2D(pool_size=(2, 2), strides=(2, 2), padding="same"),
    tf.keras.layers.Conv2D(64, (3, 3), padding="same", activation="relu", input_shape=(32,32,3)),
    tf.keras.layers.MaxPool2D(pool_size=(2, 2), strides=(2, 2), padding="same"),
    tf.keras.layers.Dropout(0.3),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dense(10, activation='softmax')
])

#Optimizador
opt = tf.keras.optimizers.Adam(learning_rate=0.001)

#Compilar el modelo
modelx.compile(optimizer=opt,
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

#Entrenar el modelo
modelfitx = modelx.fit(x_train, y_train, validation_data=(x_test,y_test), epochs=10)

#Visualizar el modelo
modelx.summary()

In [None]:
#Evaluar el modelo
fig=plt.figure(figsize=(70, 30))

fig.add_subplot(10, 10, 1)
plt.plot(modelfitx.history['loss'], label='loss')
plt.plot(modelfitx.history['val_loss'], label='val_loss')
plt.legend()

fig.add_subplot(10, 10, 2)
plt.plot(modelfitx.history['accuracy'], label='acc')
plt.plot(modelfitx.history['val_accuracy'], label='val_acc')
plt.legend()

plt.show()

Para la red neuronal anterior se entrenaron 282,250 parámetros.
Los resultados obtenidos tienen una precisión del 77% para el conjunto de entrenamiento y un 72% para el conjunto de validación. 
En las gráficas podemos observar que el error disminuye para el conjunto de entrenamiento y para el conjunto de prueba en cada iteración, además, el rendimiento del modelo para el conjunto de entrenamiento y para el conjunto de prueba aumenta.
El error del modelo es menor a 1 para ambos conjuntos de datos.
Aunque los resultados obtenidos han sido buenos, se puede visualizar que en las últimas iteraciones los porcentajes no sufren grandes cambios y es posible que la red este llegando a un punto donde no aprenda más.

<a id="section5"></a>
# <font color="#004D7F" size=5>Conclusión</font>
Una vez realizado todos los experimentos anteriores, ¿qué modelo elegirías para desplegar en producción? ¿Por qué? 

Explica en breves palabras qué modelo eligirías para desplegar en producción y porqué. Compara cada experimento y extráis tus propias conclusiones.

Los resultados han mejorado conforme se aumentan las capas en el modelo, creando redes más complejas y cambiando los hiperparámetros. Las redes convolucionales presentan mejores resultados que las redes densas, aunque para ambas redes se presentaron problemas de sobreajuste del modelo.
De los 4 experimentos elegiría el modelo del experimento 3 para desplegar en producción. Este modelo presenta buenos resultados en los porcentajes de precisión, aunque el error el mayor a 1, sin embargo, este modelo ha un menor porcentaje de sobreajuste y la precisión para el conjunto de prueba y entrenamiento ha sido similar.
Al elegir este modelo no significa que sea el óptimo o el más adecuado para el caso de estudio, se recomiendan hacer algunas modificaciones para mitigar un sobreajuste y evitar errores mayores en ambiente productivo.

<div style="text-align: center; font-size: 24px;">
    <img src="images/good-job.jpeg">
    <br>
    ¡Si has llegado hasta aquí deberías estar super orgullos@!
    <br><br>
    Ya puedes relajar tus neuronas, les has dado mucho trabajo
</div>