[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/eirasf/GCED-AA2/blob/main/lab4/lab4_parte3.ipynb)
# Práctica 4: Redes neuronales usando Keras con Regularización
## Parte 3. Dropout

En esta tercera parte, veremos cómo tratar el *overfitting* mediante la técnica de *Dropout* que consiste en usar un solo modelo para simular tener una gran cantidad de arquitecturas de red diferentes de las que se van eliminando nodos aleatoriamente durante el entrenamiento. 


## Pre-requisitos. Instalar paquetes

Al igual que en las partes anteriores de este Laboratorio 4, necesitaremos TensorFlow, TensorFlow-Datasets y otros paquetes para inicializar la semilla y poder reproducir los resultados.

In [55]:
import tensorflow as tf
import tensorflow_datasets as tfds
import os
import numpy as np
import random

#Fijamos la semilla para poder reproducir los resultados
seed=1234
os.environ['PYTHONHASHSEED']=str(seed)
tf.random.set_seed(seed)
np.random.seed(seed)
random.seed(seed)

Además, cargamos también APIs que vamos a emplear para que el código quede más legible

In [56]:
from matplotlib import pyplot
from tensorflow import keras
from keras.models import Sequential
from keras.layers import InputLayer
from keras.layers import Dense
# Incluímos la capa de Keras que nos permitirá hacer Dropout
from keras.layers import Dropout


##Cargamos el conjunto de datos

De nuevo, seguimos empleando el conjunto *german_credit_numeric*, dividiendo en entrenamiento y test.


In [57]:
# Cargamos el conjunto de datos
ds_train = tfds.load('german_credit_numeric', split='train[:50%]',  as_supervised=True).batch(128)
ds_test = tfds.load('german_credit_numeric', split='train[50%:]', as_supervised=True).batch(128)

Establecer la función de pérdida, el algoritmo que vamos a emplear para el entrenamiento y la métrica que nos servirá para evaluar el rendimiento del modelo entrenado.

In [58]:
#Indicamos la función de perdida, el algoritmo de optimización y la métrica para evaluar el rendimiento 
fn_perdida = tf.keras.losses.BinaryCrossentropy()
optimizador = tf.keras.optimizers.Adam(0.001)
metrica = tf.keras.metrics.AUC()

## Creamos un modelo *Sequential* con capas *Dropout*
La forma más simple de crear *Dropout* en Keras nos la proporciona la capa *Dropout*. Cuando se crea la capa *Dropout* se puede especificar la probabilidad de poner cada entrada a cero. Así, estableciendo una tasa de deserción a 0.2 indica que el 20% de las entradas estará a 0.
La capa *Dropout* se agrega a un modelo entre capas existentes y se aplica a las salidas de la capa anterior, antes de alimentar a la siguiente.


Recomendaciones para usar *Dropout*:
1. Utilizar una tasa de abandono pequeña del 20% al 50% de las neuronas, el 20% constituye un buen punto de partida. Una probabilidad demasiado baja tiene un efecto mínimo y un valor demasiado alto da como resultado *underfitting* por parte de la red.

1. Red grande. Es probable que se obtenga un mejor rendimiento cuando se utiliza *Dropout* con una red más grande, lo que le da al modelo una mayor oportunidad para aprender representaciones independientes.
1. Emplear *Dropout* tanto en la capa de entrada como en las capas ocultas. 

**TO-DO**: Cambia el ratio de abandono en las distintas capas y evalúa las diferencias entre entrenamiento y test.


In [None]:
tamano_entrada = 24
h0_size = 20
h1_size = 10
h2_size = 5
#TODO - define el modelo Sequential
model =  ...
#TODO - incluye la capa de entrada 
model.add(....)))
model.add( Dropout(0.2))
#TODO - incluir el resto de capas Dense y Dropout
model.add( ...))
model.add( ...)
model.add( ...)
model.add( ...)
model.add( ...)
model.add( ...)
model.add( ...)
#Construimos el modelo y mostramos 
model.build()
print(model.summary())

Completar el método *compile*.

In [60]:
#TODO - indicar los parametros del método compile
model.compile(...)

Completar el método *fit* tal y como hemos hecho en los laboratorios anteriores.

In [None]:
#TODO - entrenar el modelo
num_epochs =  700
history = model.fit(....)
# plot training history
pyplot.plot(history.history['loss'], label='train')
pyplot.legend()
pyplot.show()

Evaluación sobre el conjunto de test (no usado para el entrenamiento). 

In [None]:
#TODO - llamar a evaluate usando el conjunto de test
result = model.evaluate(...)
print(model.metrics_names)
print(result)