<h1><font color="#113D68" size=6>Deep Learning con Python y Keras</font></h1>

<h1><font color="#113D68" size=5>Parte 3. Multilayer Perceptron</font></h1>

<h1><font color="#113D68" size=4>3. Evaluar el rendimiento</font></h1>

<br><br>
<div style="text-align: right">
<font color="#113D68" size=3>Manuel Castillo Cara</font><br>

</div>

---

<a id="indice"></a>
<h2><font color="#004D7F" size=5>Índice</font></h2>

* [0. Contexto](#section0)
* [1. Evaluar empíricamente las configuraciones de red](#section1)
* [2. División de datos](#section2)
    * [2.1. Verificación automática](#section2.1)
    * [2.2. Verificación manual](#section2.2)
* [3. Validación cruzada](#section3)

---
<a id="section0"></a>
# <font color="#004D7F" size=6> 0. Contexto</font>

En esta lección, descubrirá algunas formas que puede utilizar para evaluar el rendimiento del modelo. Después de completar esta lección, sabrá:
* Cómo evaluar un modelo utilizando un conjunto de datos de verificación automática.
* Cómo evaluar un modelo utilizando un conjunto de datos de verificación manual.
* Cómo evaluar un modelo mediante la validación cruzada de k-fold.

In [None]:
import tensorflow as tf
# Eliminar warning
tf.compat.v1.logging.set_verbosity(tf.compat.v1.logging.ERROR)

---
<div style="text-align: right"> <font size=5> <a href="#indice"><i class="fa fa-arrow-circle-up" aria-hidden="true" style="color:#004D7F"></i></a></font></div>

---

<a id="section1"></a>
# <font color="#004D7F" size=6>1. Evaluar empíricamente las configuraciones de red</font>

A la hora de evaluar modelos tenemos que tener en cuenta decisiones de nivel inferior como la elección de la función de pérdida, funciones de activación, procedimiento de optimización y número de épocas.

---
<div style="text-align: right"> <font size=5> <a href="#indice"><i class="fa fa-arrow-circle-up" aria-hidden="true" style="color:#004D7F"></i></a></font></div>

---

<a id="section2"></a>
# <font color="#004D7F" size=6>2. División de datos</font>

Es común utilizar una simple separación de datos en conjuntos de datos de entrenamiento y validación. Keras proporciona dos formas convenientes de evaluar sus algoritmos de Deep Learning de esta manera:
1. Utilice un conjunto de datos de verificación automática.
2. Utilice un conjunto de datos de verificación manual.

<a id="section2.1"></a>
# <font color="#004D7F" size=5>2.1. Verificación automática</font>

Keras puede separar una parte de sus datos de entrenamiento/validación y evaluar el rendimiento del modelo en cada época. Puede hacer esto configurando el argumento `validation_split` en la función `fit()` en un porcentaje del tamaño de su conjunto de datos de entrenamiento. 

Veamos un ejemplo

In [None]:
from google.colab import drive
drive.mount('/content/drive')

# MLP with automatic validation set
import numpy as np
from keras.models import Sequential
from keras.layers import Dense

# load pima indians dataset
path= "/content/drive/MyDrive/CursoDeepLearning/Datasets/pima-indians-diabetes.csv"
dataset= np.loadtxt(path, delimiter=',')

# split into input (X) and output (Y) variables
x= dataset[:,0:8]
y= dataset[:,8]

# create model
model= Sequential()
model.add(Dense(12,input_dim=8,activation='relu'))
model.add(Dense(8,activation='relu'))
model.add(Dense(1,activation='sigmoid'))

# Compile model
model.compile(loss='binary_crossentropy',optimizer='Adam',metrics=['accuracy'])

# Fit the model
model.fit(x,y,validation_split=0.33 ,epochs=150, batch_size=10)

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
Epoch 1/150
Epoch 2/150
Epoch 3/150
Epoch 4/150
Epoch 5/150
Epoch 6/150
Epoch 7/150
Epoch 8/150
Epoch 9/150
Epoch 10/150
Epoch 11/150
Epoch 12/150
Epoch 13/150
Epoch 14/150
Epoch 15/150
Epoch 16/150
Epoch 17/150
Epoch 18/150
Epoch 19/150
Epoch 20/150
Epoch 21/150
Epoch 22/150
Epoch 23/150
Epoch 24/150
Epoch 25/150
Epoch 26/150
Epoch 27/150
Epoch 28/150
Epoch 29/150
Epoch 30/150
Epoch 31/150
Epoch 32/150
Epoch 33/150
Epoch 34/150
Epoch 35/150
Epoch 36/150
Epoch 37/150
Epoch 38/150
Epoch 39/150
Epoch 40/150
Epoch 41/150
Epoch 42/150
Epoch 43/150
Epoch 44/150
Epoch 45/150
Epoch 46/150
Epoch 47/150
Epoch 48/150
Epoch 49/150
Epoch 50/150
Epoch 51/150
Epoch 52/150
Epoch 53/150
Epoch 54/150
Epoch 55/150
Epoch 56/150
Epoch 57/150
Epoch 58/150
Epoch 59/150
Epoch 60/150
Epoch 61/150
Epoch 62/150
Epoch 63/150
Epoch 64/150
Epoch 65/150
Epoch 66/150
Epoch 67/150
Epoch 68/

<keras.callbacks.History at 0x7f6df59050d0>

In [None]:
_, accuracy= model.evaluate(x,y)
print('Accuracy: %.2f' % (accuracy*100))

Accuracy: 76.17


<a id="section2.2"></a>
# <font color="#004D7F" size=5>2.2. Verificación manual</font>

Keras también le permite especificar manualmente el conjunto de datos que se utilizará para la validación durante el entrenamiento. En este ejemplo usamos la práctica función `train_test_split()` de Scikit-learn usando un 67%/33%. 

El conjunto de datos de validación se puede especificar a la función `fit()` mediante el argumento `validation_data`. Toma una tupla de los conjuntos de datos de entrada (X) y salida (y).

Veamos un ejemplo

In [None]:
# MLP with manual validation set
import numpy as np
from keras.models import Sequential
from keras.layers import Dense
from sklearn.model_selection import train_test_split

# load pima indians dataset
from google.colab import drive
drive.mount('/content/drive')
path= "/content/drive/MyDrive/CursoDeepLearning/Datasets/pima-indians-diabetes.csv"
dataset= np.loadtxt(path, delimiter=',')

# split into input (X) and output (Y) variables
x= dataset[:,0:8]
y= dataset[:,8]

# split into 67% for train and 33% for test
x_train, x_test, y_train, y_test= train_test_split(x,y, test_size=0.33)

# create model
model= Sequential()
model.add(Dense(12,input_dim=8,activation='relu'))
model.add(Dense(8,activation='relu'))
model.add(Dense(1,activation='sigmoid'))

# Compile model
model.compile(loss='binary_crossentropy',optimizer='Adam',metrics=['accuracy'])

# Fit the model
model.fit(x_train,y_train,validation_data=(x_test,y_test) ,epochs=150, batch_size=10)

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
Epoch 1/150
Epoch 2/150
Epoch 3/150
Epoch 4/150
Epoch 5/150
Epoch 6/150
Epoch 7/150
Epoch 8/150
Epoch 9/150
Epoch 10/150
Epoch 11/150
Epoch 12/150
Epoch 13/150
Epoch 14/150
Epoch 15/150
Epoch 16/150
Epoch 17/150
Epoch 18/150
Epoch 19/150
Epoch 20/150
Epoch 21/150
Epoch 22/150
Epoch 23/150
Epoch 24/150
Epoch 25/150
Epoch 26/150
Epoch 27/150
Epoch 28/150
Epoch 29/150
Epoch 30/150
Epoch 31/150
Epoch 32/150
Epoch 33/150
Epoch 34/150
Epoch 35/150
Epoch 36/150
Epoch 37/150
Epoch 38/150
Epoch 39/150
Epoch 40/150
Epoch 41/150
Epoch 42/150
Epoch 43/150
Epoch 44/150
Epoch 45/150
Epoch 46/150
Epoch 47/150
Epoch 48/150
Epoch 49/150
Epoch 50/150
Epoch 51/150
Epoch 52/150
Epoch 53/150
Epoch 54/150
Epoch 55/150
Epoch 56/150
Epoch 57/150
Epoch 58/150
Epoch 59/150
Epoch 60/150
Epoch 61/150
Epoch 62/150
Epoch 63/150
Epoch 64/150
Epoch 65/150
Epoch 66/150
Epoch 67/150
Epoch 68/

<keras.callbacks.History at 0x7f6de9333810>

---
<div style="text-align: right"> <font size=5> <a href="#indice"><i class="fa fa-arrow-circle-up" aria-hidden="true" style="color:#004D7F"></i></a></font></div>

---

<a id="section3"></a>
# <font color="#004D7F" size=6>3. Validación cruzada</font>

La validación cruzada a menudo no se usa para evaluar modelos de aprendizaje profundo debido al mayor gasto computacional, demasiadas iteraciones para modelos muy pesados.

En el siguiente ejemplo, usamos el práctico clase `StratifiedKFold` de scikit-learn para dividir el conjunto de datos de entrenamiento en 10-folds. 



In [9]:
# MLP for Pima Indians Dataset with 10-fold cross validation
import numpy as np
from keras.models import Sequential
from keras.layers import Dense
from sklearn.model_selection import StratifiedKFold

# load pima indians dataset
from google.colab import drive
drive.mount('/content/drive')
path= "/content/drive/MyDrive/CursoDeepLearning/Datasets/pima-indians-diabetes.csv"
dataset= np.loadtxt(path, delimiter=',')

# split into input (X) and output (Y) variables
x= dataset[:,0:8]
y= dataset[:,8]

# define 10-fold cross validation test harness
kfold= StratifiedKFold(n_splits=10,shuffle=True) 
cvscores= []
for train,test in kfold.split(x,y):
  # create model
  model= Sequential()
  model.add(Dense(12,input_dim=8,activation='relu'))
  model.add(Dense(8,activation='relu'))
  model.add(Dense(1,activation='sigmoid'))
  # Compile model
  model.compile(loss='binary_crossentropy',optimizer='Adam',metrics=['accuracy'])
  # Fit the model
  model.fit(x[train],y[train],epochs=150, batch_size=10, verbose=False)  
  # Evaluate
  scores= model.evaluate(x[test],y[test])
  print('%s: %.2f%%' % (model.metrics_names[1],scores[1]*100))
  cvscores.append(scores[1]*100)

# Imprimo resultado global
print('%.2f%% (+/- %.2f%%)' % (np.mean(cvscores),np.std(cvscores)))

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
accuracy: 58.44%
accuracy: 64.94%
accuracy: 75.32%
accuracy: 68.83%
accuracy: 74.03%
accuracy: 71.43%
accuracy: 57.14%
accuracy: 75.32%
accuracy: 68.42%
accuracy: 69.74%
68.36% (+/- 6.14%)


<div class="alert alert-block alert-info">
    
<i class="fa fa-info-circle" aria-hidden="true"></i>
Se ha tenido que volver a crear el modelo en cada bucle para luego ajustarlo y evaluarlo con los datos del fold. En la próxima lección veremos cómo podemos usar los modelos de Keras de forma nativa con Scikit-learn.

<div style="text-align: right"> <font size=5> <a href="#indice"><i class="fa fa-arrow-circle-up" aria-hidden="true" style="color:#004D7F"></i></a></font></div>

---

<div style="text-align: right"> <font size=6><i class="fa fa-coffee" aria-hidden="true" style="color:#004D7F"></i> </font></div>