<h1><font color="#113D68" size=6>Deep Learning con Python y Keras</font></h1>

<h1><font color="#113D68" size=5>Parte 3. Multilayer Perceptron</font></h1>

<h1><font color="#113D68" size=4>3. Evaluar el rendimiento</font></h1>

<br><br>
<div style="text-align: right">
<font color="#113D68" size=3>Manuel Castillo Cara</font><br>

</div>

---

<a id="indice"></a>
<h2><font color="#004D7F" size=5>Índice</font></h2>

* [0. Contexto](#section0)
* [1. Evaluar empíricamente las configuraciones de red](#section1)
* [2. División de datos](#section2)
    * [2.1. Verificación automática](#section2.1)
    * [2.2. Verificación manual](#section2.2)
* [3. Validación cruzada](#section3)

---
<a id="section0"></a>
# <font color="#004D7F" size=6> 0. Contexto</font>

En esta lección, descubrirá algunas formas que puede utilizar para evaluar el rendimiento del modelo. Después de completar esta lección, sabrá:
* Cómo evaluar un modelo utilizando un conjunto de datos de verificación automática.
* Cómo evaluar un modelo utilizando un conjunto de datos de verificación manual.
* Cómo evaluar un modelo mediante la validación cruzada de k-fold.

In [3]:
# La mayoría de decisiones sobre el modelo de DL y ML deben resolverse empíricamente (prueba y error)
import tensorflow as tf
# Eliminar warning
tf.compat.v1.logging.set_verbosity(tf.compat.v1.logging.ERROR)

---
<div style="text-align: right"> <font size=5> <a href="#indice"><i class="fa fa-arrow-circle-up" aria-hidden="true" style="color:#004D7F"></i></a></font></div>

---

<a id="section1"></a>
# <font color="#004D7F" size=6>1. Evaluar empíricamente las configuraciones de red</font>

A la hora de evaluar modelos tenemos que tener en cuenta decisiones de nivel inferior como la elección de la función de pérdida, funciones de activación, procedimiento de optimización y número de épocas, además de la longitud y profundidad de nuestras capas ocultas (podemos copiar estructuras de redes de otras personas para trabajos similares). 

---
<div style="text-align: right"> <font size=5> <a href="#indice"><i class="fa fa-arrow-circle-up" aria-hidden="true" style="color:#004D7F"></i></a></font></div>

---

<a id="section2"></a>
# <font color="#004D7F" size=6>2. División de datos</font>

Es común utilizar una simple separación de datos en conjuntos de datos de entrenamiento y validación. Keras proporciona dos formas convenientes de evaluar sus algoritmos de Deep Learning de esta manera:
1. Utilice un conjunto de datos de verificación automática.
2. Utilice un conjunto de datos de verificación manual.

<a id="section2.1"></a>
# <font color="#004D7F" size=5>2.1. Verificación automática</font>

Keras puede separar una parte de sus datos de entrenamiento/validación y evaluar el rendimiento del modelo en cada época. Puede hacer esto configurando el argumento `validation_split` en la función `fit()` en un porcentaje del tamaño de su conjunto de datos de entrenamiento. 

Veamos un ejemplo

In [4]:
# Por lo tedioso del proceso de entrenamiento de modelos, es normal utilizar una separación en porcentaje de los datos para el entrenamiento y evaluación del mismo
# Podemos ver también el Accuracy y pérdida en cada época con este modelo

# MLP con set de validación automática (con División por Porcentajes)
from keras.models import Sequential
from keras.layers import Dense
import numpy as np

# Cargamos el set de pima-indians
dataset = np.loadtxt('Datasets/pima-indians-diabetes.csv',delimiter=',')
# Dividimos los datos en imputs (características) y outputs (clase)
X = dataset[:,0:8]
Y = dataset[:,8]
# Creamos el modelo
model = Sequential()
model.add(Dense(12,input_dim=8,activation='relu')) # primera capa oculta (si encontramos una mejor configuración cambiar)
model.add(Dense(8,activation='relu'))
model.add(Dense(1,activation='sigmoid'))
# Compilamos el modelo
model.compile(loss='binary_crossentropy',optimizer='adam',metrics=['accuracy'])
# Entrenamos el modelo
model.fit(X,Y,validation_split=0.33,epochs=150, batch_size=10) # le decimos que el 33% de los datos se van a usar para validación y el 67% para entrenamiento
# El accuracy final del modelo es el mostrado por el accuracy de la última época

Epoch 1/150


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m52/52[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 7ms/step - accuracy: 0.4709 - loss: 2.6988 - val_accuracy: 0.5354 - val_loss: 1.4609
Epoch 2/150
[1m52/52[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.5369 - loss: 1.4441 - val_accuracy: 0.5906 - val_loss: 1.0080
Epoch 3/150
[1m52/52[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.5491 - loss: 1.0606 - val_accuracy: 0.5512 - val_loss: 0.8169
Epoch 4/150
[1m52/52[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.4793 - loss: 0.9887 - val_accuracy: 0.5551 - val_loss: 0.7829
Epoch 5/150
[1m52/52[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.5501 - loss: 0.8049 - val_accuracy: 0.4370 - val_loss: 0.8761
Epoch 6/150
[1m52/52[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.4842 - loss: 0.8435 - val_accuracy: 0.6535 - val_loss: 0.8427
Epoch 7/150
[1m52/52[0m [32m━━━━━━━━━━━━━━━

<keras.src.callbacks.history.History at 0x19f5ed82a50>

<a id="section2.2"></a>
# <font color="#004D7F" size=5>2.2. Verificación manual</font>

Keras también le permite especificar manualmente el conjunto de datos que se utilizará para la validación durante el entrenamiento. En este ejemplo usamos la práctica función `train_test_split()` de Scikit-learn usando un 67%/33%. 

El conjunto de datos de validación se puede especificar a la función `fit()` mediante el argumento `validation_data`. Toma una tupla de los conjuntos de datos de entrada (X) y salida (y).

Veamos un ejemplo

In [7]:
# Le especificamos manualmente el conjunto de datos usado para entrenamiento (le indicamos con una tupla cuales datos usar de entrada y cuales de salida)

# MLP con set de validación manual (con División por Porcentajes)
from keras.models import Sequential
from keras.layers import Dense
import numpy as np
from sklearn.model_selection import train_test_split

# Cargamos el set de pima-indians
dataset = np.loadtxt('Datasets/pima-indians-diabetes.csv',delimiter=',')
# Dividimos los datos en imputs (características) y outputs (clase)
X = dataset[:,0:8]
Y = dataset[:,8]
# Dividimos en un 67% para entrenamiento y un 33% para testeo
X_train,X_test,Y_train,Y_test = train_test_split(X,Y,test_size=0.33)
# Creamos el modelo
model = Sequential()
model.add(Dense(12,input_dim=8,activation='relu')) # primera capa oculta (si encontramos una mejor configuración cambiar)
model.add(Dense(8,activation='relu'))
model.add(Dense(1,activation='sigmoid'))
# Compilamos el modelo
model.compile(loss='binary_crossentropy',optimizer='adam',metrics=['accuracy'])
# Entrenamos el modelo (ahora con los datos de entrenamiento y pasándole una tupla para que me los identifique, en vez de que me los separe automáticamente)
model.fit(X_train,Y_train,validation_data=(X_test,Y_test),epochs=150, batch_size=10) # le decimos que el 33% de los datos se van a usar para validación y el 67% para entrenamiento
# Evaluar el modelo
loss, accuracy = model.evaluate(X_test, Y_test)
print(f'Accuracy final del modelo: {accuracy * 100:.2f}%') # es el de la última época, si queremos que sea constante agregar random_state en la separación de train/test
# También podemos analizar en que época verdaderamente se produjo el mayor accuracy (ahora solo vemos como evaluarlo)

Epoch 1/150
[1m52/52[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 12ms/step - accuracy: 0.3693 - loss: 102.0112 - val_accuracy: 0.6220 - val_loss: 17.7370
Epoch 2/150
[1m52/52[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.6650 - loss: 14.0401 - val_accuracy: 0.6063 - val_loss: 13.1766
Epoch 3/150
[1m52/52[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.6096 - loss: 11.8378 - val_accuracy: 0.5866 - val_loss: 11.0887
Epoch 4/150
[1m52/52[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.6276 - loss: 9.8255 - val_accuracy: 0.6024 - val_loss: 7.6637
Epoch 5/150
[1m52/52[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.6035 - loss: 7.8792 - val_accuracy: 0.5787 - val_loss: 4.0873
Epoch 6/150
[1m52/52[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.5664 - loss: 3.8579 - val_accuracy: 0.5709 - val_loss: 2.8102
Epoch 7/150
[1m52/52[0m 

---
<div style="text-align: right"> <font size=5> <a href="#indice"><i class="fa fa-arrow-circle-up" aria-hidden="true" style="color:#004D7F"></i></a></font></div>

---

<a id="section3"></a>
# <font color="#004D7F" size=6>3. Validación cruzada</font>

La validación cruzada a menudo no se usa para evaluar modelos de aprendizaje profundo debido al mayor gasto computacional, demasiadas iteraciones para modelos muy pesados.

En el siguiente ejemplo, usamos el práctico clase `StratifiedKFold` de scikit-learn para dividir el conjunto de datos de entrenamiento en 10-folds. 



In [11]:
# Validación cruzada ofrece un buen rendimiento en ML, pero en DL es costoso computacionalmente

# MLP para el set de Pima Indians con 10-fold de Validación Cruzada (10 iteraciones con k-fold)
from keras.models import Sequential
from keras.layers import Dense
from sklearn.model_selection import StratifiedKFold
import numpy as np

# Cargamos el set de pima-indians
dataset = np.loadtxt('Datasets/pima-indians-diabetes.csv',delimiter=',')
# Dividimos los datos en imputs (características) y outputs (clase)
X = dataset[:,0:8]
Y = dataset[:,8]
# Definimos el teste de 10-fold cross validation utilizado
kfold = StratifiedKFold(n_splits=10,shuffle=True) # debemos hacer nosotros un bucle que pase por los splits o vueltas (si agg valor de la semilla me saca aleatoriedad, sobreajustándolo ya que aprende sobre lo aprendido bajo la misma separación de datos)
cvscores = []
for train,test in kfold.split(X,Y): # tenemos que establecer manualmente 10 modelos que vayan partiendo los datos en train/test con kfold, estableciendo sus resultados individualmente(no lo hace Keras)
    # creamos el modelo
    model = Sequential()
    model.add(Dense(12,input_dim=8,activation='relu')) # primera capa oculta (si encontramos una mejor configuración cambiar)
    model.add(Dense(8,activation='relu'))
    model.add(Dense(1,activation='sigmoid'))
    # compilamos el modelo
    model.compile(loss='binary_crossentropy',optimizer='adam',metrics=['accuracy'])
    # entrenamos el modelo
    model.fit(X[train],Y[train],epochs=150,batch_size=10,verbose=0) # ponemos verbose=0 para no mostrar los 150 resultados de cada época sino solo mostrar los finales o globales para las 10 iteraciones
    # evaluamos el modelo
    scores = model.evaluate(X[test],Y[test],verbose=0)
    print('%s: %.2f%%' % (model.metrics_names[1],scores[1]*100)) # imprimo el resultado de cada iteración (es accuracy)
    # print('Accuracy: %.2f%%' % (scores[1] * 100))  # Imprimir el resultado de cada iteración aclarándo la métrica correspondiente (este es accuracy)
    cvscores.append(scores[1]*100) # lo agrego a la lista
# Mostramos los resultados globales (p)
print("%.2f%% (+/- %.2f%%)" % (np.mean(cvscores),np.std(cvscores)))

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


compile_metrics: 76.62%
compile_metrics: 68.83%
compile_metrics: 70.13%
compile_metrics: 64.94%
compile_metrics: 66.23%
compile_metrics: 74.03%
compile_metrics: 77.92%
compile_metrics: 67.53%
compile_metrics: 76.32%
compile_metrics: 73.68%
71.62% (+/- 4.44%)


<div class="alert alert-block alert-info">
    
<i class="fa fa-info-circle" aria-hidden="true"></i>
Se ha tenido que volver a crear el modelo en cada bucle para luego ajustarlo y evaluarlo con los datos del fold. En la próxima lección veremos cómo podemos usar los modelos de Keras de forma nativa con Scikit-learn.

<div style="text-align: right"> <font size=5> <a href="#indice"><i class="fa fa-arrow-circle-up" aria-hidden="true" style="color:#004D7F"></i></a></font></div>

---

<div style="text-align: right"> <font size=6><i class="fa fa-coffee" aria-hidden="true" style="color:#004D7F"></i> </font></div>