# Laboratorio 4 - Parte 1

### Redes Neuronales Artificiales: MLP

### 2019-I

#### Profesor: Julián D. Arias Londoño
#### julian.ariasl@udea.edu.co


## Guía del laboratorio

En esta archivo va a encontrar tanto celdas de código cómo celdas de texto con las instrucciones para desarrollar el laboratorio.

Lea atentamente las instrucciones entregadas en las celdas de texto correspondientes y proceda con la solución de las preguntas planteadas.

Nota: no olvide ir ejecutando las celdas de código de arriba hacia abajo para que no tenga errores de importación de librerías o por falta de definición de variables.

### Primer integrante:
Nombre: Alejandro Castaño Rojas

### Segundo integrante:
Nombre: Angélica Arroyave Mendoza

In [2]:
from __future__ import division
%matplotlib inline
import numpy as np
import math
import matplotlib.pyplot as plt

#Algunas advertencias que queremos evitar
import warnings
warnings.filterwarnings("always")

## Indicaciones

Este ejercicio tiene como objetivo implementar una red neuronal artificial de tipo perceptrón multicapa (MLP) para resolver un problema de regresión. Usaremos la librería sklearn. Consulte todo lo relacionado con la definición de hiperparámetros, los métodos para el entrenamiento y la predicción de nuevas muestras en el siguiente enlace: http://scikit-learn.org/stable/modules/generated/sklearn.neural_network.MLPRegressor.html#sklearn.neural_network.MLPRegressor

Para este ejercicio usaremos la base de datos sobre calidad del aire, que ha sido usada en laboratorios previos, pero en este caso trataremos de predecir dos variables en lugar de una, es decir, abordaremos un problema de múltiples salidas.

In [3]:
#cargamos la bd que está en un archivo .data y ahora la podemos manejar de forma matricial
db = np.loadtxt('DB/AirQuality.data',delimiter='\t')  # Assuming tab-delimiter

#Esta es la base de datos AirQuality del UCI Machine Learning Repository. En la siguiente URL se encuentra toda
#la descripción de la base de datos y la contextualización del problema.
#https://archive.ics.uci.edu/ml/datasets/Air+Quality#

X = db[:,0:11]
Y = db[:,11:13]

In [6]:
#Mean Absolute Percentage Error para los problemas de regresión
def MAPE(Y_est,Y):
    N = np.size(Y)
    mape = np.sum(abs((Y_est.reshape(N,1) - Y.reshape(N,1))/Y.reshape(N,1)))/N
    return mape 

## Ejercicio 1

Complete el script siguiente con el código necesario para usar una red neuronal tipo MLP para solucionar el problema de regresión propuesto. Como función de activación en las capas ocultas use la función 'tanh'. Ajuste el número máximo de épocas a 500.

In [26]:
from numpy import random
import numpy.matlib
from sklearn.neural_network import MLPRegressor
from sklearn.model_selection import ShuffleSplit
from sklearn import preprocessing
from sklearn.neural_network import MLPRegressor

layers = [1,1,1,1,1,2,2,2,2,2]
neurons_per_layer =[20,24,28,32,36,20,24,28,32,36]
table = []
mape_1 = []
mape_2 =[]

def MLPR(layer,neurons_per_layer):
    
    #Validamos el modelo
    Folds = 4
    random.seed(19680801)
    ErrorY1 = np.zeros(Folds)
    ErrorY2 = np.zeros(Folds)
    ErrorT = np.zeros(Folds)
    ss = ShuffleSplit(n_splits=Folds, test_size=0.3)
    j = 0
    activation = ''
    for train, test in ss.split(X):
        Xtrain = X[train,:]
        Ytrain = Y[train,:]
        Xtest = X[test,:]
        Ytest = Y[test,:]

        #Normalizamos los datos
        media = np.mean(Xtrain,axis=0)
        desvia = np.std(Xtrain,axis=0)    
        Xtrain = preprocessing.scale(Xtrain)
        Xtest = (Xtest - np.matlib.repmat(media, Xtest.shape[0], 1))/np.matlib.repmat(desvia, Xtest.shape[0], 1)

        #Haga el llamado a la función para crear y entrenar el modelo usando los datos de entrenamiento
        if(layer ==1 ):
            mlr = MLPRegressor(hidden_layer_sizes=(neurons_per_layer,), activation='tanh', max_iter=500)
        elif(layer==2):
            mlr = MLPRegressor(hidden_layer_sizes=(neurons_per_layer,neurons_per_layer), activation='tanh', max_iter=500, )
        mlp = mlr.fit(Xtrain,Ytrain)
        activation = mlp.out_activation_
        #Use para el modelo para hacer predicciones sob    re el conjunto Xtest
        Yest = mlp.predict(Xtest)

        #Mida el error MAPE para cada una de las dos salidas
        ErrorY1[j] = MAPE(Yest[:, 0], Ytest[:, 0])
        ErrorY2[j] = MAPE(Yest[:, 1], Ytest[:, 1])
        ErrorT[j] = (ErrorY1[j] + ErrorY2[j])/2
        j += 1
    print('MAPE salida 1 = ' + str(np.mean(ErrorY1)) + '+-' + str(np.std(ErrorY1)))
    print('MAPE salida 2 = ' + str(np.mean(ErrorY2)) + '+-' + str(np.std(ErrorY2)))
    print('MAPE total = '    + str(np.mean(ErrorT)) + '+-' + str(np.std(ErrorT)))
    return(np.mean(ErrorY1),np.std(ErrorY1), np.mean(ErrorY2), np.std(ErrorY2))

In [28]:
MLPR(1,28)[0]



MAPE salida 1 = 0.07724764613532994+-0.0013535560956051123
MAPE salida 2 = 1.732973417213272+-0.06942822381804184
MAPE total = 0.9051105316743009+-0.0347062546620109




0.07724764613532994

## Ejercicio 2

Una vez completado el código anterior. Realice los experimentos necesarios para completar la tabla siguiente:

In [31]:
import pandas as pd
import qgrid

df_types = pd.DataFrame({
    'N. de capas ocultas' : pd.Series([1,1,1,1,1,2,2,2,2,2]),
    'Neuronas por capa' : pd.Series([20,24,28,32,36,20,24,28,32,36])})
df_types["MAPE salida 1"] = ""
df_types["IC MAPE salida 1"] = ""
df_types["MAPE salida 2"] = ""
df_types["IC MAPE salida 2"] = ""
df_types.set_index(['N. de capas ocultas','Neuronas por capa'], inplace=True)

for i in df_types.index:
    result= MLPR(i[0], i[1])
    df_types["MAPE salida 1"][i] = result[0]
    df_types["IC MAPE salida 1"][i] = result[1]
    df_types["MAPE salida 2"][i] = result[2]
    df_types["IC MAPE salida 2"][i] =result[3]
#df_types.sort_index(inplace=True)
qgrid_widget = qgrid.show_grid(df_types, show_toolbar=False)
qgrid_widget



MAPE salida 1 = 0.08622996152522594+-0.001955111112315872
MAPE salida 2 = 2.3985811386209996+-0.15854819303287204
MAPE total = 1.2424055500731126+-0.07903364336699552




MAPE salida 1 = 0.08184301090778354+-0.0018665481639034407
MAPE salida 2 = 2.061490846144465+-0.10960088265898123
MAPE total = 1.0716669285261244+-0.05432244126955195




MAPE salida 1 = 0.07724764613532994+-0.0013535560956051123
MAPE salida 2 = 1.732973417213272+-0.06942822381804184
MAPE total = 0.9051105316743009+-0.0347062546620109




MAPE salida 1 = 0.07685856089435118+-0.0017317726591799796
MAPE salida 2 = 1.5169496963281939+-0.05086109317369994
MAPE total = 0.7969041286112726+-0.0262763734236222




MAPE salida 1 = 0.0750917085471841+-0.0008968482981834169
MAPE salida 2 = 1.5010798078831988+-0.038990684388658575
MAPE total = 0.7880857582151916+-0.019731982571639797




MAPE salida 1 = 0.07142439144887983+-0.003126835671322155
MAPE salida 2 = 1.220796641235499+-0.09974340334925233
MAPE total = 0.6461105163421893+-0.050679598291825174




MAPE salida 1 = 0.06642135867990025+-0.0023179675213858097
MAPE salida 2 = 0.9845842036602895+-0.10735320690667013
MAPE total = 0.525502781170095+-0.05431548429289422




MAPE salida 1 = 0.0652745626925774+-0.0008131126515162579
MAPE salida 2 = 0.8286200146518381+-0.0993151819824142
MAPE total = 0.44694728867220773+-0.049380916923249744




MAPE salida 1 = 0.063630670285638+-0.001071939864372579
MAPE salida 2 = 0.8684634682710984+-0.08841852785970497
MAPE total = 0.4660470692783682+-0.04408451270774454




MAPE salida 1 = 0.0625755976134793+-0.002123470714616449
MAPE salida 2 = 0.8577153437027278+-0.013428989534006966
MAPE total = 0.46014547065810363+-0.006928463994991178


  def _df_changed(self):


QgridWidget(grid_options={'fullWidthRows': True, 'syncColumnCellResize': True, 'forceFitColumns': True, 'defau…

Ejecute la siguiente instrucción para dejar guardados en el notebook los resultados de las pruebas.

In [32]:
qgrid_widget.get_changed_df()

Unnamed: 0_level_0,Unnamed: 1_level_0,MAPE salida 1,IC MAPE salida 1,MAPE salida 2,IC MAPE salida 2
N. de capas ocultas,Neuronas por capa,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
1,20,0.08623,0.00195511,2.39858,0.158548
1,24,0.081843,0.00186655,2.06149,0.109601
1,28,0.0772476,0.00135356,1.73297,0.0694282
1,32,0.0768586,0.00173177,1.51695,0.0508611
1,36,0.0750917,0.000896848,1.50108,0.0389907
2,20,0.0714244,0.00312684,1.2208,0.0997434
2,24,0.0664214,0.00231797,0.984584,0.107353
2,28,0.0652746,0.000813113,0.82862,0.0993152
2,32,0.0636307,0.00107194,0.868463,0.0884185
2,36,0.0625756,0.00212347,0.857715,0.013429


<b>Responda</b>:

2.1 ¿Qué tipo de función de activación usa el modelo en la capa de salida?: 

In [40]:
print('El tipo de función que usa el modelo en la capa de salida es: ', activation)

El tipo de función que usa el modelo en la capa de salida es:  identity


## Ejercicio 3.

A continuación se leen los datos de un problema de clasificación. El problema corresponde a la clasifiación de dígitos escritos a mano. Usaremos únicamente 4 de las 10 clases disponibles. Los datos fueron preprocesados para reducir el número de características. La técnica usada será analizada más adelante en el curso.

In [34]:
from sklearn.datasets import load_digits
from sklearn.decomposition import PCA
digits = load_digits(n_class=4)

#--------- preprocesamiento--------------------
pca = PCA(0.99, whiten=True)
data = pca.fit_transform(digits.data)

#---------- Datos a usar ----------------------
X = data
Y = digits.target

Este ejercicio tiene como objetivo implementar una red neuronal artificial de tipo perceptrón multicapa (MLP) para resolver un problema de clasificación. Usaremos la librería sklearn. Consulte todo lo relacionado con la definición de hiperparámetros, los métodos para el entrenamiento y la predicción de nuevas muestras en el siguiente enlace: http://scikit-learn.org/stable/modules/generated/sklearn.neural_network.MLPClassifier.html#sklearn.neural_network.MLPClassifier

Complete el script siguiente con el código necesario para usar una red neuronal tipo MLP para solucionar el problema de clasificación propuesto. Como función de activación en las capas ocultas use la función 'tanh'. Ajuste el número máximo de épocas a 500.

In [63]:
from sklearn.neural_network import MLPClassifier
from sklearn.model_selection import StratifiedKFold
from sklearn.neural_network import MLPClassifier


def MLPC(layer,neurons_per_layer):
    Folds = 4
    random.seed(19680801)
    EficienciaTrain = np.zeros(Folds)
    EficienciaVal = np.zeros(Folds)
    skf = StratifiedKFold(n_splits=Folds)
    j = 0
    activation_mlpc =''
    n_output = ''
    for train, test in skf.split(X, Y):
        Xtrain = X[train,:]
        Ytrain = Y[train]
        Xtest = X[test,:]
        Ytest = Y[test]

        #Normalizamos los datos
        media = np.mean(Xtrain)
        desvia = np.std(Xtrain)
        Xtrain = preprocessing.scale(Xtrain)
        Xtest = (Xtest - np.matlib.repmat(media, Xtest.shape[0], 1))/np.matlib.repmat(desvia, Xtest.shape[0], 1)

        #Haga el llamado a la función para crear y entrenar el modelo usando los datos de entrenamiento
        if(layer==1):
            mlpc = MLPClassifier(activation='tanh', max_iter=500, hidden_layer_sizes=(neurons_per_layer,))
        elif(layer==2):
            mlpc = MLPClassifier(activation='tanh', max_iter=500, hidden_layer_sizes=(neurons_per_layer,neurons_per_layer))
        mlpc = mlpc.fit(Xtrain,Ytrain)
        activation_mlpc = mlpc.out_activation_
        n_output = mlpc.n_outputs_
        #Validación con las muestras de entrenamiento
        Ytrain_pred = mlpc.predict(Xtrain)

        #Validación con las muestras de test    
        Yest = mlpc.predict(Xtest)

        #Evaluamos las predicciones del modelo con los datos de test
        EficienciaTrain[j] = np.mean(Ytrain_pred == Ytrain)
        EficienciaVal[j] = np.mean(Yest == Ytest)
        j += 1

    print('Eficiencia durante el entrenamiento = ' + str(np.mean(EficienciaTrain)) + '+-' + str(np.std(EficienciaTrain)))
    print('Eficiencia durante la validación = ' + str(np.mean(EficienciaVal)) + '+-' + str(np.std(EficienciaVal)))
    return(np.mean(EficienciaVal), np.std(EficienciaVal), activation_mlpc, n_output)

## Ejercicio 4

Una vez completado el código realice los experimentos necesarios para llenar la siguiente tabla:

In [64]:
df_types = pd.DataFrame({
    'N. de capas ocultas' : pd.Series([1,1,1,1,1,2,2,2,2,2]),
    'Neuronas por capa' : pd.Series([20,24,28,32,36,20,24,28,32,36])})
df_types["Eficiencia en validacion"] = ""
df_types["Intervalo de confianza"] = ""
df_types.set_index(['N. de capas ocultas','Neuronas por capa'], inplace=True)

for i in df_types.index:
    result= MLPC(i[0], i[1])
    df_types["Eficiencia en validacion"][i] = result[0]
    df_types["Intervalo de confianza"][i] = result[1]
#df_types.sort_index(inplace=True)
qgrid_widget = qgrid.show_grid(df_types, show_toolbar=False)
qgrid_widget

Eficiencia durante el entrenamiento = 1.0+-0.0
Eficiencia durante la validación = 0.9567941737434934+-0.026823128593228423
Eficiencia durante el entrenamiento = 1.0+-0.0
Eficiencia durante la validación = 0.9623501551552112+-0.033708835273301894
Eficiencia durante el entrenamiento = 1.0+-0.0
Eficiencia durante la validación = 0.9637852603042869+-0.03034887331847802
Eficiencia durante el entrenamiento = 1.0+-0.0
Eficiencia durante la validación = 0.9651745793525728+-0.024554487450665758
Eficiencia durante el entrenamiento = 1.0+-0.0
Eficiencia durante la validación = 0.9651201751904246+-0.031155322934462944
Eficiencia durante el entrenamiento = 1.0+-0.0
Eficiencia durante la validación = 0.9679914115957103+-0.026517842006687012
Eficiencia durante el entrenamiento = 1.0+-0.0
Eficiencia durante la validación = 0.9568715967184709+-0.029363263032099948
Eficiencia durante el entrenamiento = 1.0+-0.0
Eficiencia durante la validación = 0.9651897546863094+-0.02842124243349742
Eficiencia durante

QgridWidget(grid_options={'fullWidthRows': True, 'syncColumnCellResize': True, 'forceFitColumns': True, 'defau…

Ejecute la siguiente instrucción para dejar guardados en el notebook los resultados de las pruebas.

In [41]:
qgrid_widget.get_changed_df()

Unnamed: 0_level_0,Unnamed: 1_level_0,Eficiencia en validacion,Intervalo de confianza
N. de capas ocultas,Neuronas por capa,Unnamed: 2_level_1,Unnamed: 3_level_1
1,20,0.956794,0.0268231
1,24,0.96235,0.0337088
1,28,0.963785,0.0303489
1,32,0.965175,0.0245545
1,36,0.96512,0.0311553
2,20,0.967991,0.0265178
2,24,0.956872,0.0293633
2,28,0.96519,0.0284212
2,32,0.961016,0.0253021
2,36,0.968007,0.0214314


<b>Responda</b>:

4.1 ¿Qué tipo de función de activación usa el modelo en la capa de salida?: 

In [59]:
 print('El tipo de función que usa el modelo en la capa de salida es: ', result[2]) 

El tipo de función que usa el modelo en la capa de salida es:  softmax


4.2 ¿Cuántas neuronas en la capa de salida tiene el modelo?¿Porqué debe tener ese número?

In [66]:
 print('El  número neuronas en la capa de salida son: ', result[3], ' dado que lo que queremos probar es a que clase pertenece la muestra y el total de estas es 4.') 

El  número neuronas en la capa de salida son:  4  dado que lo que queremos probar es a que clase pertenece la muestra y el total de estas es 4.
