# **Tarea 2 - Deep Learning - César Núñez**

## Montar Google Drive a Google Colab

In [1]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


# Importando packages necesarios

In [1]:
import numpy
import matplotlib.pyplot as plt
from pandas import read_csv
import math
from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics import mean_squared_error
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import LSTM
from tensorflow.keras.utils import plot_model
from keras.callbacks import ModelCheckpoint, EarlyStopping

# semilla aleatoria para reproducibilidad
numpy.random.seed(7)

## Conjunto de datos

### Cargando los datos
Para cargar el conjunto de datos usaremos a biblioteca Pandas. Para luego onvertir los valores enteros en valores de coma flotante que son más adecuados para modelar con una red neuronal.

In [2]:
# cargamos el conjunto de datos
dataframe = read_csv('international-airline-passengers.csv', usecols=[1], engine='python', skipfooter=3)
dataset = dataframe.values
dataset = dataset.astype('float32')

Las Redes recurrentes son sensibles a la escala de los datos de entrada, especialmente cuando se utilizan las funciones de activación sigmoide (por defecto) o tanh. Puede ser una buena práctica reescalar los datos al rango de 0 a 1, también llamado normalización

In [3]:
# normalizacion de los datos
scaler = MinMaxScaler(feature_range=(0, 1))
dataset = scaler.fit_transform(dataset)

### Entrenamiento y Pruebas

In [4]:
#dividimos datos en entreno y datos para el test
train_size = int(len(dataset) * 0.67)
test_size = len(dataset) - train_size
train, test = dataset[0:train_size,:], dataset[train_size:len(dataset),:]
print(len(train), len(test))

96 48


In [5]:
# convertir un array de valores en una matriz de conjuntos de datos
def create_dataset(dataset, look_back=1):
  dataX, dataY = [], []
  for i in range(len(dataset)-look_back-1):
    a = dataset[i:(i+look_back), 0]
    dataX.append(a)
    dataY.append(dataset[i + look_back, 0])
  return numpy.array(dataX), numpy.array(dataY)

In [6]:
# remodelamos X=t y Y=t+1
# look_back - Moficar
# LSTMs - mumero de neuronas, Cuantas Lstms, y que valores tendria sus neuronios
# Modificar la Funcion de activacion, leaning rate, optimizador (opcional)
def model_lstm(look_back = 1, optimizer = "adam", loss='mean_squared_error'):
  trainX, trainY = create_dataset(train, look_back)
  testX, testY = create_dataset(test, look_back)
  
  # cambiar la forma de la entrada para que sea[muestras, pasos de tiempo, características]
  trainX = numpy.reshape(trainX, (trainX.shape[0], trainX.shape[1],1))
  testX = numpy.reshape(testX, (testX.shape[0],testX.shape[1],1))
  
  # creacion de la red LSTM
  model = Sequential()
  #model.add(LSTM(4, input_shape=(1, look_back)))
  model.add(LSTM(8, input_shape=(look_back,1),return_sequences=True))
  model.add(LSTM(4, input_shape=(look_back,1)))
  model.add(Dense(1))
  
  
  model.compile(loss=loss, optimizer=optimizer)
  
  history = model.fit(trainX, trainY, epochs=100, batch_size=1, verbose=0)
  ## Evaluando el Modelo
  
  # hacemos las predicciones
  trainPredict = model.predict(trainX)
  testPredict = model.predict(testX)
  
  # invertimos las predicciones
  trainPredict = scaler.inverse_transform(trainPredict)
  trainY = scaler.inverse_transform([trainY])
  testPredict = scaler.inverse_transform(testPredict)
  testY = scaler.inverse_transform([testY])
  # calculamos el error rms
  trainScore = math.sqrt(mean_squared_error(trainY[0], trainPredict[:,0]))
  print('Resultado del entrenamiento: %.2f RMSE' % (trainScore))
  testScore = math.sqrt(mean_squared_error(testY[0], testPredict[:,0]))
  print('Resultado del test: %.2f RMSE' % (testScore))
  return trainScore, testScore

In [10]:
modelList = []
lookList = []
optmList = []
lossList = []
trainList = []
testList = []
cont_model = 1
for look in range(1,10,2):
  for optm in list(["adam","SGD", "Adagrad"]):
    for loss in list(["mean_squared_error","mean_absolute_error"]):
      modelList.append(f"Modelo N° {cont_model}")
      lookList.append(look) 
      optmList.append(optm)
      lossList.append(loss)
      trainS, testS = model_lstm(look_back = look, optimizer = optm, loss=loss)
      trainList.append(trainS)
      testList.append(testS)
      cont_model = cont_model + 1

Resultado del entrenamiento: 24.64 RMSE
Resultado del test: 50.05 RMSE
Resultado del entrenamiento: 22.86 RMSE
Resultado del test: 54.67 RMSE
Resultado del entrenamiento: 70.83 RMSE
Resultado del test: 214.24 RMSE
Resultado del entrenamiento: 66.96 RMSE
Resultado del test: 213.08 RMSE
Resultado del entrenamiento: 69.43 RMSE
Resultado del test: 219.71 RMSE
Resultado del entrenamiento: 72.22 RMSE
Resultado del test: 229.97 RMSE
Resultado del entrenamiento: 22.26 RMSE
Resultado del test: 46.45 RMSE
Resultado del entrenamiento: 22.84 RMSE
Resultado del test: 89.72 RMSE
Resultado del entrenamiento: 36.68 RMSE
Resultado del test: 96.17 RMSE
Resultado del entrenamiento: 33.03 RMSE
Resultado del test: 86.79 RMSE
Resultado del entrenamiento: 64.60 RMSE
Resultado del test: 199.87 RMSE
Resultado del entrenamiento: 64.78 RMSE
Resultado del test: 207.21 RMSE
Resultado del entrenamiento: 23.67 RMSE
Resultado del test: 68.16 RMSE
Resultado del entrenamiento: 22.57 RMSE
Resultado del test: 72.52 RMSE


In [11]:
import pandas as pd
# Crear un diccionario con los datos
datos = {'Model': modelList,
         'Lookback' : lookList,
         'Optimizer' : optmList,
         'Loss function': lossList,
         'MSE Train': trainList,
         'MSE Train': testList}

# Crear un DataFrame a partir del diccionario
tabla_resumen = pd.DataFrame(datos)

# Mostrar la tabla resumen
print(tabla_resumen)

           Model  Lookback Optimizer        Loss function   MSE Train
0    Modelo N° 1         1      adam   mean_squared_error   50.046564
1    Modelo N° 2         1      adam  mean_absolute_error   54.666386
2    Modelo N° 3         1       SGD   mean_squared_error  214.242038
3    Modelo N° 4         1       SGD  mean_absolute_error  213.083676
4    Modelo N° 5         1   Adagrad   mean_squared_error  219.706178
5    Modelo N° 6         1   Adagrad  mean_absolute_error  229.967436
6    Modelo N° 7         3      adam   mean_squared_error   46.446730
7    Modelo N° 8         3      adam  mean_absolute_error   89.720245
8    Modelo N° 9         3       SGD   mean_squared_error   96.170702
9   Modelo N° 10         3       SGD  mean_absolute_error   86.790243
10  Modelo N° 11         3   Adagrad   mean_squared_error  199.868958
11  Modelo N° 12         3   Adagrad  mean_absolute_error  207.207110
12  Modelo N° 13         5      adam   mean_squared_error   68.156921
13  Modelo N° 14    