<a href="https://colab.research.google.com/github/Kaiziferr/deep_learning/blob/master/multilayer_perceptron/08_workshop_time_series.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [27]:
import math
import warnings

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

from sklearn.metrics import mean_squared_error

from keras.models import Sequential
from keras.layers import Dense

**Config**

In [28]:
sns.set(style="darkgrid")
pd.set_option('display.float_format', '{:,.2f}'.format)
title_data = 'Pasajeros en la aerolinea'
paleta = sns.color_palette("tab10").as_hex()
warnings.filterwarnings("ignore")
random_seedd = 12354

# **Data**
---
Este es un problema en el que, dado un año y un mes, la tareas es predecir el número de pasajeros de aerolineas internecionales en unidades de 1.000. Los datos van desde enero de 1949 hasta diciembre de 1960 o 12 años, con 144 observaciones.


In [29]:
url = 'https://raw.githubusercontent.com/jinfagang/LSTM_learn/master/international-airline-passengers.csv'
data = pd.read_csv(url, usecols=[1], engine='python', dtype='str')
data_values = data.values.astype('float64')

# **Data Split**
---



In [30]:
train_size = int(len(data_values)*0.67)
test_size = len(data_values) - train_size
train, test = data_values[:train_size, :], data_values[train_size:, :]

# **Create Data**
---



In [31]:
len(train) - 1

95

In [32]:
def create_dataset(data, loock_back = 1):
  dataX, dataY = [], []
  for i in range(len(data)-loock_back-1):
    item_x = data[i: (i+loock_back), 0]
    #print(item_x, i, (i+loock_back))
    item_y = data[i+loock_back,0]
    #print(item_y, i, (i+loock_back))
    dataX.append(item_x)
    dataY.append(item_y)
  return np.array(dataX), np.array(dataY)

In [33]:
loock_back = 1
trainX, trainY = create_dataset(train, loock_back)
testX, testY = create_dataset(test, loock_back)

La red LSTM espera que los datos de entrada (X) se proporcionen con una estructura de matriz especifica en forma de [muestras, pasos de tiempo (ventana), caracteristicas]<br><br>
Los datos preparados tienen la forma: [muestras, carcteristicas]<br><br>

# **Diseño de Model**
---
- Capa visible con 1 entrada
- Capa oculta con 8 neuronas
- Capa de salida
- Modelo se ajusta usando el error cuadratico medio


In [34]:
loock_back

1

In [35]:
model = Sequential()
model.add(Dense(8, input_dim = loock_back, activation='relu'))
model.add(Dense(1))
model.compile(loss='mean_squared_error', optimizer='adam')
model.fit(trainX, trainY, epochs = 200, batch_size = 2, verbose = 0)

<keras.src.callbacks.History at 0x7fb063aed510>

In [36]:
trainX.shape

(94, 1)

# **Estimar rendimiento**
---

In [None]:
train_score = model.evaluate(trainX, trainY, verbose = 0)
test_score = model.evaluate(testX, testY, verbose = 0)
print('Puntuación Entrenamiento %.2f MSE (%.2f RMSE)' % (train_score, math.sqrt(train_score)))
print('Puntuación Validación %.2f MSE (%.2f RMSE)' % (test_score, math.sqrt(test_score)))

In [None]:
print(f"El modelo falla en aprocimadamente {math.sqrt(train_score)} mil pasajeros por mes para los datos de entrenamiento")
print(f"El modelo falla en aprocimadamente {math.sqrt(test_score)} para los datos de validación ")

# **Predicción**
---



In [None]:
train_predict = model.predict(trainX)
test_predict = model.predict(testX)

# **Resultados**
---



# **Plot**
---



In [None]:
train_predict_plot = np.empty_like(data_values)
train_predict_plot[:,:] = np.nan
train_predict_plot[loock_back: len(train_predict)+loock_back, :] = train_predict

test_predict_plot = np.empty_like(data_values)
test_predict_plot[:,:] = np.nan
test_predict_plot[len(train_predict)+(loock_back*2)+1: len(data_values)-1:] = test_predict

In [None]:
plt.figure(figsize=(12,8))
plt.plot(data_values)
plt.plot(train_predict_plot)
plt.plot(test_predict_plot)

- Se puede apreciar que el modelo ha hecho un trabajo bastante pobre a la hora de ajustar. Tanto en el entrenamiento como en la validación. **Básicamente, lo que ha hecho es predecir el mismo valor de entrada que la salida.**



- Una red Multilayer perceptron es una arquitectura pesima para trabajar con series de tiempo.

# **Diseño de Model Mejoras**
---
- Capa visible con 3 entrada
- Capa oculta con 14 neuronas
- Agrega una segunda capa oculta con 8 neuronas
- Capa de salida
- Modelo se ajusta usando el error cuadratico medio
- Aumenta el número de epocas de 400

# **Create Data**
---

In [None]:
loock_back = 3
trainX, trainY = create_dataset(train, loock_back)
testX, testY = create_dataset(test, loock_back)

In [None]:
model = Sequential()
model.add(Dense(14, input_dim = 3, activation = 'relu', kernel_initializer='glorot_uniform'))
model.add(Dense(8, activation='relu', kernel_initializer='glorot_uniform'))
model.add(Dense(1))
model.compile(loss='mean_squared_error', optimizer = 'adam')

In [None]:
model.fit(trainX, trainY, epochs = 400, batch_size = 2, verbose = 0)

# **Estimar rendimiento**
---

In [None]:
train_score = model.evaluate(trainX, trainY, verbose = 0)
test_score = model.evaluate(testX, testY, verbose = 0)
print('Puntuación Entrenamiento %.2f MSE (%.2f RMSE)' % (train_score, math.sqrt(train_score)))
print('Puntuación Validación %.2f MSE (%.2f RMSE)' % (test_score, math.sqrt(test_score)))

In [None]:
print(f"El modelo falla en aprocimadamente {math.sqrt(train_score)} mil pasajeros por mes para los datos de entrenamiento")
print(f"El modelo falla en aprocimadamente {math.sqrt(test_score)} para los datos de validación ")

# **Predicción**
---



In [None]:
train_predict = model.predict(trainX)
test_predict = model.predict(testX)

# **Plot**
---

In [None]:
train_predict_plot = np.empty_like(data_values)
train_predict_plot[:,:] = np.nan
train_predict_plot[loock_back: len(train_predict)+loock_back, :] = train_predict

test_predict_plot = np.empty_like(data_values)
test_predict_plot[:,:] = np.nan
test_predict_plot[len(train_predict)+(loock_back*2)+1: len(data_values)-1:] = test_predict

In [None]:
plt.figure(figsize=(12,8))
plt.plot(data_values)
plt.plot(train_predict_plot)
plt.plot(test_predict_plot)

- Aun persiste un mal ajuste con un modelo tradicional., pese algunas mejoras