# Laboratorio 5.2: Redes LSTM

Construiremos dos ejemplos de redes neuronales recurrentes utilizando LSTM.

## 1. Descargar las base de datos de dos series de tiempo

In [None]:
#https://machinelearningmastery.com/time-series-forecasting-long-short-term-memory-network-python/
!wget https://raw.githubusercontent.com/jbrownlee/Datasets/master/shampoo.csv
#https://machinelearningmastery.com/time-series-prediction-lstm-recurrent-neural-networks-python-keras/
!wget https://raw.githubusercontent.com/jbrownlee/Datasets/master/airline-passengers.csv

## 2. Cargar librerías

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import torch
import torch.nn as nn
from sklearn.preprocessing import MinMaxScaler

## 3. Cargando y revisando los datos de pasajeros de una aerolínea

Leer los datos utilizando Pandas.

In [None]:
training_set = pd.read_csv('/content/airline-passengers.csv')

training_set.head()

Graficamos los datos.

In [None]:
training_set_np = training_set.iloc[:, 1:2].values

# print(training_set_np.shape)

plt.plot(training_set_np)
plt.suptitle('Cantidad de pasajeros')
plt.show()

## 4. Creación de ventana deslizante

Creamos una ventana deslizante, dada una secuencia de tamaño n se desea predecir el siguiente punto.

In [None]:
def sliding_windows(data, seq_length):
    x = []
    y = []

    for i in range(len(data)-seq_length-1):
        _x = data[i:(i+seq_length)]
        _y = data[i+seq_length]
        x.append(_x)
        y.append(_y)

    return np.array(x),np.array(y)

#escalamos los datos
sc = MinMaxScaler()
training_data = sc.fit_transform(training_set_np)

seq_length = 4
x, y = sliding_windows(training_data, seq_length)

## 5. Seleccionamos datos de entrenamiento y validación

Creamos dos particiones una de entrenamiento y otra de validación. Donde esta última, son los datos después de cierta fecha.

In [None]:
device = torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')

# Conjunto de entrenamiento
train_size = int(len(y) * 0.67)
# Conjunto validacion
val_size = len(y) - train_size

x_train = torch.tensor(x[0:train_size],device=device)
y_train = torch.tensor(y[0:train_size],device=device)
x_val = torch.tensor(x[val_size:],device=device)
y_val = torch.tensor(y[val_size:],device=device)

x = torch.tensor(x,device=device)
y = torch.tensor(y,device=device)

Modelo

In [None]:
class LSTM(nn.Module):
    def __init__(self, num_classes, input_size, hidden_size, num_layers):
        super(LSTM, self).__init__()
        self.num_classes = num_classes
        self.num_layers = num_layers
        self.input_size = input_size
        self.hidden_size = hidden_size
        self.seq_length = seq_length
        
        self.lstm = nn.LSTM(input_size=input_size, hidden_size=hidden_size,
                            num_layers=num_layers, batch_first=True)
        
        self.fc = nn.Linear(hidden_size, num_classes)

    def forward(self, x):    
      ula, (h_n, _) = self.lstm(x)
      h_n = h_n.view(-1, self.hidden_size)
      out = self.fc(h_n)

      return out

In [None]:
num_epochs = 2000
learning_rate = 0.01

input_size = 1
hidden_size = 2
num_layers = 1

num_classes = 1

#por defecto se crea una lstm con precision de 16bit, en pytorch 1.6.0 hay un bug que no permite el uso de 16bit con lstm
#pasamos la red a doble precision
lstm = LSTM(num_classes, input_size, hidden_size, num_layers).to(device).double()


criterion = torch.nn.MSELoss() 
optimizer = torch.optim.Adam(lstm.parameters(), lr=learning_rate)

# Entrenamiento
for epoch in range(num_epochs):
    outputs = lstm(x_train)
    optimizer.zero_grad()
    loss = criterion(outputs, y_train)
    loss.backward()
    optimizer.step()
    if epoch % 100 == 0:
      print("Epoch: %d, loss: %1.5f" % (epoch, loss.item()))

Vemos el resultado sobre el set de datos

In [None]:
lstm.eval()
train_predict = lstm(x)

data_predict = train_predict.cpu().data.numpy()
dataY_plot = y.cpu().data.numpy()

data_predict = sc.inverse_transform(data_predict)
dataY_plot = sc.inverse_transform(dataY_plot)
#Dibujamos una linea roja que nos dira cuando comienza el set de validacion
plt.axvline(x=train_size, c='r', linestyle='--')

plt.plot(dataY_plot)
plt.plot(data_predict)
plt.suptitle('Predicción de la serie de tiempo')
plt.xlabel('Tiempo [día]')
plt.ylabel('Número de pasajeros')
plt.show()

# Laboratorio: Base de datos Shampoo

Este conjunto de datos describe el número mensual de ventas de Shampoo durante un período de 3 años. Las unidades son un conteo de ventas y hay 36 observaciones. El conjunto de datos original se atribuye a Makridakis, Wheelwright y Hyndman (1998).


Nota: Tenga cuidado con las variables training_set, debido a tienen el mismo nombre para diferentes experimentos.

In [None]:
training_set = pd.read_csv('shampoo.csv')
training_set.head()

In [None]:
training_set = training_set.iloc[:,1:2].values
plt.plot(training_set )
plt.suptitle('Ventas de shampoo')
plt.show()

In [None]:
sc = MinMaxScaler()
training_data = sc.fit_transform(training_set)
seq_length = 4
x, y = sliding_windows(training_data, seq_length)

In [None]:
device = torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')

train_size = int(len(y) * 0.67)
val_size = len(y) - train_size

x_train = torch.tensor(x[0:train_size],device=device)
y_train = torch.tensor(y[0:train_size],device=device)
x_val = torch.tensor(x[val_size:],device=device)
y_val = torch.tensor(y[val_size:],device=device)

x = torch.tensor(x,device=device)
y = torch.tensor(y,device=device)


In [None]:
num_epochs = 8000
learning_rate = 0.01

input_size = 1
hidden_size = 4
num_layers = 1

num_classes = 1

#por defecto se crea una lstm con precision de 16bit, en pytorch 1.6.0 hay un bug que no permite el uso de 16bit con lstm
#pasamos la red a doble precision
lstm = LSTM(num_classes, input_size, hidden_size, num_layers).to(device).double()

criterion = torch.nn.MSELoss()    # mean-squared error for regression
optimizer = torch.optim.Adam(lstm.parameters(), lr=learning_rate)
#optimizer = torch.optim.SGD(lstm.parameters(), lr=learning_rate)

# Train the model
for epoch in range(num_epochs):
    outputs = lstm(x_train)
    optimizer.zero_grad()
    
    # obtain the loss function
    loss = criterion(outputs, y_train)
    
    loss.backward()
    
    optimizer.step()
    if epoch % 100 == 0:
      print("Epoch: %d, loss: %1.5f" % (epoch, loss.item()))

In [None]:
lstm.eval()
train_predict = lstm(x)

data_predict = train_predict.cpu().data.numpy()
dataY_plot = y.cpu().data.numpy()

data_predict = sc.inverse_transform(data_predict)
dataY_plot = sc.inverse_transform(dataY_plot)

plt.axvline(x=train_size, c='r', linestyle='--')

plt.plot(dataY_plot)
plt.plot(data_predict)
plt.suptitle('Time-Series Prediction')
plt.show()

# Laboratorio 4: Mejorar los resultados de la base de datos de Shampoo

Se pide:

1. Mejorar los resultados de el actual código utilizando redes neuronales recurrentes LSTM.
2. Comparar los resultados del código actual vs el código propuesto por usted o su grupo (utilice métricas para comparar ambos resultados).


In [None]:
# Código

In [None]:
# Gráficos

## Resultados

## Conclusiones