In [1]:
# Importo las bibliotecas a utilizar
import numpy as np
import pandas as pd
import tensorflow as tf
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import KFold
import matplotlib.pyplot as plt

In [2]:
def create_dataset(dataset, look_back=1):
    """
    Se generan los instantes en tiempos t hacia atras
    para lograr predecir el instante t

    :param dataset: conjunto de datos completos
    :param look_back: cuantos instantes de tiempo t hacia atras seran utilizados
    :return: una matriz con los instantes de tiempo hacia atras y el instante presente
    """

    dataX = []
    dataY = []
    for i in range(len(dataset)-look_back):
        a = dataset[i:(i+look_back), 0]
        dataX.append(a)
        dataY.append(dataset[i + look_back, 0])
    return np.array(dataX), np.array(dataY)

In [3]:
def remuestre(cantidad, dataframe):
    """
    Se hace un re muestreo en el dataframe disminuyendo la cantidad total
    de datos
    :param cantidad: cantidad de datos que seran promediados
    :param dataframe: el dataframe con el que se esta trabajando
    :return: dataframe: es el dataframe ya remuestrado
    """
    suma = 0
    contador = 0
    eliminar = []
    for i in range(len(dataframe)):
        contador += 1
        suma += dataframe.loc[i]
        if (contador == cantidad):
            dataframe.loc[i] = suma / cantidad
            contador = 0
            suma = 0
        else:
            eliminar.append(i)
    dataframe = dataframe.drop(dataframe.index[eliminar])
    return dataframe

In [4]:
def execute_lstm(unidades, date, look_back, neuronas, epocas, capas='2', training_split=0.67, optimizacion='adam'):    
    """
    función que reune la lógica de construcción, entrenamiento y test de la red recurrente LSTM
    """
    # normalizacion del dataset
    scaler = MinMaxScaler(feature_range=(0, 1))
    unidades = scaler.fit_transform(unidades)
    date = scaler.fit_transform(date)

    print('transformando datos')

    tf.keras.callbacks.Callback()
    train_size = int(len(date) * training_split)
    test_size = len(date) - train_size
    date_train, date_test = date[0:train_size, :], date[train_size:len(date), :]
    unidades_train, unidades_test = unidades[0:train_size, :], unidades[train_size:len(unidades), :]
    print(len(date_train), len(unidades_test))

    date_train_lookback, date_train_tiempo_actual = create_dataset(date_train, look_back)  # date_train_lookback es la presion Entrenamiento
    date_test_lookback, date_test_tiempo_actual = create_dataset(date_test, look_back)  # date_test_lookback es la presion de test
    unidades_train_lookback, unidades_train_tiempo_actual = create_dataset(unidades_train, look_back)  # unidades_train_tiempo_actual autorregulacion de entrenamiento
    unidades_test_lookback, unidades_test_tiempo_actual = create_dataset(unidades_test, look_back)  # unidades_test_tiempo_actual autorregulacion de test

    #transformacion necesaria, para ser utilizados los datos para entrar a la red neuronal
    date_train_lookback = np.reshape(date_train_lookback, (date_train_lookback.shape[0], 1, date_train_lookback.shape[1]))
    date_test_lookback = np.reshape(date_test_lookback, (date_test_lookback.shape[0], 1, date_test_lookback.shape[1]))
    print('datos transformados')

    # create and fit the LSTM network
    csv_logger = tf.keras.callbacks.CSVLogger('training.log', separator=',', append=False)
    model = tf.keras.models.Sequential()
    print('se crea modelo')
    model.add(tf.keras.layers.LSTM(neuronas, return_sequences = True, input_shape=(1, look_back)))
    for i in range(capas):
        model.add(tf.keras.layers.LSTM(neuronas, return_sequences = True))
    model.add(tf.keras.layers.LSTM(neuronas))
    model.add(tf.keras.layers.Dense(1))
    print('se añaden capas')
    model.compile(loss='mse', optimizer=optimizacion)
    print('se compila modelo')
    model.fit(date_train_lookback, unidades_train_tiempo_actual, epochs=20, batch_size=16, validation_split=0.1, verbose=1, callbacks=[csv_logger])
    print('fit del modelo')

    trainPredict = model.predict(date_train_lookback)
    testPredict = model.predict(date_test_lookback)

    corr = np.corrcoef(unidades_test_tiempo_actual, testPredict[:, 0])
    print('Test Score: %.2f CORRELACION' % (corr[1][0]))

    trainPredictPlot = np.empty_like(unidades)
    trainPredictPlot[:, :] = np.nan
    trainPredictPlot[look_back:len(trainPredict) + look_back, :] = trainPredict

    testPredictPlot = np.empty_like(unidades)
    testPredictPlot[:, :] = np.nan
    testPredictPlot[len(trainPredict) + (look_back * 2) - 1 :len(unidades) - 1, :] = testPredict

    plt.plot(unidades)
    plt.plot(trainPredictPlot)
    plt.plot(testPredictPlot)
    plt.title("LSTM con %i neuronas, correlacion: %.2f" % (neuronas, corr[1][0] * 100))
    plt.ylabel("Unidades de Carne Vendidas")
    plt.xlabel("Tiempo")
    plt.show()

    registro = pd.read_csv('training.log', sep=",")
    plt.plot(registro["epoch"].values, registro["loss"].values)
    plt.title("Error LSTM con %i neuronas, correlacion: %.2f" % (neuronas, corr[1][0] * 100))
    plt.ylabel("Error")
    plt.xlabel("Epocas")
    plt.show()
    
    return model, trainPredict, testPredict, scaler





In [5]:
# TRATAMIENTO DE DATOS
data = pd.read_csv('data/DATOS_TRATADOS_CON_FECHAS_INT.csv')

In [6]:
data

Unnamed: 0,ANO,MES,DIA,UNIDADES,DIA_SEMANA,FECHAS_IMPORT
0,2016,1,2,125.585999,6,0
1,2016,1,3,70.968002,7,0
2,2016,1,4,36.124001,1,0
3,2016,1,5,87.123001,2,0
4,2016,1,6,42.476002,3,0
...,...,...,...,...,...,...
974,2018,10,27,261.881988,6,0
975,2018,10,28,43.129002,7,0
976,2018,10,29,32.816002,1,0
977,2018,10,30,55.976002,2,0


In [7]:
unidades = pd.DataFrame(data['UNIDADES'])
unidades = unidades.values
unidades = unidades.astype('float32')

date = pd.DataFrame(data["DIA_SEMANA"])
date['DIA'] = data["DIA"]
date['ANO'] = data["ANO"]
date['MES'] = data["MES"]
date['FECHAS_IMPORT']=data["FECHAS_IMPORT"]
date = date.values
date = date.astype('float32')

## ARQUITECTURA NEURONAL 
- Ventana de tiempo (look_back) de 3 meses
- 200 neuronas
- 200 epocas de entrenamiento
- Función de optimización adam
- Función de activación tanh
- Entrenamiento y test: 
    - Validación cruzada 70% - 30%

### Resultado:
- Correlación de un 42.35%
- Modelo:
![image.png](attachment:image.png)

- Error:
![image.png](attachment:image.png)

In [8]:
## EJECUCIÓN DE LA FUNCIÓN DE CONSTRUCCIÓN, ENTRENAMIENTO Y TEST DE LA RED
execute_lstm(unidades, date, look_back=16, neuronas=20, epocas=20, capas=2, training_split=0.7,optimizacion='adam')

transformando datos
685 294
datos transformados
Metal device set to: Apple M1

systemMemory: 8.00 GB
maxCacheSize: 2.67 GB

se crea modelo


2022-01-23 12:48:50.343404: I tensorflow/core/common_runtime/pluggable_device/pluggable_device_factory.cc:305] Could not identify NUMA node of platform GPU ID 0, defaulting to 0. Your kernel may not have been built with NUMA support.
2022-01-23 12:48:50.343561: I tensorflow/core/common_runtime/pluggable_device/pluggable_device_factory.cc:271] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 0 MB memory) -> physical PluggableDevice (device: 0, name: METAL, pci bus id: <undefined>)


se añaden capas
se compila modelo
Epoch 1/20


2022-01-23 12:48:50.685316: W tensorflow/core/platform/profile_utils/cpu_utils.cc:128] Failed to get CPU frequency: 0 Hz
2022-01-23 12:48:51.910124: I tensorflow/core/grappler/optimizers/custom_graph_optimizer_registry.cc:112] Plugin optimizer for device_type GPU is enabled.


## ARQUITECTURA NEURONAL 
- Ventana de tiempo (look_back) de 6 meses
- 200 neuronas
- 200 epocas de entrenamiento
- Función de optimización adam
- Función de activación tanh
- Entrenamiento y test: 
    - Validación cruzada 70% - 30%

### Resultado:
- Correlación de un 49.20%
- Modelo:
![image.png](attachment:image.png)

- Error: 
![image.png](attachment:image.png)

In [None]:
## EJECUCIÓN DE LA FUNCIÓN DE CONSTRUCCIÓN, ENTRENAMIENTO Y TEST DE LA RED
execute_lstm(unidades, date, look_back=180, neuronas=200, epocas=200, capas=6, training_split=0.7,optimizacion='adam', act='tanh')

## 

## ARQUITECTURA NEURONAL 
- Ventana de tiempo (look_back) de 3 meses
- 200 neuronas
- 200 epocas de entrenamiento
- Función de optimización adam
- Función de activación tanh
- Entrenamiento y test: 
    - Validación cruzada 70% - 30%

### Resultado:
- Correlación de un 27.31%
- Modelo:
![image.png](attachment:image.png)

- Error: 
![image.png](attachment:image.png)

In [None]:
## EJECUCIÓN DE LA FUNCIÓN DE CONSTRUCCIÓN, ENTRENAMIENTO Y TEST DE LA RED
execute_lstm(unidades, date, look_back=180, neuronas=300, epocas=300, capas=6, training_split=0.7,optimizacion='adam', act='tanh')
##

## PREDICCIÓN
- Haciendo uso del mejor modelo (de acuerdo a correlación y estabilidad) 


In [None]:
## EJECUCIÓN DE LA FUNCIÓN DE CONSTRUCCIÓN, ENTRENAMIENTO Y TEST DE LA RED
model1, trainPredict1, testPredict1, scaler1 = execute_lstm(unidades, date, look_back=90, neuronas=200, epocas=200, capas=6, training_split=0.7,optimizacion='adam', act='tanh')

#

In [None]:
# DATOS DEL MES DE NOVIEMBRE A PREDECIR
predict_data1 = pd.read_csv('./INPUT_DATA_PREDICT.CSV')
scaler = MinMaxScaler(feature_range=(0, 1))
unidades1 = scaler.fit_transform(unidades)

In [None]:
predict_data1 = predict_data1.values
predict_data1 = predict_data1.astype('float32')

In [None]:
#se define lookback igual al usado en modelo neuronal
look_back1 = 90
predict_data_lookback1, predict_data_tiempo_actual1  = create_dataset(predict_data1, look_back1) 

In [None]:
predict_data_lookback1 = np.reshape(predict_data_lookback1, (predict_data_lookback1.shape[0], 1, predict_data_lookback1.shape[1]))
#Predicción
predict_model1 = model.predict(predict_data_lookback1)



In [None]:
trainPredictPlot = np.empty_like(unidades)
trainPredictPlot[:, :] = np.nan
trainPredictPlot[look_back1:len(trainPredict) + look_back1, :] = trainPredict

In [None]:
testPredictPlot = np.empty_like(unidades)
testPredictPlot[:, :] = np.nan
testPredictPlot[len(trainPredict) + (look_back1 * 2) - 1 :len(unidades) - 1, :] = testPredict

In [None]:
plt.plot(unidades1)
plt.plot(trainPredictPlot)
plt.plot(testPredictPlot)
plt.title("Primer Modelo LSTM escogido")
plt.ylabel("Unidades de Carne Vendidas")
plt.xlabel("Tiempo")
plt.show()