#### Este baseline se basara en armar un modelo LSTM por cada producto, con una optimizacion de hiper parametros escueta, para poder comparar con futuros experimientos. En caso de que esta alternativa funcione bien, seria recomendable incorporar parametros de optimizacion extra.

#### Imports

In [13]:
import warnings
warnings.filterwarnings('ignore')

import pandas as pd
import numpy as np
from keras.models import Sequential
from keras.layers import LSTM, Dense, Dropout, BatchNormalization
from keras.regularizers import l2
from keras.callbacks import EarlyStopping, ReduceLROnPlateau
from keras.optimizers import Adam, RMSprop, SGD
from kerastuner.tuners import BayesianOptimization
from keras import backend as K

In [14]:
final_dataset = pd.read_csv('../../Datasets/final_dataset.csv', sep='\t')

In [15]:
final_dataset.head()

Unnamed: 0,product_id,periodo,plan_precios_cuidados,cust_request_qty,cust_request_tn,y,cat1,cat2,cat3,brand,sku_size,stock_final,close_quarter,age
0,20001,201701,0,479,937.72717,934.77222,HC,ROPA LAVADO,Liquido,ARIEL,3000,,0,0
1,20001,201702,0,432,833.72187,798.0162,HC,ROPA LAVADO,Liquido,ARIEL,3000,,0,1
2,20001,201703,0,509,1330.74697,1303.35771,HC,ROPA LAVADO,Liquido,ARIEL,3000,,1,2
3,20001,201704,0,279,1132.9443,1069.9613,HC,ROPA LAVADO,Liquido,ARIEL,3000,,0,3
4,20001,201705,0,701,1550.68936,1502.20132,HC,ROPA LAVADO,Liquido,ARIEL,3000,,0,4


In [16]:
# columns = ['plan_precios_cuidados', 'cust_request_qty', 'cust_request_tn', 'close_quarter', 'age', 'y']
columns = ['plan_precios_cuidados', 'cust_request_qty', 'cust_request_tn', 'close_quarter','y']
n_features = 5

#### Funcion para preparar los datos y crear el modelo

El objetivo es predecir 2 dias en el futuro, por lo que la idea es re-armar el dataset. Donde el valor de X sera el conjunto de datos desde i-0 hasta i-n, y el valor de "y" sera el valor de "y" 2 meses en el futuro ( i+2 ).

In [17]:
def prepare_data(data, n_steps):
    X, y = [], []
    for i in range(len(data)):
        end_ix = i + n_steps
        if end_ix >= len(data):
            break
        seq_x, seq_y = data[:i+1, :], data[end_ix, -1]  # y es 2 periodos en el futuro
        X.append(seq_x)
        y.append(seq_y)
    return np.array(X, dtype=object), np.array(y)


Definimos la funcion para crear el modelo LSTM, sobre este se ejecutara la optimizacion bayesiana

In [18]:
n_steps = 2  # número de pasos de tiempo
epochs = 100
batch_size = 32
predictions = []

In [19]:
def build_model(hp):
    activation = hp.Choice('activation', values=['relu', 'tanh', 'sigmoid'])
    units = hp.Int('units', min_value=32, max_value=256, step=32)
    dropout = hp.Float('dropout', min_value=0.1, max_value=0.5, step=0.1)
    learning_rate = hp.Choice('learning_rate', values=[1e-2, 1e-3, 1e-4])
    l2_penalty = hp.Choice('l2_penalty', values=[1e-2, 1e-3, 1e-4])
    depth = hp.Int('depth', min_value=1, max_value=5)
    optimizer = hp.Choice('optimizer', values=['adam', 'rmsprop', 'sgd'])

    model = Sequential()
    model.add(LSTM(units=int(units/2), activation=activation, input_shape=(None, n_features), return_sequences=True, kernel_regularizer=l2(l2_penalty)))
    model.add(Dropout(dropout))
    model.add(BatchNormalization())
    
    for _ in range(depth - 1):
        model.add(LSTM(units=units, activation=activation, return_sequences=True, kernel_regularizer=l2(l2_penalty)))
        model.add(Dropout(dropout))
        model.add(BatchNormalization())
    
    model.add(LSTM(units=int(units*2), activation=activation, kernel_regularizer=l2(l2_penalty)))
    model.add(Dropout(dropout))
    model.add(BatchNormalization())
    model.add(Dense(1, activation='relu'))

    if optimizer == 'adam':
        optimizer = Adam(learning_rate=learning_rate)
    elif optimizer == 'rmsprop':
        optimizer = RMSprop(learning_rate=learning_rate)
    elif optimizer == 'sgd':
        optimizer = SGD(learning_rate=learning_rate)

    model.compile(optimizer=optimizer, loss='mse')

    return model

#### Armado de los modelos

In [20]:
# # Codigo para visualizar como queda la estructura de X e y para 1 producto en particular
# product_ids = final_dataset['product_id'].unique()
# product_id =  product_ids[0]
# product_data = final_dataset[final_dataset['product_id'] == product_id].sort_values(by='periodo')[columns]
# product_data_array = product_data.values
# X, y = prepare_data(product_data_array, n_steps)

# display(product_data)
# display(X)

In [21]:
# TODO: ADD SCALER
# from sklearn.preprocessing import MinMaxScaler

# scaler = MinMaxScaler()

In [23]:
import os
import random


product_ids = final_dataset['product_id'].unique()
    
for product_id in product_ids:
    
    tuner = BayesianOptimization(
        build_model,
        objective='val_loss',
        max_trials=15, # Decrementar a 2 para una prueba "rapida" al validar algun cambio
        executions_per_trial=2,
        directory='bayesian_optimization',
        project_name=f'lstm_hyperparameters_{product_id}')
    
    # Modifico la semilla en cada iteracion, sino genera 1 modelo solo y luego predice siempre con el mismo.
    # Asi me aseguro que arme 1 modelo por cada producto, osea, que se vuevla a ejecutar la bayesiana.
    seed = np.random.randint(0, 10000)
    random.seed(seed)

    product_data = final_dataset[final_dataset['product_id'] == product_id].sort_values(by='periodo')[columns]
    
    # Convertir los datos a numpy array
    product_data_array = product_data.values
    
    if len(product_data_array) < 3:
        # last_y = product_data_array[-1, -1] * 1.05 # Usar el valor de "y" del último registro multiplicado por 1.05 como predicción por la celda anteior
        last_y = product_data_array[:, -1].mean()
        predictions.append({'product_id': product_id, 'predicted_y': last_y})
        print(f'No se generó modelo para el producto {product_id}. Predicción a 2 meses: {last_y}')
        continue
    
    # Preparar los datos para LSTM
    X, y = prepare_data(product_data_array, n_steps)

    # Callback para detener el entrenamiento temprano
    early_stopping = EarlyStopping(monitor='val_loss', patience=20, restore_best_weights=True)
    reduce_lr = ReduceLROnPlateau(monitor='val_loss', factor=0.01, patience=10, min_lr=0.0001)

    max_length = max(len(seq) for seq in X)
    X_padded = np.array([np.pad(seq, ((max_length - len(seq), 0), (0, 0)), 'constant') for seq in X]) # Pad left para que cada registro tenga la misma longitud
    
    # Convertir X a una lista de arrays para que funcione con keras tuner
    X_list = [x.tolist() for x in X_padded]


    tuner.search(np.array(X_list), y, epochs=epochs, batch_size=batch_size, validation_split=0.1, callbacks=[early_stopping, reduce_lr], verbose = 0 )
    best_model = tuner.get_best_models(num_models=1)[0]

    # Guardar el modelo
    os.makedirs('Models_params', exist_ok=True)
    best_model.save(f'Models_params/model_product_{product_id}.h5')

    last_record = product_data_array
    last_record = last_record.reshape((1, last_record.shape[0], last_record.shape[1]))
    predicted_y = best_model.predict(last_record)[0][0]

    # Agregar predicción al resultado
    predictions.append({'product_id': product_id, 'predicted_y': predicted_y})

    print(f'Modelo para el producto {product_id} entrenado y guardado. Predicción a 2 meses: {predicted_y}')

Reloading Tuner from bayesian_optimization/lstm_hyperparameters_20001/tuner0.json


KeyboardInterrupt: 

In [None]:
predictions_df = pd.DataFrame(predictions)
predictions_df.to_csv('../../Datasets/predictions_lstm_productos_bayesiana.csv', index=False)

print('Todas las predicciones han sido generadas y guardadas en predictions.csv.')

Todas las predicciones han sido generadas y guardadas en predictions.csv.
