In [1]:
from datetime import datetime
import pandas as pd
import numpy as np

import matplotlib.pyplot as plt

from sklearn.metrics import mean_squared_error
from sklearn.preprocessing import OrdinalEncoder

import xgboost as xgb

from statsmodels.graphics.tsaplots import plot_acf, plot_pacf

from sklearn.linear_model import Ridge
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error
from sklearn.metrics import mean_absolute_error
from sklearn.preprocessing import StandardScaler

import skforecast
from skforecast.ForecasterAutoreg import ForecasterAutoreg
from skforecast.ForecasterAutoregCustom import ForecasterAutoregCustom
from skforecast.ForecasterAutoregDirect import ForecasterAutoregDirect
from skforecast.model_selection import grid_search_forecaster
from skforecast.model_selection import backtesting_forecaster
from skforecast.utils import save_forecaster
from skforecast.utils import load_forecaster
import shap


  from .autonotebook import tqdm as notebook_tqdm


## Cargo Dataset principal

In [2]:
df = pd.read_csv('../../data/Top100_prediction_con.csv')

In [3]:
# Lista para guardar resultados
resultados = []

# Copia del DataFrame original
df_original = df.copy()

# Seleccionar los primeros 5 productos únicos
productos = list(df_original['item'].unique())

for producto in productos:
    # Filtrar el DataFrame para el producto actual
    df_filtrado = df_original[(df_original['store_code'] == 'BOS_1') & (df_original['item'] == producto)]
    
    # Verificar si hay suficientes datos
    if len(df_filtrado) < 30 + 14:  # Necesitas al menos 44 registros
        print(f"Advertencia: No hay suficientes datos para el producto {producto}. Saltando...")
        continue
    
    # Preparar los datos
    ts_predict = df_filtrado[['date', 'sales', 'weekday', 'event']]
    ts_predict = pd.get_dummies(data=ts_predict, columns=['weekday'], dtype=int)
    ts_predict['date'] = pd.to_datetime(ts_predict['date'])
    ts_predict.sort_values('date', ascending=True, inplace=True)
    ts_predict.set_index('date', inplace=True)
    ts_predict = ts_predict.asfreq('D')

    # Separar en entrenamiento y prueba
    y, exog = ts_predict['sales'], ts_predict.drop(columns=['sales'])
    y_train, y_test = y[:-30], y[-30:]
    exog_train, exog_test = exog[:-30], exog[-30:]

    # Inicializar el modelo Forecaster
    forecaster = ForecasterAutoreg(
        regressor=RandomForestRegressor(max_depth=None, min_samples_leaf=2, min_samples_split=5, n_estimators=100),
        lags=14
    )
    
    # Ajustar el modelo
    forecaster.fit(y=y_train, exog=exog_train)
    
    # Predecir
    predicciones = forecaster.predict(steps=30, exog=exog_test)
    
    # Almacenar resultados
    resultados.append({
        'producto': producto,
        'prediccion': predicciones.values,
        'test': y_test.values
    })
    
    #print(f"Predicciones generadas para el producto: {producto}")




In [8]:
tiendas_inventario = pd.DataFrame(resultados)

In [11]:
tiendas_inventario['test_suma'] = tiendas_inventario['test'].apply(sum)


In [14]:
tiendas_inventario['test_suma'] = tiendas_inventario['test'].apply(sum)
suma = tiendas_inventario['test_suma'].sum()
tiendas_inventario['prediccion'] = tiendas_inventario['prediccion'].apply(lambda x: np.round(x, decimals=0))
tiendas_inventario['tiendas_inventario_test'] = tiendas_inventario['prediccion'].apply(lambda x: sum(x[:30]))
tiendas_inventario['tiendas_inventario_prediction'] = tiendas_inventario['prediccion'].apply(lambda x: sum(x[30:]))
tiendas_inventario[['producto','test_suma','tiendas_inventario_test','tiendas_inventario_prediction']]

Unnamed: 0,producto,test_suma,tiendas_inventario_test,tiendas_inventario_prediction
0,ACCESORIES_1_108,23,13.0,0
1,HOME_&_GARDEN_1_027,30,42.0,0
2,HOME_&_GARDEN_1_053,63,88.0,0
3,HOME_&_GARDEN_1_140,73,55.0,0
4,HOME_&_GARDEN_1_177,23,41.0,0
...,...,...,...,...
95,SUPERMARKET_3_499,255,313.0,0
96,ACCESORIES_1_158,158,144.0,0
97,SUPERMARKET_3_282,438,505.0,0
98,ACCESORIES_1_354,19,96.0,0


In [15]:
total_inventario_productos_real = tiendas_inventario['test_suma'].sum()
total_inventario_productos_predicho = tiendas_inventario['tiendas_inventario_test'].sum()
print(total_inventario_productos_real)
print(total_inventario_productos_predicho)
print(total_inventario_productos_real - total_inventario_productos_predicho)

22972
22890.0
82.0


: 

In [4]:
pd.DataFrame(resultados)

Unnamed: 0,producto,prediccion,test
0,ACCESORIES_1_108,"[0.38621953923269714, 0.2520515873015873, 0.51...","[0, 1, 1, 1, 1, 2, 0, 1, 3, 0, 2, 0, 0, 0, 3, ..."
1,HOME_&_GARDEN_1_027,"[1.689412698412699, 2.5209033189033185, 1.5233...","[1, 5, 0, 1, 0, 2, 1, 4, 1, 1, 1, 1, 0, 0, 1, ..."
2,HOME_&_GARDEN_1_053,"[3.0046706349206347, 4.054483044733044, 3.6305...","[3, 3, 5, 2, 2, 0, 3, 3, 8, 1, 4, 2, 1, 4, 1, ..."
3,HOME_&_GARDEN_1_140,"[2.28897619047619, 1.763686507936508, 1.804333...","[3, 4, 0, 1, 5, 1, 2, 1, 5, 0, 4, 2, 3, 2, 5, ..."
4,HOME_&_GARDEN_1_177,"[2.3563888888888886, 1.6558225108225109, 0.992...","[2, 3, 5, 0, 1, 1, 2, 1, 2, 2, 2, 2, 0, 0, 0, ..."
...,...,...,...
95,SUPERMARKET_3_499,"[10.804940476190477, 13.684136363636364, 12.08...","[12, 8, 2, 6, 2, 10, 7, 5, 4, 9, 8, 1, 10, 14,..."
96,ACCESORIES_1_158,"[4.912071428571429, 5.612323953823953, 4.37860...","[10, 4, 10, 6, 7, 6, 2, 3, 6, 4, 3, 9, 4, 1, 5..."
97,SUPERMARKET_3_282,"[16.589858585858593, 25.950972222222216, 17.87...","[15, 31, 15, 11, 9, 21, 15, 7, 7, 8, 12, 12, 1..."
98,ACCESORIES_1_354,"[1.5094166666666666, 3.9943055555555547, 3.793...","[0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 2, 0, 0, 0, ..."


### PREDICCION

In [5]:
# Lista para guardar resultados
resultados = []

# Copia del DataFrame original
df_original = df.copy()

# Seleccionar los primeros 5 productos únicos
productos = list(df_original['item'].unique())

for producto in productos:
    # Filtrar el DataFrame para el producto actual
    df_filtrado = df_original[(df_original['store_code'] == 'BOS_1') & (df_original['item'] == producto)]
    
    # Verificar si hay suficientes datos
    if len(df_filtrado) < 30 + 14:  # Necesitas al menos 44 registros
        print(f"Advertencia: No hay suficientes datos para el producto {producto}. Saltando...")
        continue
    
    # Preparar los datos
    ts_predict = df_filtrado[['date', 'sales', 'weekday', 'event']]
    ts_predict = pd.get_dummies(data=ts_predict, columns=['weekday'], dtype=int)
    ts_predict['date'] = pd.to_datetime(ts_predict['date'])
    ts_predict.sort_values('date', ascending=True, inplace=True)
    ts_predict.set_index('date', inplace=True)
    ts_predict = ts_predict.asfreq('D')

    # Separar en entrenamiento y prueba
    y, exog = ts_predict['sales'], ts_predict.drop(columns=['sales'])
    y_train, y_test = y[:-30], y[-30:]
    exog_train, exog_test = exog[:-30], exog[-30:]

    # Inicializar el modelo Forecaster
    forecaster = ForecasterAutoreg(
        regressor=RandomForestRegressor(max_depth=None, min_samples_leaf=2, min_samples_split=5, n_estimators=100),
        lags=14
    )   
    
    # Ajustar el modelo
    forecaster.fit(y=y_train, exog=exog_train)

    start_date = '2016-04-25' 
    end_date ='2016-05-30'
    # Crear un rango de fechas
    date_range = pd.date_range(start=start_date, end=end_date)
    # Crear el dataframe
    df1 = pd.DataFrame(date_range, columns=['date'])
    df1['date'] = pd.to_datetime(df1['date'])
    df1['weekday'] = df1['date'].dt.day_name()
    df1['event'] = 0
    df1 = pd.get_dummies(data=df1, columns=['weekday'], dtype=int)
    df1.sort_values('date', inplace=True, ascending=True)
    df1.set_index('date', inplace=True)
    df1 = df1.asfreq('D')
    exog_test = pd.concat([exog_test, df1], ignore_index=False)
    
    # Predecir
    predicciones = forecaster.predict(steps=60, exog=exog_test)
    
    # Almacenar resultados
    resultados.append({
        'producto': producto,
        'prediccion': predicciones.values,
        'test': y_test.values
    })
    
    print(f"Predicciones generadas para el producto: {producto}")


Predicciones generadas para el producto: ACCESORIES_1_108
Predicciones generadas para el producto: HOME_&_GARDEN_1_027
Predicciones generadas para el producto: HOME_&_GARDEN_1_053




Predicciones generadas para el producto: HOME_&_GARDEN_1_140




Predicciones generadas para el producto: HOME_&_GARDEN_1_177
Predicciones generadas para el producto: HOME_&_GARDEN_1_272
Predicciones generadas para el producto: HOME_&_GARDEN_1_344
Predicciones generadas para el producto: HOME_&_GARDEN_1_373
Predicciones generadas para el producto: HOME_&_GARDEN_1_440
Predicciones generadas para el producto: HOME_&_GARDEN_1_537
Predicciones generadas para el producto: SUPERMARKET_1_096
Predicciones generadas para el producto: SUPERMARKET_2_019




Predicciones generadas para el producto: SUPERMARKET_2_029
Predicciones generadas para el producto: SUPERMARKET_2_052
Predicciones generadas para el producto: SUPERMARKET_2_056
Predicciones generadas para el producto: SUPERMARKET_2_181
Predicciones generadas para el producto: SUPERMARKET_2_183
Predicciones generadas para el producto: SUPERMARKET_2_197
Predicciones generadas para el producto: SUPERMARKET_2_244
Predicciones generadas para el producto: SUPERMARKET_2_276




Predicciones generadas para el producto: SUPERMARKET_2_368
Predicciones generadas para el producto: SUPERMARKET_3_079
Predicciones generadas para el producto: SUPERMARKET_3_080




Predicciones generadas para el producto: SUPERMARKET_3_083
Predicciones generadas para el producto: SUPERMARKET_3_090
Predicciones generadas para el producto: SUPERMARKET_3_124
Predicciones generadas para el producto: SUPERMARKET_3_136




Predicciones generadas para el producto: SUPERMARKET_3_150
Predicciones generadas para el producto: SUPERMARKET_3_154
Predicciones generadas para el producto: SUPERMARKET_3_202
Predicciones generadas para el producto: SUPERMARKET_3_226
Predicciones generadas para el producto: SUPERMARKET_3_231
Predicciones generadas para el producto: SUPERMARKET_3_252
Predicciones generadas para el producto: SUPERMARKET_3_318
Predicciones generadas para el producto: SUPERMARKET_3_368
Predicciones generadas para el producto: SUPERMARKET_3_377




Predicciones generadas para el producto: SUPERMARKET_3_389
Predicciones generadas para el producto: SUPERMARKET_3_458
Predicciones generadas para el producto: SUPERMARKET_3_469
Predicciones generadas para el producto: SUPERMARKET_3_473
Predicciones generadas para el producto: SUPERMARKET_3_476
Predicciones generadas para el producto: SUPERMARKET_3_541
Predicciones generadas para el producto: SUPERMARKET_3_546
Predicciones generadas para el producto: SUPERMARKET_3_555
Predicciones generadas para el producto: SUPERMARKET_3_574
Predicciones generadas para el producto: SUPERMARKET_3_586
Predicciones generadas para el producto: SUPERMARKET_3_587
Predicciones generadas para el producto: SUPERMARKET_3_635
Predicciones generadas para el producto: SUPERMARKET_3_681
Predicciones generadas para el producto: SUPERMARKET_3_694
Predicciones generadas para el producto: SUPERMARKET_3_695
Predicciones generadas para el producto: SUPERMARKET_3_697
Predicciones generadas para el producto: SUPERMARKET_3_7



Predicciones generadas para el producto: HOME_&_GARDEN_1_413
Predicciones generadas para el producto: HOME_&_GARDEN_1_469
Predicciones generadas para el producto: HOME_&_GARDEN_1_072
Predicciones generadas para el producto: ACCESORIES_1_147
Predicciones generadas para el producto: SUPERMARKET_3_099
Predicciones generadas para el producto: HOME_&_GARDEN_1_535




Predicciones generadas para el producto: SUPERMARKET_3_516
Predicciones generadas para el producto: HOME_&_GARDEN_1_494




Predicciones generadas para el producto: SUPERMARKET_2_380
Predicciones generadas para el producto: ACCESORIES_1_236
Predicciones generadas para el producto: SUPERMARKET_1_012
Predicciones generadas para el producto: SUPERMARKET_1_170
Predicciones generadas para el producto: HOME_&_GARDEN_1_040




Predicciones generadas para el producto: HOME_&_GARDEN_1_366




Predicciones generadas para el producto: HOME_&_GARDEN_1_427
Predicciones generadas para el producto: SUPERMARKET_3_764




Predicciones generadas para el producto: SUPERMARKET_3_511




Predicciones generadas para el producto: SUPERMARKET_3_134




Predicciones generadas para el producto: HOME_&_GARDEN_1_032




Predicciones generadas para el producto: SUPERMARKET_3_120
Predicciones generadas para el producto: SUPERMARKET_3_455
Predicciones generadas para el producto: SUPERMARKET_3_607
Predicciones generadas para el producto: SUPERMARKET_3_811




Predicciones generadas para el producto: SUPERMARKET_3_441




Predicciones generadas para el producto: SUPERMARKET_3_444




Predicciones generadas para el producto: HOME_&_GARDEN_1_497
Predicciones generadas para el producto: HOME_&_GARDEN_1_110
Predicciones generadas para el producto: HOME_&_GARDEN_1_409
Predicciones generadas para el producto: HOME_&_GARDEN_1_514
Predicciones generadas para el producto: HOME_&_GARDEN_1_096




Predicciones generadas para el producto: SUPERMARKET_3_329




Predicciones generadas para el producto: SUPERMARKET_3_362
Predicciones generadas para el producto: SUPERMARKET_3_499
Predicciones generadas para el producto: ACCESORIES_1_158
Predicciones generadas para el producto: SUPERMARKET_3_282




Predicciones generadas para el producto: ACCESORIES_1_354
Predicciones generadas para el producto: HOME_&_GARDEN_1_106


In [6]:
tienda =  pd.DataFrame(resultados)

In [7]:
tienda

Unnamed: 0,producto,prediccion,test
0,ACCESORIES_1_108,"[0.4102630763629216, 0.25542857142857145, 0.35...","[0, 1, 1, 1, 1, 2, 0, 1, 3, 0, 2, 0, 0, 0, 3, ..."
1,HOME_&_GARDEN_1_027,"[1.5557142857142858, 2.550464285714286, 1.2410...","[1, 5, 0, 1, 0, 2, 1, 4, 1, 1, 1, 1, 0, 0, 1, ..."
2,HOME_&_GARDEN_1_053,"[2.9845238095238096, 4.015388888888889, 3.4111...","[3, 3, 5, 2, 2, 0, 3, 3, 8, 1, 4, 2, 1, 4, 1, ..."
3,HOME_&_GARDEN_1_140,"[2.0764087301587297, 2.0281904761904768, 1.378...","[3, 4, 0, 1, 5, 1, 2, 1, 5, 0, 4, 2, 3, 2, 5, ..."
4,HOME_&_GARDEN_1_177,"[2.2756547619047622, 1.3892110389610395, 1.296...","[2, 3, 5, 0, 1, 1, 2, 1, 2, 2, 2, 2, 0, 0, 0, ..."
...,...,...,...
95,SUPERMARKET_3_499,"[11.51623015873016, 14.14222619047619, 12.4750...","[12, 8, 2, 6, 2, 10, 7, 5, 4, 9, 8, 1, 10, 14,..."
96,ACCESORIES_1_158,"[4.894706349206348, 6.116813492063492, 4.08325...","[10, 4, 10, 6, 7, 6, 2, 3, 6, 4, 3, 9, 4, 1, 5..."
97,SUPERMARKET_3_282,"[16.18912301587301, 25.619294871794875, 16.758...","[15, 31, 15, 11, 9, 21, 15, 7, 7, 8, 12, 12, 1..."
98,ACCESORIES_1_354,"[1.428234126984127, 2.909111111111112, 4.07590...","[0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 2, 0, 0, 0, ..."


In [8]:
file_name = "BOS_1_unidades.xlsx"
tienda.to_excel(file_name)