# Forecasting
Este notebook está diseñado para realizar predicciones basadas en datos de ventas.

In [1]:
# Importar librerías necesarias
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import sklearn as sk
import streamlit as st
import holidays

In [2]:
# Cargar el archivo de inferencia
inferencia_df = pd.read_csv('../data/raw/inferencia/ventas_2025_inferencia.csv')
# Mostrar las primeras filas del dataframe para verificar la carga
print(inferencia_df.head())

        fecha producto_id                            nombre categoria  \
0  2025-10-25    PROD_001          Nike Air Zoom Pegasus 40   Running   
1  2025-10-25    PROD_002              Adidas Ultraboost 23   Running   
2  2025-10-25    PROD_003               Asics Gel Nimbus 25   Running   
3  2025-10-25    PROD_004  New Balance Fresh Foam X 1080v12   Running   
4  2025-10-25    PROD_005                Nike Dri-FIT Miler   Running   

         subcategoria  precio_base  es_estrella  unidades_vendidas  \
0  Zapatillas Running          115         True               26.0   
1  Zapatillas Running          135         True               27.0   
2  Zapatillas Running           85        False                5.0   
3  Zapatillas Running           75        False                3.0   
4        Ropa Running           35        False                3.0   

   precio_venta  ingresos  Amazon  Decathlon  Deporvillage  
0        113.13   2941.38   89.51     113.43        104.78  
1        141.89   

# Transformación de inferencia_df
En esta sección se aplican las mismas transformaciones realizadas en ventas_df para preparar inferencia_df para el modelo de forecasting.

In [3]:
# Cargar el archivo de inferencia
inferencia_df = pd.read_csv('../data/raw/inferencia/ventas_2025_inferencia.csv')

# Convertir la columna 'fecha' a formato datetime
inferencia_df['fecha'] = pd.to_datetime(inferencia_df['fecha'], errors='coerce')

# Crear nuevas variables
inferencia_df['año'] = inferencia_df['fecha'].dt.year
inferencia_df['día_semana'] = inferencia_df['fecha'].dt.day_name()

# Filtrar solo los registros de noviembre
inferencia_df = inferencia_df[inferencia_df['fecha'].dt.month == 11]

# Codificar variables categóricas
inferencia_df = pd.get_dummies(inferencia_df, columns=['categoria', 'subcategoria'], drop_first=True)
inferencia_df['producto_id'] = inferencia_df['producto_id'].astype('category').cat.codes

# Guardar el dataframe transformado
inferencia_df.to_csv('../data/processed/inferencia_df_transformado.csv', index=False)
print("Dataframe de inferencia transformado y guardado en '../data/processed/inferencia_df_transformado.csv'.")

Dataframe de inferencia transformado y guardado en '../data/processed/inferencia_df_transformado.csv'.


In [5]:
inferencia_df.shape

(720, 31)

In [7]:
inferencia_df.fecha.nunique()

30

In [8]:
inferencia_df.columns

Index(['fecha', 'producto_id', 'nombre', 'precio_base', 'es_estrella',
       'unidades_vendidas', 'precio_venta', 'ingresos', 'Amazon', 'Decathlon',
       'Deporvillage', 'año', 'día_semana', 'categoria_Outdoor',
       'categoria_Running', 'categoria_Wellness',
       'subcategoria_Bandas Elásticas', 'subcategoria_Bicicleta Montaña',
       'subcategoria_Bloque Yoga', 'subcategoria_Cojín Yoga',
       'subcategoria_Esterilla Fitness', 'subcategoria_Esterilla Yoga',
       'subcategoria_Mancuernas Ajustables', 'subcategoria_Mochila Trekking',
       'subcategoria_Pesa Rusa', 'subcategoria_Pesas Casa',
       'subcategoria_Rodillera Yoga', 'subcategoria_Ropa Montaña',
       'subcategoria_Ropa Running', 'subcategoria_Zapatillas Running',
       'subcategoria_Zapatillas Trail'],
      dtype='object')