# 📓 Predicción de demanda de productos retail
**Autor:** Nicolás Andrés Vidal Mancilla

**Rol:** Ingeniero Civil Industrial, MSc Data Science

**Proyecto:** Predicción de demanda de productos retail

**Fecha:** 22-08-2025

**Descripcion:** El objetivo de este notebook es crear un modelo para predecir la demanda semanal de productos del area del retail. Se utilizan datos históricos de ventas, estacionalidad y variables como promociones, precios y posicionamiento en la tienda de un producto. Esto ayudaria a una empresa a reducir quiebres de stock y sobreinventario, apoyando la toma de decisiones en la gestion de inventario y reposición.


## 2. Contexto y Definicion del Problema
- Problematica
  En el sector retail, especialmente en supermercados y minimarkets se presentan dos problemas importantes relacionados a la gestion de inventario:
  1. **Quiebres de stock**: Cuando la demanda del producto supera la cantidad del inventario. Esto puede generar perdida de ventas, disminuir la satisfaccion al cliente y puede afectar la fidelidad de la marca.
  2. **Exceso de inventario**: Tener mas stock del necesario incrementa los costos de almacenamiento, riesgos de obsolecencia y capital inmovilizado innecesario.

  Estos problemas son comunes en empresas de gran tamaño y con gran cantidad de productos, donde la demanda influenciada por variables como estacion del año, precios, promociones y competencia.

  **Ejemplos en la industria**:

  *   **Supermercados:** Productos con gran rotacion como bebidas o snacks pueden verse influenciados por altas temperaturas o fiestas.
  *   **Distribucion y logistica:** Transportar productos que luego no se venden trae consigo costes extra de almacenamiento y transporte.
  *   **Manufactura:** Predecir la demanda de un producto, ayuda luego a planificar la producción y evitar producir demas de un producto de rapida obsolecencia.

- **Objetivo principal**

  El objetivo de este proyecto es **construir un modelo de prediccion de demanda semanal por producto y por tienda**, utilizando los datos historicos de ventas y variables externas como promociones, precios, temperatura y competencia. Esto con la finalidad de:

  * Reducir quiebres de stock.
  * Minimizar exceso de inventario.
  * Mejorar la precision de la prediccion del modelo

  Lo anterior para asegurar la disponibilidad de productos en la tienda, minimizar costos de almacenamiento y capital inmovilizado, y ayudar en las desiciones de reposicion y planificacion estrategica de la empresa.

- **Preguntas clave a responder**

  1. ¿Cual sera la demanda de cada semana por producto por cada tienda en el futuro?

  2. ¿Que efectos tienen las distintas variables, como promociones o estacionalidades en la demanda?
  
  3. ¿Hay patrones estaciones o tendencias que deban tenerse en cuenta enla planificación de inventario?

  4. ¿Como se puede optimizar la gestion de inventario usando modelos de **Data Science** para reducir costos y mejorar la satisfaccion al cliente?
  
   

## 3. Datos

- **Fuente de los Datos**

Los datos utilizados en este proyecto son de origen sinteticos y ficticios. fueron creados simulando el comportamiento real de las ventas en un entorno retail/supermercado (con variables que se sabe que influencian en las ventas).

Se construyeron con patrones de tendencia, estacionalidad, promociones, elasticidad de precio y efectos externos como temperatura y competencia. Asi, se simulan de forma realista los desafios de gestion de inventario.

- **Descripción de variables**

  * **date**: semana(formato año-mes-dia)
  * **store_id**: Identificador de la tienda (ej.: VAP_01,SCL_02)
  * **sku_id**: Identificador del producto (ej.: BE_01, BE_02)
  * **category**: Categoria del producto (ej.:Bebidas)
  * **price**: Precio del producto (ej.:$1.990)

  * **promo_flag**: Si el producto esta o no en promoción, en binario (ej.:0,1)
  * **display_flag**: Si el producto esta en exhibición destacada, binario. (ej.:0,1)
  * **comp_price_index**: precio del producto en la competencia. (ej.: $2.190)
  * **temp**: Temperatura del dia en grados Celcius (ej.: 22)
  * **units_sold**: Cantidad de unidades vendidas en la semana (ej.: 87)

- **Calidad Esperada y Limitaciones**
  * La calidad de los datos simulados es alta ya que no hay errores de captura o datos faltantes, ademas las variables fueron creadas con patrones controlados.
  * Por otro lado, como los datos son simulados, no tienen la complejidad que se encontraria en un entorno real (donde pueden verse afectados por cambios macroeconomicos, quiebres en la cadena de suministro o cambios imprevistos en la competencia, etc.).
  * En un caso real se esperarian problemas en los datos con valores nulos, atipicos, datos duplicados o no estructurasos, que en los datos simulados no estan presentes.
