# Contexto de Negocio y Marco de Trabajo

## Empresa y situaci√≥n
Cadena de retail con 30 ubicaciones y 200 SKUs. Se necesitan patrones de demanda e inventario para mejorar reposici√≥n.

## Qu√© / Por qu√© / Para qu√© / Cu√°ndo / C√≥mo
- Qu√©: EDA de √≥rdenes e inventarios con datos sint√©ticos realistas.
- Por qu√©: Entender distribuciones, estacionalidad, outliers y relaciones canal-inventario.
- Para qu√©: Definir hip√≥tesis y features para modelos y decisiones de negocio.
- Cu√°ndo: Al inicio de un proyecto y de manera peri√≥dica.
- C√≥mo: Pandas, seaborn/matplotlib, agrupaciones y visualizaciones.

---
id: "DS-01"
title: "Exploraci√≥n de datos de √≥rdenes e inventarios (EDA)"
specialty: "Data Science"
process: "Deliver"
level: "Intro"
tags: ["eda", "pandas", "visualization", "orders", "inventory"]
estimated_time_min: 40
---

---
id: "DS-01"
title: "EDA de √≥rdenes e inventarios"
specialty: "Data Science"
process: "Deliver"
level: "Intro"
tags: ["eda", "pandas", "plot"]
estimated_time_min: 30
---

## üìä Caso de Negocio

**Contexto:** Una cadena de retail con 30 ubicaciones (tiendas, DCs, hubs) necesita entender patrones de demanda y niveles de inventario para optimizar reposici√≥n y evitar rupturas de stock.

**Problema:** El equipo comercial reporta inconsistencias en ventas entre canales y regiones, y log√≠stica detecta exceso de inventario en ciertos SKUs.

**Objetivo:** Realizar an√°lisis exploratorio de √≥rdenes e inventarios para identificar:
- Distribuci√≥n de demanda por canal y categor√≠a
- SKUs con alta/baja rotaci√≥n
- Patrones temporales y estacionalidad

## üéØ Qu√©, Por qu√©, Para qu√©, Cu√°ndo, C√≥mo

### ¬øQu√©?
An√°lisis exploratorio de datos (EDA) de √≥rdenes de venta e inventarios usando pandas, matplotlib y seaborn.

### ¬øPor qu√©?
El EDA es el primer paso en cualquier proyecto de datos. Permite:
- Validar calidad de datos (nulls, outliers, tipos)
- Entender distribuciones y relaciones
- Generar hip√≥tesis para an√°lisis profundos

### ¬øPara qu√©?
- Informar decisiones de surtido y reposici√≥n
- Identificar oportunidades de optimizaci√≥n de inventario
- Base para modelos predictivos de demanda

### ¬øCu√°ndo?
- Al iniciar un proyecto de analytics
- Mensualmente para monitorear tendencias
- Ante cambios operativos (nuevos SKUs, canales, campa√±as)

### ¬øC√≥mo?
1. Cargar datasets de `data/raw/`
2. Inspeccionar esquema y tipos
3. Calcular estad√≠sticas descriptivas
4. Visualizar distribuciones y relaciones
5. Documentar hallazgos y pr√≥ximos pasos

In [None]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from src.utils.paths import DATA_RAW
sns.set_theme(style='whitegrid')

In [None]:
# Cargar datasets
orders = pd.read_csv(DATA_RAW / 'orders.csv')
inventory = pd.read_csv(DATA_RAW / 'inventory.csv')
products = pd.read_csv(DATA_RAW / 'products.csv')

print(f"‚úì √ìrdenes: {len(orders):,} registros")
print(f"‚úì Inventario: {len(inventory):,} registros")
print(f"‚úì Productos: {len(products):,} SKUs")

In [None]:
# An√°lisis de √≥rdenes por canal
channel_stats = orders.groupby('channel').agg({
    'order_id': 'count',
    'qty': ['sum', 'mean', 'std']
}).round(2)

print("\nüìä Estad√≠sticas por Canal:")
print(channel_stats)

# Visualizaci√≥n
fig, axes = plt.subplots(1, 2, figsize=(14, 5))
orders.groupby('channel')['order_id'].count().plot(kind='bar', ax=axes[0], color='steelblue')
axes[0].set_title('√ìrdenes por Canal')
axes[0].set_ylabel('Cantidad de √ìrdenes')

sns.boxplot(data=orders, x='channel', y='qty', ax=axes[1])
axes[1].set_title('Distribuci√≥n de Cantidad por Canal')
axes[1].set_ylabel('Cantidad (units)')
plt.tight_layout()
plt.show()

In [None]:
# An√°lisis de inventario: Top y Bottom SKUs
top_skus = inventory.groupby('sku')['on_hand'].sum().nlargest(10)
bottom_skus = inventory.groupby('sku')['on_hand'].sum().nsmallest(10)

print("\nüì¶ Top 10 SKUs con mayor inventario:")
print(top_skus)

print("\n‚ö†Ô∏è Bottom 10 SKUs con menor inventario:")
print(bottom_skus)

# Visualizaci√≥n
fig, ax = plt.subplots(figsize=(12, 6))
top_skus.plot(kind='barh', ax=ax, color='green', alpha=0.7)
ax.set_title('Top 10 SKUs por Inventario Total')
ax.set_xlabel('Unidades On Hand')
plt.tight_layout()
plt.show()

print("\n‚úÖ EDA completado. Pr√≥ximos pasos: segmentaci√≥n ABC, an√°lisis de rotaci√≥n, forecast.")