# Contexto de Negocio y Marco de Trabajo

## Empresa y situaci√≥n
Operaci√≥n de retail nacional con m√∫ltiples WMS exportando CSV diarios de inventario y movimientos. Se requiere ingesta confiable al DWH para anal√≠tica.

## Qu√© / Por qu√© / Para qu√© / Cu√°ndo / C√≥mo
- Qu√©: Ingesta batch de archivos CSV del WMS hacia tablas Parquet en el DWH.
- Por qu√©: Centralizar y estandarizar datos para consultas r√°pidas y consistentes.
- Para qu√©: Habilitar dashboards e informes operativos y de inventario.
- Cu√°ndo: Procesos nocturnos y reintentos ante archivos tard√≠os.
- C√≥mo: Validaci√≥n de esquema, enriquecimiento con fecha de ingesta y escritura en formato columna.

---
id: "DE-01"
title: "Batch ingestion from WMS CSV to Data Warehouse"
specialty: "Data Engineering"
process: "Deliver"
level: "Intermediate"
tags: ["etl", "warehouse", "inventory", "python", "sql"]
estimated_time_min: 45
---

---
id: "DE-01"
title: "Batch ingestion from WMS CSV to Data Warehouse"
specialty: "Data Engineering"
process: "Deliver"
level: "Intermediate"
tags: ["etl", "warehouse", "inventory", "python", "sql"]
estimated_time_min: 45
---

## üéØ Contexto del Notebook

### ¬øQu√©?
Ingesta batch de datos de inventario desde archivos CSV (simulando WMS) hacia un modelo anal√≠tico.

### ¬øPor qu√©?
Los sistemas WMS generan archivos planos diarios. Consolidarlos en un warehouse permite an√°lisis hist√≥rico, tendencias y alertas.

### ¬øPara qu√©?
- Construir tablas de hechos de inventario
- Habilitar reportes de cobertura, rotaci√≥n y obsolescencia
- Base para modelos de optimizaci√≥n de stock

### ¬øCu√°ndo?
Ejecutar diariamente en horarios de baja operaci√≥n (ej: 2 AM) post-cierre de turno WMS.

### ¬øC√≥mo?
1. Leer CSV desde `data/raw/inventory.csv`
2. Validar esquema y tipos
3. Transformar (agregar timestamp, calcular m√©tricas)
4. Escribir a `data/processed/` o conectar a DB

In [None]:
import pandas as pd
from pathlib import Path
from src.utils.paths import DATA_RAW, DATA_PROCESSED, ensure_dirs
from src.utils.logging import get_logger

logger = get_logger('DE-01')
ensure_dirs()
logger.info('Iniciando ingesta batch de inventario')

In [None]:
# Leer CSV de inventario
df = pd.read_csv(DATA_RAW / 'inventory.csv')
logger.info(f'Registros cargados: {len(df)}')
print(df.head())
print(df.info())

In [None]:
# Transformaciones b√°sicas
df['ingestion_date'] = pd.Timestamp.now()
df['on_hand_value'] = df['on_hand'] * 10  # mock: precio unitario
print(df[['location_id','sku','on_hand','on_hand_value']].head())

In [None]:
# Escribir a processed
output = DATA_PROCESSED / 'inventory_fact.parquet'
df.to_parquet(output, index=False)
logger.info(f'Datos escritos en {output}')
print('‚úÖ Ingesta completada')