---
id: "DE-01"
title: "Batch ingestion from WMS CSV to Data Warehouse"
specialty: "Data Engineering"
process: "Deliver"
level: "Intermediate"
tags: ["etl", "warehouse", "inventory", "python", "sql"]
estimated_time_min: 45
---

## ðŸŽ¯ Contexto del Notebook

### Â¿QuÃ©?
Ingesta batch de datos de inventario desde archivos CSV (simulando WMS) hacia un modelo analÃ­tico.

### Â¿Por quÃ©?
Los sistemas WMS generan archivos planos diarios. Consolidarlos en un warehouse permite anÃ¡lisis histÃ³rico, tendencias y alertas.

### Â¿Para quÃ©?
- Construir tablas de hechos de inventario
- Habilitar reportes de cobertura, rotaciÃ³n y obsolescencia
- Base para modelos de optimizaciÃ³n de stock

### Â¿CuÃ¡ndo?
Ejecutar diariamente en horarios de baja operaciÃ³n (ej: 2 AM) post-cierre de turno WMS.

### Â¿CÃ³mo?
1. Leer CSV desde `data/raw/inventory.csv`
2. Validar esquema y tipos
3. Transformar (agregar timestamp, calcular mÃ©tricas)
4. Escribir a `data/processed/` o conectar a DB

In [None]:
import pandas as pd
from pathlib import Path
from src.utils.paths import DATA_RAW, DATA_PROCESSED, ensure_dirs
from src.utils.logging import get_logger

logger = get_logger('DE-01')
ensure_dirs()
logger.info('Iniciando ingesta batch de inventario')

In [None]:
# Leer CSV de inventario
df = pd.read_csv(DATA_RAW / 'inventory.csv')
logger.info(f'Registros cargados: {len(df)}')
print(df.head())
print(df.info())

In [None]:
# Transformaciones bÃ¡sicas
df['ingestion_date'] = pd.Timestamp.now()
df['on_hand_value'] = df['on_hand'] * 10  # mock: precio unitario
print(df[['location_id','sku','on_hand','on_hand_value']].head())

In [None]:
# Escribir a processed
output = DATA_PROCESSED / 'inventory_fact.parquet'
df.to_parquet(output, index=False)
logger.info(f'Datos escritos en {output}')
print('âœ… Ingesta completada')