Proyecto desarrollado por EAN TechRetail Solutions para la empresa SuperMart Colombia, con el objetivo de construir un pipeline ETL completo (Extract, Transform, Load) en Python.
El sistema toma datos de ventas desde múltiples archivos CSV, los limpia, transforma, enriquece y genera información analítica lista para la toma de decisiones.
SuperMart_ETL_Project_FULL/
│
├── ventas_crudas.csv # Datos originales de ventas
├── productos.csv # Catálogo de productos
├── tiendas.csv # Catálogo de tiendas
│
├── ventas_transformadas.csv # Datos limpios y enriquecidos
├── data_mart_ventas.csv # Dataset agregado para análisis
├── resumen_ejecutivo.csv # Resumen con métricas clave
├── reporte_ejecutivo.txt # Reporte gerencial automatizado
│
├── grafico_ventas_por_ciudad.png
├── grafico_distribucion_por_categoria.png
├── grafico_transacciones_por_dia.png
├── histograma_montos_venta.png
│
└── etl_supermart.py # Script principal del pipeline ETL
- Python 3.8+
- Librerías:
pandas,numpy,matplotlib,datetime - Entorno recomendado: Jupyter Notebook o ejecución directa por terminal
- Coloca los tres archivos CSV (
ventas_crudas.csv,productos.csv,tiendas.csv) en la misma carpeta que el scriptetl_supermart.py. - Abre una terminal en esa carpeta.
- Ejecuta el comando:
python etl_supermart.py
- Se generarán automáticamente los archivos procesados, reportes y visualizaciones dentro del mismo directorio.
- Dataset transformado: datos limpios listos para análisis.
- Data Mart: agregaciones por ciudad, categoría y fecha.
- Gráficos: métricas visuales de ventas.
- Reporte ejecutivo: resumen textual con indicadores de calidad y top performers.
Juan Ignacio Sanchez - Juan Nicolas Junca Ingenieros De Sistemas – EAN TechRetail Solutions
Este proyecto se distribuye bajo la licencia MIT, lo que permite su uso, modificación y distribución con atribución.