## Parte 1: Validaci√≥n de Datos
1.1 An√°lisis Exploratorio Inicial


In [0]:
%sql

SHOW TABLES IN workspace.operations;


##a) Conteo de registros por tabla

- ¬øCu√°ntas transacciones hay en total? 

In [0]:
%sql
-- 1. Transacciones totales
SELECT COUNT(*) AS total_transacciones
FROM workspace.operations.gold_fact_sales_product;

- ¬øCu√°ntos productos activos existen? 

In [0]:
%sql
-- 2. Productos activos
SELECT COUNT(*) AS productos_activos
FROM workspace.operations.gold_dim_product
WHERE STATUS = 'A';


- ¬øCu√°ntas tiendas activas hay? 

In [0]:
%sql
-- 3. Tiendas activas
SELECT COUNT(*) AS tiendas_activas
FROM workspace.operations.gold_dim_organization
WHERE STORE_ACTIVE = 'Y';

- ¬øCu√°ntos proveedores activos?


In [0]:
%sql
-- 4. Proveedores activos
SELECT COUNT(*) AS proveedores_activos
FROM workspace.operations.gold_dim_supplier
WHERE SUP_STATUS = 'A';


##b) Validaci√≥n de rango de fechas

In [0]:
%sql
-- Rango de fechas en la tabla de ventas
SELECT 
    MIN(BUSINESS_DATE) AS fecha_minima,
    MAX(BUSINESS_DATE) AS fecha_maxima
FROM workspace.operations.gold_fact_sales_product;


## c) Validaci√≥n de integridad referencial

In [0]:
%sql
-- Verificar integridad SK_PRODUCT
SELECT COUNT(*) AS registros_sin_producto
FROM workspace.operations.gold_fact_sales_product f
LEFT JOIN workspace.operations.gold_dim_product p
ON f.SK_PRODUCT = p.SK_PRODUCT
WHERE p.SK_PRODUCT IS NULL;


In [0]:
%sql
-- Verificar integridad SK_ORGANIZATION
SELECT COUNT(*) AS registros_sin_tienda
FROM workspace.operations.gold_fact_sales_product f
LEFT JOIN workspace.operations.gold_dim_organization o
ON f.SK_ORGANIZATION = o.SK_ORGANIZATION
WHERE o.SK_ORGANIZATION IS NULL;

In [0]:
%sql
-- Verificar integridad SK_SUPPLIER
SELECT COUNT(*) AS registros_sin_proveedor
FROM workspace.operations.gold_fact_sales_product f
LEFT JOIN workspace.operations.gold_dim_supplier s
ON f.SK_SUPPLIER = s.SK_SUPPLIER
WHERE s.SK_SUPPLIER IS NULL;

In [0]:
%sql
-- Verificar integridad SK_CHANNEL
SELECT COUNT(*) AS registros_sin_canal
FROM workspace.operations.gold_fact_sales_product f
LEFT JOIN workspace.operations.gold_dim_channel c
ON f.SK_CHANNEL = c.SK_CHANNEL
WHERE c.SK_CHANNEL IS NULL;


In [0]:
%sql
-- Verificar integridad SK_CURRENCY
SELECT COUNT(*) AS registros_sin_moneda
FROM workspace.operations.gold_fact_sales_product f
LEFT JOIN workspace.operations.gold_dim_currency cur
ON f.SK_CURRENCY = cur.SK_CURRENCY
WHERE cur.SK_CURRENCY IS NULL;

## d) Validaci√≥n de valores nulos y negativos


- Ventas nulas
- Ventas negativas
- Unidades nulas o negativas

In [0]:
%sql
-- Ventas nulas
SELECT COUNT(*) AS ventas_nulas
FROM workspace.operations.gold_fact_sales_product
WHERE TOTAL_SALE IS NULL;

In [0]:
%sql
-- Ventas negativas
SELECT COUNT(*) AS ventas_negativas
FROM workspace.operations.gold_fact_sales_product
WHERE TOTAL_SALE < 0;

In [0]:
%sql
-- Unidades inv√°lidas
SELECT COUNT(*) AS unidades_invalidas
FROM workspace.operations.gold_fact_sales_product
WHERE UNITS IS NULL OR UNITS <= 0;


## e) Validaci√≥n de consistencia de c√°lculos



In [0]:
%sql
-- Validar TOTAL_SALE + TAX = TOTAL_SALE_TAX
SELECT COUNT(*) AS inconsistencias_total
FROM workspace.operations.gold_fact_sales_product
WHERE TOTAL_SALE + TAX <> TOTAL_SALE_TAX;


##Validaciones adicionales

Esto detecta si hay ventas con costo mayor al total (margen negativo), lo cual podr√≠a ser error o p√©rdida.

In [0]:
%sql
SELECT COUNT(*) 
FROM workspace.operations.gold_fact_sales_product
WHERE TOTAL_SALE - TOTAL_COST < 0;


Esta es una validacion para saber si el TAX (16%) es realmente el 16% del total de la venta

In [0]:
%sql
SELECT COUNT(*) 
FROM workspace.operations.gold_fact_sales_product
WHERE ROUND(TAX,2) <> ROUND(TOTAL_SALE*0.16,2);



##1.2 Documento de Hallazgos


## Resumen de Validaci√≥n de Datos

‚úÖ Validaciones que pasaron exitosamente
‚ö†Ô∏è Problemas encontrados 
üìã Recomendaciones para mejorar la calidad de datos

a) Conteo de registros por tabla ‚úÖ 

- **Transacciones totales:** 432,987  
- **Productos activos:** 749  
- **Tiendas activas:** 94  
- **Proveedores activos:** 7  

b) Validaci√≥n de rango de fechas ‚úÖ 

- Todas las transacciones est√°n dentro del rango **julio - septiembre 2025**.  

c) Validaci√≥n de integridad referencial ‚úÖ

- Todas las claves for√°neas (`SK_PRODUCT`, `SK_ORGANIZATION`, `SK_SUPPLIER`, `SK_CHANNEL`, `SK_CURRENCY`) tienen correspondencia en sus tablas de dimensiones.  
- **Resultado:** 0 registros sin correspondencia  
Un resultado de 0 indica que **todas las claves for√°neas son v√°lidas**, es decir, no hay registros hu√©rfanos en la tabla de ventas. 

d) Validaci√≥n de valores nulos y negativos ‚úÖ

- **Ventas nulas:** 0  -> No se encontraron ventas nulas
- **Ventas negativas:** 0  -> No se encontraron ventas negativas
- **Unidades inv√°lidas (nulas o <=0):** 0  -> No se encontraron unidades invalidas o nulas

e) Validaci√≥n de consistencia de c√°lculos ‚ö†Ô∏è

- **TOTAL_SALE + TAX = TOTAL_SALE_TAX**  
  - Se encontraron **95,687 registros** que no cumplen esta relaci√≥n.  

- **TAX = 16% de TOTAL_SALE**  
  - Ning√∫n registro coincide exactamente con la regla del 16%.   
- Una parte de los registros no cumple la relaci√≥n TOTAL_SALE + TAX = TOTAL_SALE_TAX.  
- El impuesto (TAX) no sigue exactamente el 16% sobre la venta, probablemente porque los datos son generados como ejemplo y no reflejan c√°lculos reales.  

> üìã Recomendaci√≥n:  
- Se sugiere que **los datos crudos** se almacenen tal como se reciben, y que **c√°lculos como el IVA y el total con impuestos se realicen autom√°ticamente en los procesos ETL**.  
- Esto garantiza consistencia y evita errores de c√°lculo manual.

---

## ‚úÖ Conclusi√≥n General

Los datos del trimestre presentan buena calidad en cuanto a:  
- Conteo de registros  
- Fechas  
- Integridad referencial  
- Valores nulos y negativos  

El principal punto a mejorar son los c√°lculos derivados (impuesto y total con impuestos), los cuales deben automatizarse para garantizar m√©tricas consistentes en el an√°lisis de negocio.
