# 1.8 Calidad de Datos B√°sica

**Resumen Ejecutivo**: Detecta nulos, outliers y anomal√≠as en datos transaccionales y dimensiones usando consultas SQL. Aprende a definir reglas de validaci√≥n reutilizables y umbrales claros.

---

## üéØ Objetivos de Aprendizaje
- Identificar nulos y valores fuera de rango en dimensiones y hechos.
- Construir consultas de auditor√≠a para detectar anomal√≠as (descuentos at√≠picos, margen negativo, cantidades inv√°lidas).
- Dise√±ar vistas de auditor√≠a para monitoreo continuo.

## üß∞ Prerrequisitos
- Haber completado `07_consultas_multitabla.ipynb` y ejecutado `dataset_setup.sql`.
- Conocer JOINs, agregaciones y filtros avanzados.
- Comprender el impacto de nulos en claves for√°neas.

---

## üìö Conceptos Clave
- **Nulos en dimensiones**: clientes sin email, productos sin categor√≠a.
- **Outliers en hechos**: descuentos >50%, cantidades negativas/cero.
- **Margen negativo**: detectar productos con costo mayor que precio.
- **Vistas de auditor√≠a**: consolidar reglas en objetos reutilizables.

> ‚ö†Ô∏è Nulos en claves for√°neas rompen JOINs; define reglas claras para diferenciar anomal√≠as de excepciones de negocio v√°lidas.

In [None]:
-- Clientes sin email (potencial brecha de contacto)
SELECT cliente_id, nombre, segmento, fecha_alta
FROM dbo.dim_clientes
WHERE email IS NULL;

In [None]:
-- Ventas con descuento sospechoso (>50%)
SELECT venta_id, descuento_pct
FROM dbo.fact_ventas
WHERE descuento_pct > 50;

In [None]:
-- Productos con margen negativo (costo > precio)
SELECT producto_id, nombre, precio_unitario, costo_unitario
FROM dbo.dim_productos
WHERE costo_unitario > precio_unitario;

In [None]:
SELECT COUNT(*) AS total, SUM(CASE WHEN email IS NULL THEN 1 ELSE 0 END) AS nulos_email
FROM dbo.dim_clientes;

In [None]:
SELECT venta_id, cantidad
FROM dbo.fact_ventas
WHERE cantidad <= 0;

In [None]:
-- Ejemplo de vista (comentar si ya existe)
-- CREATE VIEW dbo.vw_auditoria_ventas AS
-- SELECT venta_id, fecha, cliente_id, producto_id, cantidad, descuento_pct,
--        CASE WHEN descuento_pct > 50 OR cantidad <= 0 THEN 1 ELSE 0 END AS flag_anomalia
-- FROM dbo.fact_ventas;

---

## ‚ö†Ô∏è Errores Comunes
- Ignorar nulos en claves for√°neas (ventas con cliente_id NULL rompen JOINs).
- No definir umbrales claros (¬ø50% de descuento es anomal√≠a o promoci√≥n v√°lida?).
- No documentar reglas de validaci√≥n (dificultad para mantener y auditar).


---

## üß™ Ejercicios Guiados
- üü¢ Contar nulos en columna email vs total clientes (% de cobertura).
- üü† Validar ventas con cantidad <= 0 (deber√≠a ser > 0 siempre).
- üî¥ Construir una vista de auditor√≠a simple con bandera de anomal√≠a por cada venta (descuento_pct >50 OR cantidad <=0).

---

## ‚úÖ Conclusiones
- Detectar nulos y outliers evita reportes err√≥neos y decisiones equivocadas.
- Reglas claras (umbrales, vistas de auditor√≠a) facilitan mantenimiento y gobernanza.
- Calidad de datos proactiva reduce incidentes y mejora confianza en analytics.

---

## üöÄ Aplicaci√≥n Pr√°ctica
- Alertas autom√°ticas de clientes sin email para equipos de marketing.
- Dashboards de m√©tricas de calidad (% nulos, cantidad de anomal√≠as).
- Vistas de auditor√≠a integradas en pipelines ETL para validar antes de cargar a producci√≥n.

---

## üíº Perspectiva de Negocio
- Datos limpios = reportes confiables = decisiones correctas.
- Detectar productos con margen negativo evita p√©rdidas operativas.
- Reducir nulos en campos cr√≠ticos mejora tasa de conversi√≥n y retenci√≥n.

---

## üîñ Pie Editorial

**Curso**: Fundamentos de SQL Server - Nivel 1  
**M√≥dulo**: 1.8 Calidad de Datos B√°sica  
**Versi√≥n**: 2.0 (Actualizado Enero 2025)  
**Autor**: lraigosov / LuisRai  
**Licencia**: Uso educativo - Atribuci√≥n requerida

> üí° Nota sobre IA: Este material fue estructurado con asistencia de modelos de lenguaje (OpenAI GPT-4, Anthropic Claude); el contenido fue validado y curado por especialistas para evitar alucinaciones y asegurar aplicabilidad pr√°ctica.

---
## Navegaci√≥n
[‚¨ÖÔ∏è Anterior](07_consultas_multitabla.ipynb) | [Siguiente ‚û°Ô∏è](09_proyecto_cierre_junior.ipynb)
---
