# 1.5 JOINs y Relaciones entre Tablas

- Objetivo: combinar datos de m√∫ltiples tablas usando claves primarias y for√°neas.
- Prerrequisitos: entender modelo relacional (fact_ventas referencia dim_clientes, dim_productos).
- Ejercicios: INNER, LEFT JOIN para detectar faltantes, m√∫ltiples JOINs.
- Reto: agregaci√≥n sobre JOINs con LEFT para incluir regiones sin actividad.
- Errores comunes: INNER cuando se necesitan faltantes, duplicar filas por JOIN incorrecto.

## ¬øPor qu√© usar JOINs?

Los datos normalizados se almacenan en m√∫ltiples tablas para evitar redundancia. Por ejemplo:
- `fact_ventas` guarda solo `cliente_id` (n√∫mero), no el nombre del cliente
- Para mostrar "Juan P√©rez compr√≥ Laptop X", necesitamos **unir** fact_ventas con dim_clientes y dim_productos

**Para qu√©:**
- Desnormalizar datos para reportes legibles
- Enriquecer fact tables con atributos de dimensiones (categor√≠a, regi√≥n, segmento)
- Detectar registros hu√©rfanos (ventas sin cliente v√°lido)

**C√≥mo:**
- **INNER JOIN:** Solo registros que coinciden en ambas tablas (ventas con cliente existente)
- **LEFT JOIN:** Todos los registros de tabla izquierda + coincidencias de derecha (productos con o sin ventas)
- **RIGHT JOIN:** Inversa de LEFT (raro, mejor reescribir como LEFT)
- **FULL OUTER JOIN:** Todos los registros de ambas tablas (√∫til para consolidaciones)

## Tipos de JOIN

### INNER JOIN (Intersecci√≥n)
```sql
SELECT v.venta_id, c.nombre
FROM fact_ventas v
INNER JOIN dim_clientes c ON v.cliente_id = c.cliente_id;
```
**Resultado:** Solo ventas que tienen cliente v√°lido. Si hay cliente_id=999 en ventas pero no existe en dim_clientes, esa venta NO aparece.

### LEFT JOIN (Izquierda + Coincidencias)
```sql
SELECT p.nombre, v.venta_id
FROM dim_productos p
LEFT JOIN fact_ventas v ON p.producto_id = v.producto_id;
```
**Resultado:** Todos los productos (incluso sin ventas). Si un producto no tiene ventas, venta_id ser√° NULL.

**Detectar productos sin ventas:**
```sql
WHERE v.venta_id IS NULL  -- Filtra solo productos sin coincidencias
```

### M√∫ltiples JOINs
```sql
SELECT v.venta_id, c.nombre AS cliente, p.nombre AS producto, r.nombre AS region
FROM fact_ventas v
JOIN dim_clientes c ON v.cliente_id = c.cliente_id
JOIN dim_productos p ON v.producto_id = p.producto_id
JOIN dim_regiones r ON c.region_id = r.region_id;
```
**Lectura:** "Cada venta conecta con su cliente, producto y regi√≥n del cliente"

## Errores Comunes

1. **Usar INNER cuando se necesitan faltantes:** Si el objetivo es "listar todos los productos, incluyendo los sin ventas", INNER JOIN eliminar√° productos sin ventas. Usar LEFT JOIN.

2. **Duplicar filas por JOIN mal definido:** Si dim_clientes tiene registros duplicados o la condici√≥n ON es ambigua, cada venta puede multiplicarse.

3. **No calificar columnas en JOINs m√∫ltiples:** Si `nombre` existe en dim_clientes y dim_productos, escribir `c.nombre` y `p.nombre` para evitar ambig√ºedad.

4. **Olvidar IS NULL para detectar faltantes:** Despu√©s de LEFT JOIN, filtrar `WHERE tabla_derecha.id IS NULL` para encontrar registros sin coincidencia.

In [None]:
-- Ventas con cliente y producto (INNER JOIN)
SELECT v.venta_id, v.fecha, c.nombre AS cliente, p.nombre AS producto, v.cantidad,
       (v.cantidad * p.precio_unitario) AS ingreso_bruto
FROM dbo.fact_ventas v
JOIN dbo.dim_clientes c ON v.cliente_id = c.cliente_id
JOIN dbo.dim_productos p ON v.producto_id = p.producto_id;

üü¢ Ejercicio: Ventas con regi√≥n del cliente (JOIN adicional).

In [None]:
SELECT v.venta_id, r.nombre AS region, v.cantidad
FROM dbo.fact_ventas v
JOIN dbo.dim_clientes c ON v.cliente_id = c.cliente_id
JOIN dbo.dim_regiones r ON c.region_id = r.region_id;

üü† Ejercicio: Productos sin ventas (usar LEFT JOIN y filtro NULL).

In [None]:
SELECT p.producto_id, p.nombre
FROM dbo.dim_productos p
LEFT JOIN dbo.fact_ventas v ON p.producto_id = v.producto_id
WHERE v.producto_id IS NULL;

üî¥ Reto: Contar ventas por regi√≥n mostrando tambi√©n regiones sin ventas (LEFT).

In [None]:
SELECT r.nombre AS region, COUNT(v.venta_id) AS ventas
FROM dbo.dim_regiones r
LEFT JOIN dbo.dim_clientes c ON r.region_id = c.region_id
LEFT JOIN dbo.fact_ventas v ON c.cliente_id = v.cliente_id
GROUP BY r.nombre
ORDER BY ventas DESC;

Errores comunes: usar INNER cuando se requieren faltantes; duplicar filas por JOIN mal definido; no calificar columnas en joins m√∫ltiples.

# Cr√©ditos

Este material fue revisado y enriquecido parcialmente mediante asistencia de IA (OpenAI y Claude); la validaci√≥n y decisiones editoriales finales son humanas.