# 1.1 Introducci√≥n al Modelo Relacional

**Resumen Ejecutivo**: SQL es el lenguaje est√°ndar para crear, consultar y gobernar bases de datos relacionales. Este m√≥dulo explica c√≥mo las tablas y sus relaciones evitan duplicidad, preservan consistencia e impulsan analytics y aplicaciones transaccionales.

---

## üéØ Objetivos de Aprendizaje

- Diferenciar tablas, filas, columnas y claves (PK/FK) en un modelo relacional.
- Entender c√≥mo las relaciones reducen duplicidad y mantienen integridad referencial.
- Reconocer los objetos clave de un modelo dimensional (dimensiones y hechos).

## üß∞ Prerrequisitos

- Haber ejecutado `dataset_setup.sql` o contar con un entorno de prueba en SQL Server.
- Conocer sintaxis b√°sica de SQL (SELECT, INSERT, UPDATE, DELETE).
- Contexto de negocio de ventas/clientes/productos para aterrizar ejemplos.

---

## üéõÔ∏è ¬øPara qu√© existe SQL?

SQL (Structured Query Language) es el lenguaje universal para comunicarte con **bases de datos relacionales**. Te permite:
- **Consultar** datos (SELECT)
- **Insertar** nuevos registros (INSERT)
- **Actualizar** informaci√≥n existente (UPDATE)
- **Eliminar** datos (DELETE)
- **Definir** estructura de tablas (CREATE TABLE)

## üìö ¬øPor qu√© "relacional"?

Las bases de datos relacionales organizan informaci√≥n en **tablas** (como hojas de Excel) que se **relacionan** entre s√≠ mediante claves.

### Ejemplo del mundo real:
Imagina una librer√≠a:
- **Tabla Libros**: libro_id, t√≠tulo, autor_id, precio
- **Tabla Autores**: autor_id, nombre, pa√≠s
- **Relaci√≥n**: cada libro est√° conectado a un autor mediante `autor_id`

Sin modelo relacional, tendr√≠as que duplicar el nombre del autor en cada libro ‚Üí si cambia el nombre, actualizas en 100 lugares ‚ùå

Con modelo relacional: autor se guarda UNA vez, los libros solo referencian su ID ‚Üí cambio en 1 lugar ‚úÖ

## üîß Conceptos Fundamentales

In [None]:
-- Ver estructura de una tabla (columnas, tipos de datos)
-- En SQL Server Management Studio o Azure Data Studio:
-- Click derecho en tabla ‚Üí "Script Table as CREATE"

-- Alternativa: consultar metadata del sistema
SELECT 
    c.name AS columna,
    t.name AS tipo_dato,
    c.max_length AS longitud,
    c.is_nullable AS permite_null
FROM sys.columns c
INNER JOIN sys.types t ON c.user_type_id = t.user_type_id
WHERE c.object_id = OBJECT_ID('dbo.dim_clientes')
ORDER BY c.column_id;

-- Ver claves primarias y for√°neas
EXEC sp_help 'dbo.fact_ventas';

/*
üí° Interpretaci√≥n:
- PK (Primary Key): usualmente la primera columna (cliente_id, producto_id)
- FK (Foreign Key): columnas que terminan en _id y referencian otra tabla
- Tipos comunes: INT (enteros), VARCHAR (texto), DATE (fechas), DECIMAL (n√∫meros con decimales)
*/

## Tipos de Tablas en Modelos Dimensionales

### **Tablas de Dimensiones (dim_*)**
Contienen atributos descriptivos (qui√©n, qu√©, d√≥nde, cu√°ndo):
- `dim_clientes`: qui√©n compra (nombre, ciudad, segmento)
- `dim_productos`: qu√© se vende (nombre, categor√≠a, precio)
- `dim_regiones`: d√≥nde ocurre (pa√≠s, regi√≥n, zona)
- `dim_tiempo`: cu√°ndo (fecha, mes, trimestre, a√±o)

**Caracter√≠sticas:**
- Pocas filas (100s a 10,000s)
- Cambian raramente (nombre de producto se actualiza ocasionalmente)
- Se relacionan con hechos mediante FKs

### **Tablas de Hechos (fact_*)**
Contienen m√©tricas num√©ricas y FKs a dimensiones:
- `fact_ventas`: registra cada transacci√≥n (cantidad, descuento, FK a cliente, producto, regi√≥n, fecha)
- `fact_inventario`: snapshot de stock (cantidad disponible, FK a producto, fecha)
- `fact_suscripciones`: estado de suscripciones (FK a cliente, fecha inicio/fin)

**Caracter√≠sticas:**
- Muchas filas (millones)
- Crecen constantemente (nueva venta = nueva fila)
- Contienen FKs a todas las dimensiones relevantes

### 1Ô∏è‚É£ **Tabla (Table)**
Colecci√≥n de datos organizados en filas y columnas:
- **Fila (Row/Registro)**: representa una entidad (ej. un cliente)
- **Columna (Column/Campo)**: representa un atributo (ej. nombre del cliente)

```
Tabla: dim_clientes
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ cliente_id  ‚îÇ nombre      ‚îÇ email        ‚îÇ ciudad  ‚îÇ
‚îú‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î§
‚îÇ 1           ‚îÇ Ana Garc√≠a  ‚îÇ ana@mail.com ‚îÇ Lima    ‚îÇ
‚îÇ 2           ‚îÇ Luis Torres ‚îÇ luis@mail.mx ‚îÇ CDMX    ‚îÇ
‚îÇ 3           ‚îÇ Mar√≠a Ruiz  ‚îÇ maria@mail.es‚îÇ Madrid  ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
```

### 2Ô∏è‚É£ **Clave Primaria (Primary Key - PK)**
Columna que identifica **√∫nicamente** cada fila:
- `cliente_id` = 1 solo existe UNA vez
- No puede ser NULL (debe tener valor)
- No puede duplicarse

¬øPor qu√©? Para poder referenciar "el cliente 1" sin ambig√ºedad.

### 3Ô∏è‚É£ **Clave For√°nea (Foreign Key - FK)**
Columna que **referencia** la PK de otra tabla:

```
Tabla: fact_ventas
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ venta_id ‚îÇ cliente_id  ‚îÇ producto_id  ‚îÇ cantidad ‚îÇ
‚îú‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î§
‚îÇ 101      ‚îÇ 1           ‚îÇ 201          ‚îÇ 5        ‚îÇ
‚îÇ 102      ‚îÇ 2           ‚îÇ 202          ‚îÇ 10       ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
         FK ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚ñ∂ dim_clientes(cliente_id)
```

**Integridad referencial**: no puedes insertar `cliente_id = 999` si ese cliente no existe en `dim_clientes`.

---

## üìÇ Dataset del Curso (resumen r√°pido)

Tablas disponibles ya creadas por `dataset_setup.sql`: `dim_clientes`, `dim_productos`, `dim_regiones`, `fact_ventas`, `fact_suscripciones`, `fact_inventario`.

## Dataset del Curso (detalle)

Este curso usa un modelo dimensional simplificado para e-commerce:

**Dimensiones:**
- `dim_clientes` (20 registros): cliente_id, nombre, email, ciudad, segmento, region_id, fecha_alta
- `dim_productos` (10 registros): producto_id, nombre, categoria, precio_unitario, costo_unitario, activo
- `dim_regiones` (3 registros): region_id, nombre_region, pais

**Hechos:**
- `fact_ventas` (~200 registros): venta_id, cliente_id, producto_id, region_id, fecha, cantidad, descuento_pct, canal
- `fact_suscripciones` (~50 registros): suscripcion_id, cliente_id, fecha_inicio, fecha_fin, monto_mensual, estado
- `fact_inventario` (~30 registros): inventario_id, producto_id, fecha, cantidad

**Prerequisito:** ejecutar `dataset_setup.sql` para crear y poblar estas tablas.

---

## üß™ Pr√°ctica Guiada

### üü¢ Ejercicio B√°sico
Sin ejecutar consultas a√∫n, dibuja en papel c√≥mo se relacionan:
- Un cliente con sus ventas (¬øqu√© columna conecta ambas tablas?)
- Una venta con el producto vendido (¬øFK?)
- Una regi√≥n con sus clientes

### üü† Ejercicio Intermedio
Responde conceptualmente:
1. ¬øPuedo insertar una venta con `cliente_id = 999` si ese cliente no existe? ¬øPor qu√©?
2. ¬øQu√© pasa si elimino un cliente que tiene 10 ventas registradas? (hint: integridad referencial)
3. ¬øPor qu√© `precio_unitario` est√° en `dim_productos` y no en `fact_ventas`?

### üî¥ Reto Conceptual
Dise√±a en papel una nueva tabla `fact_devoluciones` que registre:
- Qu√© producto se devolvi√≥
- Qu√© cliente lo devolvi√≥
- Fecha de devoluci√≥n
- Motivo (texto)

Define:
- PK (¬øqu√© columna?)
- FKs (¬øa qu√© tablas apunta?)
- Columnas adicionales necesarias

---

## ‚ö†Ô∏è Errores Comunes al Empezar

- Pensar que SQL es programaci√≥n imperativa; SQL es declarativo (describes el resultado).
- No entender PKs: un nombre puede repetirse, un ID no.
- Duplicar informaci√≥n: guardar nombre_cliente en `fact_ventas` genera inconsistencias si cambia.
- No respetar FKs: insertar IDs inventados rompe integridad referencial.
- Confundir tabla con archivo Excel: Excel es flexible pero fr√°gil; BD relacional garantiza consistencia.

---

## üöÄ Pr√≥ximos Pasos

- **Siguiente:** `02_select_basico.ipynb` ‚Üí tus primeras consultas SELECT.
- **Recurso:** revisa `dataset_setup.sql` para ver el DDL (CREATE TABLE) completo.

---

## ‚úÖ Conclusiones

- Las claves primarias y for√°neas preservan integridad y evitan duplicidad de datos.
- Las dimensiones describen entidades; los hechos capturan eventos y m√©tricas que se relacionan con ellas.
- Un modelo relacional claro reduce errores y acelera la construcci√≥n de consultas anal√≠ticas.

---

## üíº Perspectiva de Negocio

- Datos relacionales consistentes generan reportes confiables de ventas, margen y clientes.
- La integridad referencial evita decisiones basadas en datos hu√©rfanos o duplicados.
- Modelos dimensionales bien definidos reducen el tiempo a insight para equipos comerciales y de producto.

---

## üîñ Pie Editorial

**Curso**: Fundamentos de SQL Server - Nivel 1  
**M√≥dulo**: 1.1 Introducci√≥n al Modelo Relacional  
**Versi√≥n**: 2.0 (Actualizado Enero 2025)  
**Autor**: lraigosov / LuisRai  
**Licencia**: Uso educativo - Atribuci√≥n requerida

> üí° Nota sobre IA: Este material fue estructurado con asistencia de modelos de lenguaje (OpenAI GPT-4, Anthropic Claude); el contenido fue validado y curado por especialistas para evitar alucinaciones y asegurar aplicabilidad pr√°ctica.

---
## Navegaci√≥n
[‚¨ÖÔ∏è √çndice del Curso](README.md) | [Siguiente ‚û°Ô∏è](02_select_basico.ipynb)
---
