# 1.2 SELECT B√°sico: Fundamentos de Consultas SQL

## Resumen Ejecutivo

Este notebook cubre la instrucci√≥n `SELECT`, pilar de SQL para recuperar datos. Aprender√°s a seleccionar columnas espec√≠ficas, crear alias, ordenar resultados y aplicar filtros b√°sicos para extraer informaci√≥n √∫til desde bases de datos relacionales.

## Objetivos de Aprendizaje

Al finalizar este notebook, ser√°s capaz de:
- Escribir consultas `SELECT` b√°sicas para recuperar datos
- Utilizar alias para mejorar legibilidad de resultados
- Aplicar `ORDER BY` para organizar datos
- Comprender conceptos de proyecci√≥n de columnas y rendimiento b√°sico

## Prerequisitos

- Completar [01_introduccion_relacional.ipynb](01_introduccion_relacional.ipynb)
- Tener ejecutado el script `dataset_setup.sql`
- Conocer conceptos b√°sicos de tablas y columnas

---

## ¬øPor qu√© SELECT es fundamental?

`SELECT` es la instrucci√≥n m√°s utilizada en SQL. Permite **proyectar** (seleccionar) columnas espec√≠ficas de una tabla, reduciendo la cantidad de datos transferidos y mejorando rendimiento. Evitar `SELECT *` en producci√≥n es una buena pr√°ctica: solo trae lo que necesitas.

### Conceptos clave:
- **Proyecci√≥n**: Elegir qu√© columnas mostrar
- **Alias**: Renombrar columnas para claridad
- **ORDER BY**: Ordenar filas por criterio
- **WHERE**: Filtrado b√°sico (pr√≥ximo m√≥dulo)

---

## Ejemplos Pr√°cticos

### Ejemplo 1: SELECT con columnas espec√≠ficas

**Prop√≥sito**: Recuperar solo las columnas necesarias (cliente_id, nombre, fecha_alta) ordenadas cronol√≥gicamente.

**Conceptos aplicados**: Proyecci√≥n de columnas, `ORDER BY ASC`

**Resultado esperado**: Lista de clientes desde el m√°s antiguo al m√°s reciente.

In [None]:
-- Listar clientes ordenados por fecha de alta
SELECT cliente_id, nombre, fecha_alta
FROM dbo.dim_clientes
ORDER BY fecha_alta;

**üí° Buena pr√°ctica**: Especificar siempre las columnas en lugar de `SELECT *`. Reduce tr√°fico de red y clarifica intenci√≥n.

---

### Ejemplo 2: SELECT con ORDER BY

**Prop√≥sito**: Ordenar clientes alfab√©ticamente por nombre y mostrar su segmento de mercado.

**Conceptos aplicados**: Ordenamiento alfab√©tico (`ORDER BY nombre`)

In [None]:
SELECT nombre, segmento
FROM dbo.dim_clientes
ORDER BY nombre;

---

### Ejemplo 3: Calculando columnas derivadas con Alias

**Prop√≥sito**: Calcular el margen de ganancia (precio - costo) de productos activos y ordenar por rentabilidad.

**Conceptos aplicados**: 
- Expresiones aritm√©ticas en SELECT
- Alias descriptivos (`AS margen`)
- Filtrado b√°sico (`WHERE activo = 1`)
- Orden descendente (`ORDER BY ... DESC`)

In [None]:
SELECT producto_id, nombre, (precio_unitario - costo_unitario) AS margen
FROM dbo.dim_productos
WHERE activo = 1
ORDER BY margen DESC;

---

### Ejemplo 4: Detectando duplicados con GROUP BY y HAVING

**Prop√≥sito**: Identificar nombres de clientes que aparecen m√°s de una vez (posible error de calidad de datos).

**Conceptos aplicados**: 
- Agrupaci√≥n b√°sica (`GROUP BY`)
- Conteo de registros (`COUNT(*)`)
- Filtrado post-agregaci√≥n (`HAVING`)

**Nota importante**: Este ejemplo anticipa conceptos de agregaci√≥n que se profundizar√°n en m√≥dulos posteriores.

In [None]:
SELECT nombre, COUNT(*) AS veces
FROM dbo.dim_clientes
GROUP BY nombre
HAVING COUNT(*) > 1;

---

## Ejercicios Guiados

Los siguientes ejercicios te permitir√°n practicar los conceptos anteriores de forma incremental:

---

## Errores Comunes y C√≥mo Evitarlos

- ‚ùå **Usar `SELECT *` en producci√≥n**: Trae columnas innecesarias, aumenta tr√°fico de red y dificulta optimizaci√≥n.
- ‚ùå **No usar alias claros**: Columnas calculadas sin alias confunden al lector.
- ‚ùå **Olvidar ordenar m√©tricas relevantes**: Si calculas margen, ordena por margen para an√°lisis m√°s √∫til.
- ‚ùå **No aplicar filtros m√≠nimos**: Sin `WHERE`, traes toda la tabla (costoso en tablas grandes).

---

## Conclusiones

En este notebook aprendiste:
- La sintaxis b√°sica de `SELECT` para proyectar columnas espec√≠ficas
- C√≥mo crear columnas calculadas con alias para claridad
- El uso de `ORDER BY` para organizar resultados
- Introducci√≥n a `GROUP BY` y `HAVING` para detecci√≥n de duplicados

**Key Takeaway**: `SELECT` es m√°s que listar datos‚Äîes una herramienta de an√°lisis que, bien utilizada, reduce costos de procesamiento y mejora tiempos de respuesta.

---

## Aplicaci√≥n Pr√°ctica

### Caso de Uso Real: Dashboard de Clientes

Imagina que necesitas alimentar un dashboard en Power BI con:
1. Lista de clientes activos ordenados por fecha de alta (para analizar tendencia de incorporaciones)
2. Productos m√°s rentables (margen = precio - costo) para priorizar inventario
3. Detecci√≥n autom√°tica de duplicados para alertas de calidad

Las consultas de este notebook son la base de estas funcionalidades. En entornos productivos:
- Se ejecutan en vistas materializadas o jobs nocturnos
- Se optimizan con √≠ndices en columnas de `WHERE` y `ORDER BY`
- Se monitorizan tiempos de ejecuci√≥n para detectar degradaci√≥n

---

## Perspectiva de Negocio

### ¬øPor qu√© SELECT bien estructurado impacta el negocio?

**1. Reducci√≥n de costos operativos**:
- Consultas espec√≠ficas (sin `SELECT *`) consumen menos memoria/CPU ‚Üí menor gasto en infraestructura cloud
- Ordenamiento estrat√©gico reduce procesamiento posterior en capas de visualizaci√≥n

**2. Toma de decisiones m√°s r√°pida**:
- Reportes ejecutivos requieren datos ordenados por prioridad (ej: productos por margen)
- SELECT optimizado = dashboards que actualizan en segundos, no minutos

**3. Calidad de datos proactiva**:
- Detectar duplicados con GROUP BY previene errores en anal√≠tica downstream
- Ejemplo: duplicados en clientes distorsionan m√©tricas de churn y LTV

**4. Escalabilidad**:
- Consultas bien escritas desde el inicio escalan mejor al crecer el volumen de datos
- Evitar `SELECT *` hoy previene cuellos de botella ma√±ana

**ROI tangible**: Un analista que domina SELECT evita horas de retrabajos, reduce tickets de soporte por "consultas lentas" y acelera la entrega de insights accionables.

---

üü¢ Ejercicio: Mostrar clientes y su segmento ordenados alfab√©ticamente por nombre.

üü† Ejercicio: Productos activos ordenados por margen (precio - costo).

üî¥ Reto: detectar posibles registros con nombre duplicado (conceptual, usar GROUP BY).

---

## Pie de P√°gina Editorial

### Cr√©ditos

Este material fue revisado y enriquecido parcialmente mediante asistencia de IA (OpenAI y Claude); la validaci√≥n y decisiones editoriales finales son humanas.

### Informaci√≥n del Curso

- **Nivel**: Junior (Fundamentos SQL)
- **M√≥dulo**: 1.2 SELECT B√°sico
- **Tiempo estimado**: 30-45 minutos
- **Prerequisito**: 01_introduccion_relacional.ipynb
- **Siguiente**: 03_funciones_tipos.ipynb

### Recursos Adicionales

- [SQL Style Guide](https://www.sqlstyle.guide/) para convenciones de formato
- Documentaci√≥n oficial: [SELECT (Transact-SQL)](https://learn.microsoft.com/en-us/sql/t-sql/queries/select-transact-sql)
- [Glosario del curso](../resources/01_glosario.ipynb)

---

---
## Navegaci√≥n
[‚¨ÖÔ∏è Anterior](01_introduccion_relacional.ipynb) | [Siguiente ‚û°Ô∏è](03_funciones_tipos.ipynb)
---
