# Introducción a SQL en Amazon Redshift



## Contenidos

1. Introducción a Amazon Redshift
2. Consultas básicas (SELECT, WHERE, ORDER BY)
3. Funciones de agregación (COUNT, SUM, AVG, GROUP BY)
4. JOINs entre tablas
5. Subconsultas y CTEs
6. Optimización básica en Redshift (Sort Keys, Dist Styles)
7. Ejercicios propuestos



# 1. Introducción a Amazon Redshift

### ¿Qué es Amazon Redshift?

- Es un **data warehouse** escalable basado en la nube.
- Está optimizado para consultas analíticas sobre grandes volúmenes de datos.
- Usa el lenguaje **SQL estándar**, con algunas extensiones específicas.
- Soporta conectividad mediante JDBC, ODBC, Python, etc.



# 2. Consultas Básicas

### Mostrar todas las ventas:
```sql
SELECT * FROM ventas LIMIT 10;
```

### Filtrar por cliente:
```sql
SELECT * FROM ventas WHERE cliente_id = 2;
```

### Ordenar por fecha:
```sql
SELECT * FROM ventas ORDER BY fecha_venta DESC;
```



# 3. Agregaciones y Análisis

### Total de ventas por cliente:
```sql
SELECT v.cliente_id, c.nombre, COUNT(*) AS total_ventas
FROM ventas v
JOIN clientes c ON v.cliente_id = c.cliente_id
GROUP BY v.cliente_id, c.nombre
ORDER BY total_ventas DESC;
```

### Ingresos totales por producto:
```sql
SELECT p.nombre_producto, SUM(p.precio * v.cantidad) AS ingreso_total
FROM ventas v
JOIN productos p ON v.producto_id = p.producto_id
GROUP BY p.nombre_producto
ORDER BY ingreso_total DESC;
```



# 4. JOINs entre tablas

### Información detallada de cada venta:
```sql
SELECT 
    v.venta_id,
    c.nombre AS cliente,
    p.nombre_producto,
    p.precio,
    v.cantidad,
    (p.precio * v.cantidad) AS total
FROM ventas v
JOIN clientes c ON v.cliente_id = c.cliente_id
JOIN productos p ON v.producto_id = p.producto_id;
```



# 5. Subconsultas y CTEs

### Usando subconsulta para obtener ventas mayores al promedio:

```sql
SELECT *
FROM (
    SELECT v.venta_id, p.precio * v.cantidad AS monto
    FROM ventas v
    JOIN productos p ON v.producto_id = p.producto_id
) AS ventas_detalle
WHERE monto > (SELECT AVG(precio * cantidad) FROM ventas JOIN productos ON ventas.producto_id = productos.producto_id);
```

### Usando CTE:

```sql
WITH ventas_detalle AS (
    SELECT v.venta_id, p.precio * v.cantidad AS monto
    FROM ventas v
    JOIN productos p ON v.producto_id = p.producto_id
)
SELECT *
FROM ventas_detalle
WHERE monto > (SELECT AVG(monto) FROM ventas_detalle);
```



# 6. Optimización en Redshift

### Definir claves de distribución y ordenamiento

```sql
CREATE TABLE ventas_opt (
    venta_id INTEGER PRIMARY KEY,
    cliente_id INTEGER DISTKEY,
    producto_id INTEGER,
    fecha_venta DATE SORTKEY,
    cantidad INTEGER
) DISTSTYLE KEY;
```

> ✅ **DISTKEY**: Mejora rendimiento en JOINs.
> ✅ **SORTKEY**: Mejora velocidad en filtros y ordenamientos.



# 7. Ejercicios Propuestos

1. Listar los 5 productos más vendidos.
2. Mostrar el total de ventas por mes.
3. Encontrar clientes que hayan comprado todos los productos disponibles.
4. Calcular el promedio de ventas por país.
5. Usar CTE para encontrar el top 3 de clientes por ingresos generados.



# Más información:

- [Documentación oficial de Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/mgmt/welcome.html)
- [Guía de optimización de Redshift](https://docs.aws.amazon.com/redshift/latest/dg/c_designing-queries-best-practices.html)
- [SQLZoo](https://sqlzoo.net/) – Tutoriales interactivos de SQL