<a href="https://colab.research.google.com/github/financieras/big_data/blob/main/leccion_2_3_1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Lección 2.3.1: Tableau (conexión y visualizaciones)

## 1. ¿Por qué Tableau?

Tableau es **el Ferrari de la visualización de datos**: potente, intuitivo y diseñado para convertir números en historias visuales sin escribir una línea de código.

**¿Cuándo usar Tableau?**  
- Necesitas dashboards interactivos **rápido**.  
- Tu audiencia no es técnica pero quiere explorar datos.  
- Conectas múltiples fuentes (Excel, SQL, cloud).  
- Quieres visualizaciones profesionales sin programar.  

> **Clave:** Tableau democratiza los datos. Lo que tardabas días en Python, lo haces en horas con drag & drop.

**Dato curioso:** Tableau nació en 2003 de una investigación en Stanford sobre técnicas de visualización. Hoy lo usan +86,000 organizaciones, desde startups hasta el 90% del Fortune 500.

---

## 2. Conceptos fundamentales

Antes de conectar datos, entiende la arquitectura de Tableau:

| Concepto | Definición | Analogía |
|----------|------------|----------|
| **Data Source** | Conexión a tus datos (Excel, SQL, API) | El grifo de agua |
| **Worksheet** | Lienzo donde creas UNA visualización | Una diapositiva |
| **Dashboard** | Conjunto de worksheets interactivas | La presentación completa |
| **Story** | Secuencia de dashboards para contar una narrativa | Un reportaje visual |
| **Dimensions** | Campos categóricos (nombres, fechas, regiones) | Las etiquetas (azul) |
| **Measures** | Campos numéricos que se agregan (ventas, cantidad) | Los números (verde) |

**El workspace de Tableau Desktop:**
```
┌──────────────────────────────────────────────────┐
│ Barra de herramientas (guardar, deshacer, etc)   │
├────────────┬─────────────────────────────────────┤
│ Panel de   │ 🎯 Filas (Rows)                     │
│ Datos      ├─────────────────────────────────────┤
│            │ 🎯 Columnas (Columns)               │
│ Dimensiones├─────────────────────────────────────┤
│ (azul)     │                                     │
│            │        LIENZO                       │
│ Medidas    │     (tu visualización)              │
│ (verde)    │                                     │
│            ├─────────────────────────────────────┤
│            │ Filtros │ Marcas │ Color │ Tamaño  │
└────────────┴─────────────────────────────────────┘
```

> **Tip:** Tableau clasifica automáticamente tus campos en **dimensiones** (azul) y **medidas** (verde). Aprende a distinguirlos.

---

## 3. Conectando tus datos

### 3.1 Tipos de conexiones

Tableau se conecta a **más de 80 fuentes**. Las más comunes:

| Tipo | Ejemplos | Caso de uso |
|------|----------|-------------|
| **Archivos locales** | Excel, CSV, JSON | Análisis rápido, datos pequeños |
| **Bases de datos** | MySQL, PostgreSQL, SQL Server | Datos empresariales, ETL existente |
| **Cloud** | BigQuery, Snowflake, Redshift | Big Data, análisis escalable |
| **Web** | Google Sheets, Salesforce, APIs | Datos en tiempo real, colaboración |

**Ejemplo práctico: Conectar Excel**  
1. Abre Tableau Desktop  
2. Click en "Connect" → "Microsoft Excel"  
3. Navega a `ventas_2024.xlsx`  
4. Tableau muestra preview → Arrastra la hoja al canvas  

**Datos de ejemplo (ventas_2024.xlsx):**

| Fecha | Producto | Región | Vendedor | Unidades | Precio_Unit |
|-------|----------|--------|----------|----------|-------------|
| 2024-01-15 | Laptop | Madrid | Ana | 5 | 899 |
| 2024-01-16 | Tablet | Barcelona | Carlos | 8 | 399 |
| 2024-01-17 | Smartphone | Valencia | Beatriz | 12 | 699 |
| 2024-01-18 | Laptop | Sevilla | David | 3 | 899 |
| 2024-02-10 | Smartphone | Madrid | Ana | 7 | 699 |

### 3.2 Live vs Extract

| Modo | ¿Qué hace? | ¿Cuándo usarlo? | Velocidad |
|------|------------|-----------------|-----------|
| **Live** | Se conecta en tiempo real a la fuente | Datos cambian constantemente, fuente rápida | Depende de la DB |
| **Extract** | Copia los datos a Tableau (.hyper) | Fuente lenta o datos históricos | ⚡ Muy rápido |

> **Regla de oro:** Live para dashboards operativos (ventas del día). Extract para análisis históricos (trends de años).

### 3.3 Preparación básica

Tableau incluye preparación integrada (o Tableau Prep):  
- **Joins:** Combina tablas con relaciones (LEFT, INNER, etc.)  
- **Unions:** Apila tablas con la misma estructura  
- **Filtros:** Reduce datos antes de visualizar  
- **Campos calculados:** Crea nuevas columnas  

**Ejemplo de campo calculado:**
```tableau
Ventas_Totales = [Unidades] * [Precio_Unit]
Beneficio = [Ventas_Totales] - [Costes]
```

---

## 4. Tu primera visualización: Paso a paso

### Caso 1: Ventas por región (Bar Chart)

**Pasos:**  
1. Arrastra `Región` a **Columns**  
2. Arrastra `Ventas_Totales` a **Rows**  
3. Tableau crea barras automáticamente  
4. Click derecho en `Ventas_Totales` → **Sort Descending**  
5. Arrastra `Producto` a **Color** para segmentar  

**Resultado visual:**
```
Ventas (€)
   ↑
9K | ████████████████ Valencia (Smartphone)
   |
7K | ██████████ Madrid (Laptop + Smartphone)
   |
4K | ████████ Sevilla (Laptop)
   |
3K | ██████ Barcelona (Tablet)
   |
   +─────────────────────────────────────→ Región
```

**Insight descubierto:** Valencia lidera por smartphones. Madrid diversifica. Sevilla y Barcelona necesitan impulso.

### Caso 2: Tendencia temporal (Line Chart)

**Configuración:**  
- **Eje X:** Fecha (agrupada por mes)  
- **Eje Y:** SUM(Ventas_Totales)  
- **Color:** Producto  

**Resultado:**
```
Ventas (miles €)
   ↑
10 |              ● Smartphone
   |            /
 8 |          ●
   |        / \
 6 |      ●     ● Laptop
   |    /
 4 |  ●     ● Tablet
   |
   +──────────────────────────→ Tiempo
    Ene    Feb    Mar    Abr
```

**Insight:** Los smartphones muestran crecimiento constante, laptops son estacionales.

### Caso 3: Mapa de calor (Heatmap)

**Pasos:**  
1. Arrastra `Región` a **Filas**  
2. Arrastra `Producto` a **Columnas**  
3. Arrastra `Ventas_Totales` a **Color**  
4. Cambia marca a "Cuadrado"  

**Tabla resultante:**

| Región/Producto | Laptop | Tablet | Smartphone |
|-----------------|--------|--------|------------|
| **Madrid** | 🟨 4,495 | ⬜ 0 | 🟩 4,893 |
| **Barcelona** | ⬜ 0 | 🟦 3,192 | ⬜ 0 |
| **Valencia** | ⬜ 0 | ⬜ 0 | 🟩 8,388 |
| **Sevilla** | 🟨 2,697 | ⬜ 0 | ⬜ 0 |

🟩 = Alto | 🟨 = Medio | 🟦 = Bajo | ⬜ = Sin datos

**Insight:** Cada región tiene un producto dominante. Oportunidad para cross-selling.

---

## 5. Tipos de gráficos: ¿Cuándo usar cada uno?

| Visualización | ¿Cuándo usarla? | Ejemplo en nuestros datos |
|---------------|-----------------|---------------------------|
| **Bar Chart** | Comparar categorías | Ventas por región |
| **Line Chart** | Tendencias temporales | Evolución mensual |
| **Scatter Plot** | Relación entre 2 variables | Precio vs Unidades vendidas |
| **Heatmap** | Patrones en matrices | Producto × Región |
| **Treemap** | Proporciones jerárquicas | Market share por categoría |
| **Map** | Datos geográficos | Ventas por provincia |

**El botón "Show Me":**  
Tableau sugiere gráficos según tus datos. Pero dominar los básicos te hace más rápido. Usa "Show Me" como guía, no como muleta.

---

## 6. Interactividad: Filtros y acciones

### Filtros básicos

**Crear un filtro:**  
1. Arrastra `Región` a **Filters**  
2. Selecciona regiones deseadas  
3. Click derecho → **Show Filter** para que el usuario lo controle  

**Tipos de filtros:**  
- **Lista desplegable:** Para pocas opciones (regiones)  
- **Slider:** Para rangos numéricos (precio: 0-1000€)  
- **Rango de fechas:** Para análisis temporal  

### Acciones de dashboard

Configura interacciones entre gráficos:  
- **Dashboard** → **Actions** → **Filter**  
- Al hacer click en una región del mapa → filtra las ventas en el gráfico de barras  

**Ejemplo de tooltip efectivo:**
```
Producto: Laptop Pro X1
Región: Madrid
Ventas: €4,495
Unidades: 5 (17% del total)
Período: Enero 2024
Variación: +12% vs mes anterior
```

> **Efecto:** Dashboards que responden al usuario, no solo informan.

---

## 7. Dashboards: Orquestando visualizaciones

### 7.1 Principios de diseño

Un dashboard efectivo cuenta una historia:

**Regla F:** Los usuarios leen en forma de F (arriba izquierda → derecha → abajo).  

**Layout ejemplo:**
```
┌────────────────────────────────────────────┐
│ 💰 Ventas: €18.7K │ 📈 +15% vs trim ant   │
├──────────────────┬─────────────────────────┤
│  MAPA DE VENTAS  │  TOP 5 PRODUCTOS       │
│  POR REGIÓN      │  (Bar Chart)           │
├──────────────────┴─────────────────────────┤
│  TENDENCIA MENSUAL (Line Chart)            │
├────────────────────────────────────────────┤
│  Filtros: [Región ▾] [Fecha: Q1 2024 ▾]   │
└────────────────────────────────────────────┘
```

**Distribución:**  
- **Top:** KPIs principales (números grandes, impacto visual)  
- **Centro:** Visualización principal (el gráfico más importante)  
- **Abajo:** Detalles o tendencias complementarias  
- **Lateral:** Filtros globales  

### 7.2 Creación práctica

**Pasos:**  
1. **New Dashboard** (icono de cuadrícula)  
2. Arrastra **worksheets** al canvas  
3. Usa **Containers** (horizontal/vertical) para organizar  
4. Añade **Filters** comunes  
5. Configura **Actions** para interactividad  
6. Ajusta tamaño: **Dashboard** → **Size** → "Automatic"  

### 7.3 Tips de diseño profesional

**✅ HACER:**  
- Usar paletas coherentes (≤5 colores)  
- Títulos descriptivos: "Ventas cayeron 15% en Q3" > "Ventas Q3"  
- Dejar espacio en blanco (whitespace) para respirar  
- Probar en móvil: **Device Preview**  

**❌ NO HACER:**  
- Gráficos de pastel con +10 categorías → usa bar chart  
- Demasiados elementos (máximo 5-7 visualizaciones)  
- Ejes sin escala consistente  
- Olvidar etiquetar ejes  
- Usar rojo-verde juntos (daltonismo)  

---

## 8. Funcionalidades avanzadas (intro)

### 8.1 Campos calculados

Crea métricas personalizadas con sintaxis simple:

```tableau
// Básicas
Ventas_Totales = [Unidades] * [Precio_Unit]
Beneficio = [Ventas_Totales] - [Costes]

// Condicionales
Rendimiento = IF [Ventas_Totales] > 5000
              THEN "Alto"
              ELSE "Bajo"
              END

// Fechas
Trimestre = DATEPART('quarter', [Fecha])

// Porcentajes
Tasa_Conversion = ([Compras] / [Visitas]) * 100
Crecimiento_YoY = (SUM([Ventas_2024]) - SUM([Ventas_2023]))
                  / SUM([Ventas_2023])
```

### 8.2 Parámetros

Variables que el usuario controla en tiempo real:

**Ejemplo:** Parámetro `Top_N` (valores: 5, 10, 20)  
- El usuario elige cuántos productos ver en el ranking  
- Filtro dinámico: `INDEX() <= [Top_N]`  
- Resultado: El dashboard se adapta según la selección  

### 8.3 Table Calculations

Cálculos sobre resultados agregados (no sobre datos crudos):

- **Running Total:** Acumulado de ventas mes a mes  
- **Percent of Total:** Cada región como % del total  
- **Moving Average:** Media móvil de 3 meses para suavizar tendencias  
- **Rank:** Posición de cada producto por ventas  

> **Pro tip:** Combina un mapa con Running Total para mostrar cómo crece la cobertura geográfica.

---

## 9. Casos de uso reales

### Caso 1: E-commerce (Zara)
**Problema:** Marketing no sabía qué campañas funcionaban.  
**Solución Tableau:**  
- Dashboard con ROI por canal (Google Ads, Meta, Email)  
- Filtro por producto/colección  
- Mapa de calor: rendimiento por hora/día  

**Impacto:** Reasignaron 30% del presupuesto a canales rentables. ROI +22%.

### Caso 2: Hospital público
**Problema:** Tiempos de espera impredecibles en urgencias.  
**Solución Tableau:**  
- Dashboard operativo con tiempos en vivo  
- Predicción de carga por hora (histórico)  
- Alertas cuando se supera umbral  

**Impacto:** Tiempo de espera de 45 min → 28 min. Satisfacción +35%.

### Caso 3: Startup fintech (Revolut)
**Problema:** Detectar anomalías en transacciones.  
**Solución Tableau:**  
- Scatter plot: monto vs frecuencia  
- Outliers marcados en rojo  
- Drill-down a detalle de usuario  

**Impacto:** Identifican fraude 40% más rápido vs SQL manual.

---

## 10. Tableau vs otras herramientas

| Característica | Tableau | Power BI | Looker Studio | Python (Plotly) |
|----------------|---------|----------|---------------|-----------------|
| **Curva aprendizaje** | Media | Baja-Media | Baja | Alta |
| **Coste** | €€€ (70$/mes) | € (10$/mes) | Gratis | Gratis |
| **Fuentes de datos** | 80+ | 50+ | 20+ (Google) | Ilimitadas |
| **Diseño visual** | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐ |
| **Interactividad** | Excelente | Muy buena | Buena | Excelente (custom) |
| **Colaboración** | Server/Cloud | Power BI Service | Nativa (Google) | Dash apps |
| **Integración MS** | Regular | Perfecta (365) | Débil | N/A |
| **Autonomía usuario** | Alta | Alta | Media | Baja (requiere dev) |

**¿Cuándo elegir Tableau?**  
✅ Visualizaciones complejas sin código  
✅ Exploración ad-hoc de datos  
✅ Presupuesto para licencias  
✅ Múltiples fuentes de datos  

**¿Cuándo NO Tableau?**  
❌ Startup con presupuesto limitado → Looker Studio  
❌ Ya usas ecosistema Microsoft → Power BI  
❌ Necesitas control total del código → Python  
❌ Solo necesitas gráficos estáticos → Excel  

---

## 11. Ejercicio práctico: TechShop

**Contexto:** Eres analista en "TechShop", un e-commerce de tecnología. El CMO quiere entender el rendimiento de ventas.

**Objetivos:**  
1. Identificar productos más rentables  
2. Analizar tendencias temporales  
3. Comparar rendimiento por región  

**Dataset:** Usa los datos de `ventas_2024.xlsx` (arriba)

**Tareas:**  
1. **Conectar:** Importa el Excel a Tableau  
2. **Calcular:** Crea campo `Ventas_Totales`  
3. **Visualizar:**  
   - Bar chart: Ventas por producto (ordenado desc)  
   - Line chart: Tendencia mensual por producto  
   - Heatmap: Región × Producto  
4. **Dashboard:** Combina las 3 visualizaciones  
5. **Filtros:** Añade filtro de fecha interactivo  
6. **Insight:** ¿Qué patrón descubres? ¿Qué recomendarías al CMO?  

**Tiempo estimado:** 45 minutos  
**Meta:** Crear tu primer dashboard funcional end-to-end.

**Insights esperados:**  
- Valencia domina por smartphones  
- Febrero tiene pico (¿promoción San Valentín?)  
- Barcelona solo vende tablets (¿problema de stock?)  

---

## 12. Errores comunes (y cómo evitarlos)

| Error | Consecuencia | Solución |
|-------|--------------|----------|
| Gráfico de pastel con 10+ categorías | Ilegible | Bar chart o treemap |
| No agregar títulos descriptivos | Confusión | "Ventas cayeron en Q3" vs "Ventas Q3" |
| Demasiadas visualizaciones | Parálisis por análisis | Máximo 5-7 elementos por dashboard |
| Ejes sin escala consistente | Comparaciones engañosas | Fijar rango: **Edit Axis** → Manual |
| No probar en móvil | Dashboard roto | **Device Preview** → Tablet/Phone |
| Usar rojo para datos negativos | Confuso en daltonismo | Usar azul-naranja |
| Olvidar tooltips | Pérdida de contexto | Configurar tooltips informativos |

---

## 13. Recursos y versiones

### Versiones de Tableau

| Producto | ¿Qué es? | Precio | ¿Para quién? |
|----------|----------|--------|--------------|
| **Tableau Desktop** | App para crear visualizaciones | 70$/mes/usuario | Analistas, creadores |
| **Tableau Public** | Versión gratuita (dashboards públicos) | Gratis | Aprendizaje, portfolios |
| **Tableau Server** | Hosting on-premise | Licencia corporativa | Empresas grandes |
| **Tableau Cloud** | Hosting en la nube (SaaS) | Desde 70$/mes | Empresas medianas/grandes |
| **Tableau Prep** | Limpieza y preparación de datos | Incluido en Desktop | Data wrangling |

> **Para aprender:** Empieza con **Tableau Public** (gratis, pero tus dashboards son públicos).

### Flujo de trabajo típico

```
1. CONECTAR
   ↓
   Fuente de datos (Excel, SQL, Cloud)
   ↓
2. PREPARAR
   ↓
   Joins, filtros, campos calculados
   ↓
3. EXPLORAR
   ↓
   Crear worksheets (gráficos individuales)
   ↓
4. COMPONER
   ↓
   Armar dashboard con worksheets
   ↓
5. PUBLICAR
   ↓
   Tableau Server/Cloud para compartir
   ↓
6. ITERAR
   ↓
   Feedback → Ajustar → Mejorar
```

---

## 14. Resumen

- **Tableau = Visualización sin código:** Conecta datos, arrastra campos, crea dashboards profesionales.  
- **80+ fuentes:** Desde Excel hasta Snowflake, versatilidad total.  
- **Filosofía:** Exploración visual > SQL queries. Ideal para analistas y negocio.  
- **Cuándo usar:** Dashboards interactivos rápidos, múltiples fuentes, audiencia no técnica.  
- **Limitación:** Coste elevado vs alternativas (Power BI, Looker Studio).  

> **Next step:** Practica con datasets reales. Tableau es 20% teoría, 80% exploración. Descarga Tableau Public y crea tu primer dashboard hoy.

**Tres cosas que debes recordar:**  
1. **Dimensions (azul) vs Measures (verde):** La base de todo  
2. **Show Me es una guía, no una muleta:** Aprende qué gráfico usar y por qué  
3. **Un dashboard cuenta una historia:** No es una colección de gráficos random  

---

## 15. Referencias

### Vídeos
- [Tableau in 2 Minutes - Full Overview](https://youtu.be/6xv1KvCMF1Q)
- [Tableau Full Course - Learn Tableau in 8 Hours](https://youtu.be/aHaOIvR00So)
- [How to Build Your First Dashboard](https://youtu.be/X6xMmHfW-qQ)
- [Tableau vs Power BI - Honest Comparison 2024](https://youtu.be/gDmkMZiFHLs)

### Lecturas
- [Tableau Learning Path - Official](https://www.tableau.com/learn/training)
- [Public Gallery - Inspiración y ejemplos](https://public.tableau.com/app/discover)
- [Best Practices for Dashboard Design](https://help.tableau.com/current/pro/desktop/en-us/dashboards_best_practices.htm)
- [Makeover Monday - Práctica semanal](https://www.makeovermonday.co.uk/)

### Datasets para practicar
- [Superstore Dataset - Incluido en Tableau](https://community.tableau.com/s/question/0D54T00000CWeX8SAL/sample-superstore-sales-excelxls)
- [Kaggle Datasets](https://www.kaggle.com/datasets)
- [Our World in Data](https://ourworldindata.org/)
- [Google Dataset Search](https://datasetsearch.research.google.com/)

---

*¡Ahora te toca explorar! Descarga Tableau Public y crea tu primer dashboard. La mejor forma de aprender Tableau es ensuciándote las manos con datos reales. 🚀*