<a href="https://colab.research.google.com/github/financieras/big_data/blob/main/leccion_2_2_3.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Lección 2.2.3: Dashboards interactivos con Plotly/Dash

## 1. ¿Por qué interactividad?

Imagina presentar el análisis de ventas trimestrales. Con un PDF estático, tu jefe pregunta: "¿Y si filtramos por la región Norte?" Tú: "Déjame 2 horas para regenerarlo..."  

Con un **dashboard interactivo**, él mismo cambia el filtro en 2 segundos y obtiene la respuesta.

**Diferencia clave:**  
- **Estático (Matplotlib/PDF):** "Aquí está lo que encontré"  
- **Interactivo (Plotly/Dash):** "Descubre lo que necesites"  

> **Clave:** La interactividad transforma gráficos en **herramientas de exploración** que empoderan al usuario a obtener sus propias respuestas sin depender del analista.

---

## 2. Plotly/Dash: El dúo dinámico

**Plotly** y **Dash** trabajan juntos como una orquesta perfecta:

| Componente | Función | Analogía |
|------------|---------|----------|
| **Plotly** | Crear gráficos interactivos | El "pintor" que hace cuadros bellos |
| **Dash** | Construir aplicaciones web | El "arquitecto" que diseña la casa |
| **Python** | Lógica de negocio y datos | Los "cimientos" de todo |

**¿Por qué Plotly/Dash?**  
- **100% Python:** Cero líneas de JavaScript  
- **Open source:** Gratis y con 300K+ usuarios activos  
- **Empresarial:** Usado por Google, Tesla, JP Morgan  
- **Interactividad nativa:** Zoom, hover, filtros sin configuración extra  

**Resultado:** Dashboards profesionales en Python, desde prototipos hasta producción.

---

## 3. Plotly: Gráficos con superpoderes

**Misión:** Crear visualizaciones interactivas con **zoom, hover, animaciones** en pocas líneas.  

### Ejemplo básico con Plotly Express

```python
import plotly.express as px
import pandas as pd

# Datos de ventas
df = pd.DataFrame({
    'mes': ['Ene', 'Feb', 'Mar', 'Abr', 'May', 'Jun'],
    'ventas': [120, 145, 160, 155, 180, 200],
    'region': ['Norte', 'Norte', 'Norte', 'Sur', 'Sur', 'Sur']
})

# Gráfico interactivo en DOS líneas
fig = px.line(df, x='mes', y='ventas', color='region',
              title='Ventas por Región')
fig.show()  # Se abre en el navegador
```

**Resultado:** Un gráfico donde puedes hacer zoom, ocultar series con un clic, ver valores exactos al pasar el ratón, y exportar como PNG. **Todo automático.**

### Características automáticas de Plotly

- **Hover tooltips:** Valores exactos al pasar el ratón  
- **Zoom y pan:** Explora diferentes escalas con scroll  
- **Toggle legendas:** Oculta/muestra series haciendo clic  
- **Exportación:** Descarga PNG/SVG con un botón  
- **Responsive:** Se adapta al tamaño de pantalla  

> **Tip:** Plotly Express es ideal para exploración rápida. Plotly Graph Objects ofrece control total para dashboards complejos.

---

## 4. Dash: De gráfico a aplicación web

**Misión:** Convertir visualizaciones en **aplicaciones web completas** con filtros, KPIs y múltiples vistas.  

**¿Qué añade Dash a Plotly?**  
- **Layout:** Organiza componentes (gráficos, filtros, tablas)  
- **Callbacks:** Actualiza gráficos según interacción del usuario  
- **Componentes:** Dropdowns, sliders, date pickers, inputs  
- **Deploy:** Publica tu dashboard como app web  

> **Analogía:** Si Plotly es un cuadro interactivo, Dash es el museo completo donde organizas y conectas tus obras.

### Estructura de una app Dash

```python
from dash import Dash, html, dcc, callback, Output, Input
import plotly.express as px
import pandas as pd

# 1. Cargar datos
df = pd.read_csv('ventas.csv')

# 2. Inicializar app
app = Dash(__name__)

# 3. Diseñar layout (estructura visual)
app.layout = html.Div([
    html.H1('Dashboard de Ventas'),
    
    dcc.Dropdown(
        id='dropdown-region',
        options=[{'label': r, 'value': r} for r in df['region'].unique()],
        value='Norte'
    ),
    
    dcc.Graph(id='grafico-ventas')
])

# 4. Crear callback (interactividad)
@callback(
    Output('grafico-ventas', 'figure'),
    Input('dropdown-region', 'value')
)
def actualizar_grafico(region_seleccionada):
    df_filtrado = df[df['region'] == region_seleccionada]
    fig = px.bar(df_filtrado, x='mes', y='ventas',
                 title=f'Ventas en {region_seleccionada}')
    return fig

# 5. Ejecutar
if __name__ == '__main__':
    app.run(debug=True)
```

**Resultado:** Visita `http://localhost:8050` y verás un dashboard web donde al seleccionar una región, el gráfico se actualiza automáticamente.

---

## 5. Componentes clave de Dash

### Core Components (dcc)

Los componentes para gráficos e inputs interactivos:

| Componente | Uso | Ejemplo real |
|------------|-----|--------------|
| `dcc.Graph` | Mostrar gráficos Plotly | Dashboard de ventas |
| `dcc.Dropdown` | Selector desplegable | Filtrar por categoría |
| `dcc.Slider` | Control deslizante | Rango de precios |
| `dcc.DatePickerRange` | Rango de fechas | Periodo de análisis |
| `dcc.Input` | Campo de texto | Buscar producto |
| `dcc.Interval` | Actualización automática | Datos en tiempo real |

### HTML Components (html)

Elementos HTML para estructura y diseño:

| Componente | Equivalente HTML | Uso |
|------------|------------------|-----|
| `html.Div` | `<div>` | Contenedor principal |
| `html.H1`, `html.H2` | `<h1>`, `<h2>` | Títulos y secciones |
| `html.P` | `<p>` | Párrafos de texto |
| `html.Button` | `<button>` | Botones de acción |
| `html.Table` | `<table>` | Tablas de datos |

---

## 6. Callbacks: El corazón de la magia

Los **callbacks** conectan inputs con outputs, haciendo el dashboard **reactivo**.  

**Flujo:**  
1. Usuario cambia un **Input** (selecciona región en dropdown)  
2. Callback se activa automáticamente  
3. Función Python procesa los datos  
4. Actualiza el **Output** (gráfico con datos filtrados)  

### Ejemplo: Múltiples filtros

```python
@callback(
    Output('grafico-ventas', 'figure'),
    [Input('dropdown-region', 'value'),
     Input('slider-anio', 'value'),
     Input('date-picker', 'start_date')]
)
def actualizar_grafico(region, anio, fecha_inicio):
    # Filtrar datos según los 3 inputs
    df_filtrado = df[
        (df['region'] == region) &
        (df['anio'] == anio) &
        (df['fecha'] >= fecha_inicio)
    ]
    
    fig = px.line(df_filtrado, x='mes', y='ventas',
                  title=f'Ventas en {region} - {anio}')
    return fig
```

> **Tip:** Un callback puede tener múltiples Inputs y múltiples Outputs. Dash gestiona automáticamente las dependencias.

### Pattern avanzado: Callbacks encadenados

```python
# Paso 1: Dropdown de país actualiza opciones de ciudad
@callback(
    Output('dropdown-ciudad', 'options'),
    Input('dropdown-pais', 'value')
)
def actualizar_ciudades(pais):
    ciudades = obtener_ciudades(pais)
    return [{'label': c, 'value': c} for c in ciudades]

# Paso 2: Ciudad actualiza el gráfico
@callback(
    Output('grafico', 'figure'),
    Input('dropdown-ciudad', 'value')
)
def actualizar_grafico(ciudad):
    datos = obtener_datos(ciudad)
    return px.bar(datos, x='mes', y='ventas')
```

---

## 7. Caso real: Dashboard de e-commerce

**Contexto:** Una tienda online necesita monitorizar KPIs en tiempo real para tomar decisiones rápidas.  

**Requerimientos:**  
- KPIs principales: Ventas totales, clientes activos, ticket medio  
- Filtros: Región, rango de fechas, categoría  
- Gráficos: Evolución temporal, top productos, distribución geográfica  

**Implementación:**

```python
app.layout = html.Div([
    # Header
    html.H1('📊 Dashboard de Ventas E-commerce',
            style={'textAlign': 'center', 'color': '#2E86AB'}),
    
    # Filtros en fila horizontal
    html.Div([
        html.Div([
            html.Label('Región:'),
            dcc.Dropdown(
                id='filtro-region',
                options=[{'label': r, 'value': r} for r in regiones],
                value='Todas'
            )
        ], style={'width': '200px'}),
        
        html.Div([
            html.Label('Periodo:'),
            dcc.DatePickerRange(id='filtro-fechas')
        ], style={'width': '300px'})
    ], style={'display': 'flex', 'gap': '20px', 'margin': '20px'}),
    
    # Tarjetas KPI
    html.Div([
        html.Div([
            html.H3('Ventas Totales'),
            html.H2(id='kpi-ventas', style={'color': '#27AE60'})
        ], className='kpi-card'),
        
        html.Div([
            html.H3('Clientes Activos'),
            html.H2(id='kpi-clientes', style={'color': '#3498DB'})
        ], className='kpi-card'),
        
        html.Div([
            html.H3('Ticket Medio'),
            html.H2(id='kpi-ticket', style={'color': '#E74C3C'})
        ], className='kpi-card')
    ], style={'display': 'flex', 'justifyContent': 'space-around'}),
    
    # Gráficos principales
    html.Div([
        dcc.Graph(id='grafico-temporal'),
        dcc.Graph(id='grafico-categorias')
    ], style={'display': 'grid', 'gridTemplateColumns': '1fr 1fr', 'gap': '20px'})
])

@callback(
    [Output('kpi-ventas', 'children'),
     Output('kpi-clientes', 'children'),
     Output('kpi-ticket', 'children'),
     Output('grafico-temporal', 'figure'),
     Output('grafico-categorias', 'figure')],
    [Input('filtro-region', 'value'),
     Input('filtro-fechas', 'start_date'),
     Input('filtro-fechas', 'end_date')]
)
def actualizar_dashboard(region, fecha_inicio, fecha_fin):
    # Filtrar datos
    datos = filtrar_datos(region, fecha_inicio, fecha_fin)
    
    # Calcular KPIs
    ventas_totales = f"€{datos['ventas'].sum():,.0f}"
    clientes = f"{datos['cliente_id'].nunique():,}"
    ticket_medio = f"€{datos['ventas'].mean():.2f}"
    
    # Crear gráficos
    fig_temporal = px.line(datos, x='fecha', y='ventas',
                           title='Evolución de Ventas')
    
    fig_categorias = px.bar(datos.groupby('categoria')['ventas'].sum(),
                            title='Ventas por Categoría')
    
    return ventas_totales, clientes, ticket_medio, fig_temporal, fig_categorias
```

**Impacto:** Los gerentes acceden desde cualquier dispositivo, identifican tendencias en segundos y reaccionan 3 días más rápido ante caídas de ventas. **Resultado:** +15% en conversión al detectar productos con bajo stock antes de agotarse.

---

## 8. Mejores prácticas de diseño

### Regla 1: Jerarquía visual clara

```python
# ❌ MAL - Todo tiene la misma importancia
layout_desordenado = html.Div([
    html.H3("Ventas"), html.H3("Clientes"), html.H3("Productos"),
    dcc.Graph(), dcc.Graph(), dcc.Graph()
])

# ✅ BIEN - Jerarquía obvia
layout_efectivo = html.Div([
    html.H1("KPIs Críticos", style={'fontSize': '32px', 'color': '#1f77b4'}),
    html.Div([kpi1, kpi2, kpi3]),  # KPIs grandes arriba
    
    html.H2("Análisis Detallado", style={'fontSize': '24px'}),
    dcc.Graph(style={'height': '400px'}),  # Gráfico principal grande
    
    html.H3("Métricas Secundarias", style={'fontSize': '18px', 'color': '#888'}),
    dcc.Graph(style={'height': '250px'})  # Gráficos secundarios pequeños
])
```

### Regla 2: Menos es más

**Principio:** 3-5 gráficos clave > 15 gráficos mediocres  

**Mal diseño:**  
- 15 gráficos en una página (usuario abrumado)  
- Colores estridentes y discordantes  
- Información irrelevante que distrae  

**Buen diseño:**  
- 3-5 visualizaciones enfocadas en la decisión  
- Paleta de colores coherente (máximo 4-5 colores)  
- Solo métricas accionables  

### Regla 3: Feedback al usuario

```python
# Mostrar loading automáticamente
@callback(
    Output('grafico', 'figure'),
    Input('filtro', 'value')
)
def actualizar_grafico(filtro):
    # Dash muestra automáticamente un spinner durante cálculos pesados
    datos = consulta_sql_lenta(filtro)  # 2-3 segundos
    return px.line(datos, x='fecha', y='valor')

# Manejo de errores graceful
@callback(
    Output('grafico', 'figure'),
    Input('filtro', 'value')
)
def callback_seguro(filtro):
    try:
        datos = obtener_datos(filtro)
        if datos.empty:
            return px.line(title="⚠️ No hay datos para este filtro")
        return crear_grafico(datos)
    except Exception as e:
        return px.line(title=f"❌ Error: {str(e)}")
```

---

## 9. Plotly/Dash vs otras herramientas

| Criterio | Dash | Power BI | Tableau | Streamlit |
|----------|------|----------|---------|-----------|
| **Personalización** | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
| **Costo** | Gratis | €€ | €€€ | Gratis |
| **Integración Python** | ⭐⭐⭐⭐⭐ | ⭐⭐ | ⭐⭐ | ⭐⭐⭐⭐⭐ |
| **Curva aprendizaje** | Media | Baja | Media | Baja |
| **Control UI** | Total | Limitado | Medio | Limitado |
| **Deploy** | Flexible | Microsoft | Tableau Server | Simple |

**¿Cuándo elegir Dash?**  
- ✅ Necesitas máxima flexibilidad y control  
- ✅ Tu equipo domina Python  
- ✅ Quieres integrar modelos de ML  
- ✅ Presupuesto limitado (open source)  
- ✅ Necesitas dashboards públicos en web  

**¿Cuándo otras herramientas?**  
- ❌ Usuarios no técnicos deben crear reportes (→ Power BI)  
- ❌ Necesitas implementación sin programar (→ Tableau)  
- ❌ Prototipo ultra-rápido sin callbacks complejos (→ Streamlit)  

---

## 10. Errores comunes y soluciones

| Error | Síntoma | Solución |
|-------|---------|----------|
| **Callback circular** | App se congela | Usar `prevent_initial_call=True` |
| **Cargar CSV en cada callback** | Dashboard lentísimo | Pre-cargar datos al inicio |
| **Demasiados callbacks** | Código imposible de mantener | Modularizar en archivos separados |
| **Sin manejo de errores** | App crashea con datos malos | Usar `try-except` en callbacks |
| **IDs duplicados** | Callbacks no funcionan | Asegurar IDs únicos |

```python
# ❌ MAL - Lee CSV en cada callback (lentísimo)
@callback(Output('graph', 'figure'), Input('dropdown', 'value'))
def update(value):
    df = pd.read_csv('data.csv')  # ¡Se lee 50 veces!
    return px.bar(df[df['cat'] == value])

# ✅ BIEN - Carga datos una vez al inicio
df = pd.read_csv('data.csv')  # ¡Se lee 1 sola vez!

@callback(Output('graph', 'figure'), Input('dropdown', 'value'))
def update(value):
    return px.bar(df[df['cat'] == value])
```

---

## 11. Patrones avanzados

### Pattern 1: Descarga de datos filtrados

```python
from dash import dcc

app.layout = html.Div([
    dcc.Graph(id='grafico'),
    html.Button('Descargar CSV', id='btn-descarga'),
    dcc.Download(id='download-data')
])

@callback(
    Output('download-data', 'data'),
    Input('btn-descarga', 'n_clicks'),
    prevent_initial_call=True
)
def descargar_csv(n_clicks):
    return dcc.send_data_frame(df_filtrado.to_csv, "datos.csv")
```

### Pattern 2: Actualización en tiempo real

```python
app.layout = html.Div([
    dcc.Graph(id='grafico-live'),
    dcc.Interval(
        id='interval',
        interval=5*1000,  # Actualizar cada 5 segundos
        n_intervals=0
    )
])

@callback(
    Output('grafico-live', 'figure'),
    Input('interval', 'n_intervals')
)
def actualizar_live(n):
    # Consulta datos frescos cada 5 segundos
    df_nuevo = consultar_api_tiempo_real()
    return px.line(df_nuevo, x='timestamp', y='valor')
```

### Pattern 3: Tabs para organizar contenido

```python
from dash import dcc

app.layout = html.Div([
    dcc.Tabs([
        dcc.Tab(label='Ventas', children=[
            dcc.Graph(id='grafico-ventas')
        ]),
        dcc.Tab(label='Clientes', children=[
            dcc.Graph(id='grafico-clientes')
        ]),
        dcc.Tab(label='Productos', children=[
            dcc.Graph(id='grafico-productos')
        ])
    ])
])
```

---

## 12. Deploy: De localhost a producción

### Opción 1: Heroku (más simple)

```bash
# 1. Crear requirements.txt
dash==2.14.0
plotly==5.18.0
pandas==2.1.0
gunicorn==21.2.0

# 2. Crear Procfile
web: gunicorn app:server

# 3. Deploy
git init
git add .
git commit -m "Initial commit"
heroku create mi-dashboard
git push heroku main
```

**Resultado:** Dashboard público en `https://mi-dashboard.herokuapp.com`

### Opción 2: Docker (más flexible)

```dockerfile
FROM python:3.11-slim
WORKDIR /app
COPY requirements.txt .
RUN pip install -r requirements.txt
COPY . .
EXPOSE 8050
CMD ["python", "app.py"]
```

```bash
docker build -t mi-dashboard .
docker run -p 8050:8050 mi-dashboard
```

### Opción 3: Cloud (producción)

- **AWS Elastic Beanstalk:** Escalable, fácil de configurar  
- **Google Cloud Run:** Serverless, paga por uso  
- **Azure App Service:** Integración con ecosistema Microsoft  
- **Plotly Dash Enterprise:** Solución completa con autenticación  

---

## 13. Ejemplo completo: Dashboard COVID-19

**Objetivo:** Monitorizar casos por país con filtros interactivos.

```python
from dash import Dash, html, dcc, callback, Output, Input
import plotly.express as px
import pandas as pd

# Cargar datos
url = 'https://covid.ourworldindata.org/data/owid-covid-data.csv'
df = pd.read_csv(url)
df = df[['date', 'location', 'total_cases', 'new_cases']].dropna()

# App
app = Dash(__name__)

app.layout = html.Div([
    html.H1('🦠 Dashboard COVID-19', style={'textAlign': 'center'}),
    
    html.Div([
        html.Label('Selecciona países:'),
        dcc.Dropdown(
            id='dropdown-paises',
            options=[{'label': p, 'value': p} for p in df['location'].unique()],
            value=['Spain', 'Italy', 'Germany'],
            multi=True
        )
    ], style={'width': '60%', 'margin': '20px auto'}),
    
    dcc.RadioItems(
        id='radio-metrica',
        options=[
            {'label': 'Casos Totales', 'value': 'total_cases'},
            {'label': 'Casos Nuevos', 'value': 'new_cases'}
        ],
        value='total_cases',
        inline=True,
        style={'textAlign': 'center', 'margin': '20px'}
    ),
    
    dcc.Graph(id='grafico-principal')
])

@callback(
    Output('grafico-principal', 'figure'),
    [Input('dropdown-paises', 'value'),
     Input('radio-metrica', 'value')]
)
def actualizar_grafico(paises, metrica):
    df_filtrado = df[df['location'].isin(paises)]
    
    titulo = 'Casos Totales' if metrica == 'total_cases' else 'Casos Nuevos (diarios)'
    
    fig = px.line(
        df_filtrado,
        x='date',
        y=metrica,
        color='location',
        title=titulo,
        labels={'date': 'Fecha', metrica: titulo}
    )
    
    fig.update_layout(hovermode='x unified')
    
    return fig

if __name__ == '__main__':
    app.run(debug=True)
```

**Características:**  
- Selector múltiple de países  
- Toggle entre casos totales y nuevos  
- Hover unificado para comparar valores  
- Responsivo y fácil de usar  

---

## 14. Resumen

- **Plotly:** Gráficos interactivos con zoom, hover y animaciones en pocas líneas  
- **Dash:** Framework para crear aplicaciones web completas, 100% Python  
- **Callbacks:** Conectan inputs (filtros) con outputs (gráficos) para interactividad reactiva  
- **Ventajas:** Flexibilidad total, open source, integración nativa con Python  
- **Casos de uso:** KPIs en tiempo real, exploración de datos, reportes ejecutivos  

> **Clave:** Dash democratiza el acceso a dashboards profesionales, permitiendo que equipos técnicos creen aplicaciones sin frontend developers.

**Cuándo usar Dash:**  
- ✅ Necesitas compartir análisis con stakeholders  
- ✅ Los datos cambian frecuentemente  
- ✅ Quieres integrar modelos de ML en la UI  
- ✅ Presupuesto limitado (open source)  
- ❌ Análisis estático de una sola vez (usa Matplotlib)  
- ❌ Usuarios no técnicos deben crear reportes (usa Power BI)  

---

## 15. Referencias

### Documentación oficial
- [Dash Documentation](https://dash.plotly.com/) - Tutorial completo oficial
- [Plotly Python](https://plotly.com/python/) - Galería de gráficos
- [Dash Gallery](https://dash.gallery/Portal/) - Ejemplos de dashboards reales

### Vídeos recomendados
- [Plotly Express Tutorial - Full Course](https://youtu.be/GGL6U0k8WYA)
- [Build A Python Dashboard with Plotly Dash](https://youtu.be/hSPmj7mK6ng)
- [Dash Callbacks Tutorial](https://youtu.be/mKUdqLdP84w)

### Práctica sugerida
1. **Proyecto básico:** Crea un dashboard con tus datos favoritos (ventas, deportes, clima)
2. **Desafío intermedio:** Implementa filtros múltiples y KPIs dinámicos
3. **Proyecto avanzado:** Deploy en Heroku con actualización en tiempo real

### Comunidad
- [Dash Community Forum](https://community.plotly.com/) - Soporte y ejemplos
- [GitHub - Dash Sample Apps](https://github.com/plotly/dash-sample-apps) - 50+ dashboards ejemplo
- [r/PlotlyDash](https://reddit.com/r/PlotlyDash) - Discusiones y showcase
