# Gráfico de líneas

In [6]:
import plotly.express as px
import pandas as pd
import numpy as np

# -----------------------------------------------------------------------------
# MÓDULO 1: GENERACIÓN DE DATOS (Simulación de Múltiples Series)
# -----------------------------------------------------------------------------
# Creamos datos para 5 empresas. Si todas tuvieran colores fuertes, sería un caos.
# Seleccionamos una "Empresa Foco" que queremos analizar.
fechas = pd.date_range(start='2023-01-01', periods=12, freq='M')
np.random.seed(42)

data = {
    'Fecha': np.tile(fechas, 5),
    'Empresa': np.repeat(['Empresa A', 'Empresa B', 'Empresa C', 'Empresa D', 'Empresa E'], 12),
    'Valor': np.random.randint(50, 150, 60)
}

df = pd.DataFrame(data)

# Modificamos artificialmente la "Empresa C" para que tenga una tendencia creciente clara
# Esto simula la "historia" que queremos contar.
mask_c = df['Empresa'] == 'Empresa C'
df.loc[mask_c, 'Valor'] = np.linspace(60, 180, 12) + np.random.normal(0, 5, 12)

# -----------------------------------------------------------------------------
# MÓDULO 2: ESTRATEGIA VISUAL (Definición de Jerarquía)
# -----------------------------------------------------------------------------
# Nussbaumer Knaflic (2015) sugiere usar gris para el contexto y color para la acción.
# Definimos un diccionario de colores antes de graficar.
mapa_colores = {
    'Empresa A': '#d9d9d9',  # Gris muy claro (Contexto)
    'Empresa B': '#d9d9d9',
    'Empresa C': '#1f77b4',  # Azul Corporativo (FOCO DE ATENCIÓN)
    'Empresa D': '#d9d9d9',
    'Empresa E': '#d9d9d9'
}

# -----------------------------------------------------------------------------
# MÓDULO 3: CONSTRUCCIÓN DEL GRÁFICO (Control de Dimensiones)
# -----------------------------------------------------------------------------
fig = px.line(
    df,
    x='Fecha',
    y='Valor',
    color='Empresa',
    color_discrete_map=mapa_colores, # Aplicamos la estrategia de color
    title='Tendencia de Mercado: La Empresa C lidera el crecimiento',

    # <--- CLAVE PARA TU FORMATO: Dimensiones compactas
    width=600,  # Ancho reducido para encajar en documentos
    height=450  # Altura proporcional
)

# -----------------------------------------------------------------------------
# MÓDULO 4: REFINAMIENTO DE TRAZAS (Grosor Estratégico)
# -----------------------------------------------------------------------------
# El color no es suficiente; el grosor también guía el ojo (Few, 2012).
# Usamos .for_each_trace para iterar sobre cada línea y ajustar su grosor.
fig.for_each_trace(
    lambda trace: trace.update(line=dict(width=4)) if trace.name == 'Empresa C' else trace.update(line=dict(width=1))
)

# -----------------------------------------------------------------------------
# MÓDULO 5: LIMPIEZA DEL LAYOUT (Minimalismo)
# -----------------------------------------------------------------------------
fig.update_layout(
    template='simple_white', # Fondo blanco sin ruido visual
    showlegend=True,         # Mantenemos leyenda, pero...
    legend_title_text='',    # ...quitamos el título obvio de la leyenda
    xaxis_title='',          # La fecha suele ser obvia, ahorramos espacio
    yaxis_title='Valor de Acción ($)'
)

fig.show()


'M' is deprecated and will be removed in a future version, please use 'ME' instead.


Setting an item of incompatible dtype is deprecated and will raise an error in a future version of pandas. Value '[ 63.89596317  65.40360213  87.46932279  94.5928673  101.70399888
 108.75160334 128.28510959 132.84136911 140.38303075 156.41623492
 166.7835805  180.33328639]' has dtype incompatible with int64, please explicitly cast to a compatible dtype first.



# Gráfico de barras

In [9]:
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import pandas as pd

# -----------------------------------------------------------------------------
# MÓDULO 1: GENERACIÓN DE DATOS (El escenario del "engaño")
# -----------------------------------------------------------------------------
# Para demostrar cómo el truncamiento exagera las diferencias, necesitamos
# datos con variaciones pequeñas. Si la diferencia fuera enorme, el eje no importaría tanto.
categorias = ['Producto A', 'Producto B', 'Producto C']
# Las diferencias reales son menores al 5%, pero con un eje cortado parecerán del 50%.
valores = [980, 1005, 1020]

# -----------------------------------------------------------------------------
# MÓDULO 2: CONSTRUCCIÓN DEL LIENZO COMPARATIVO
# -----------------------------------------------------------------------------
# Usamos make_subplots para crear "Facetas" manuales.
# Esto nos permite tener dos configuraciones de eje Y independientes en la misma figura.
fig = make_subplots(
    rows=1, cols=2,
    subplot_titles=(
        "<b> Eje Truncado (Distorsión)</b><br><i>Exagera visualmente la diferencia</i>",
        "<b> Eje en Cero (Integridad)</b><br><i>Muestra la proporción real</i>"
    ),
    horizontal_spacing=0.15
)

# -----------------------------------------------------------------------------
# MÓDULO 3: AGREGADO DE TRAZAS (El contenido)
# -----------------------------------------------------------------------------
# Gráfico Izquierdo: Usamos un color de "Alerta" (Rojo) para denotar la mala práctica.
fig.add_trace(
    go.Bar(x=categorias, y=valores, marker_color='#d62728', name='Visualización Sesgada'),
    row=1, col=1
)

# Gráfico Derecho: Usamos un color "Neutro/Correcto" (Azul) para la buena práctica.
fig.add_trace(
    go.Bar(x=categorias, y=valores, marker_color='#1f77b4', name='Visualización Ética'),
    row=1, col=2
)

# -----------------------------------------------------------------------------
# MÓDULO 4: APLICACIÓN DEL PRINCIPIO TEÓRICO (El Ajuste Crítico)
# -----------------------------------------------------------------------------
# Aquí es donde aplicamos la regla de "No truncar el eje".

# IZQUIERDA (MALA PRÁCTICA): Forzamos el inicio del eje en 950.
# Esto hace que la barra de 980 parezca pequeña y la de 1020 parezca gigante.
fig.update_yaxes(
    range=[970, 1030],
    title_text="Magnitud Percibida (Zoom)",
    row=1, col=1
)

# DERECHA (BUENA PRÁCTICA): Forzamos el inicio en 0 absoluto.
# Esto permite al cerebro comparar las longitudes reales de las barras.
fig.update_yaxes(
    range=[0, 1100],  # <--- REGLA DE ORO: SIEMPRE INCLUIR EL CERO
    title_text="Magnitud Real",
    row=1, col=2
)

# -----------------------------------------------------------------------------
# MÓDULO 5: DISEÑO Y LIMPIEZA (Layout)
# -----------------------------------------------------------------------------
fig.update_layout(
    title_text="Integridad Visual en Gráficos de Barras (Few, 2012)",
    showlegend=False, # La leyenda es redundante aquí
    template='simple_white', # Fondo limpio para impresión
    height=500
)

fig.show()

# Gráfico de dispersión

In [7]:
import plotly.express as px
import pandas as pd
import numpy as np

# -----------------------------------------------------------------------------
# MÓDULO 1: GENERACIÓN DE DATOS (Simulación de Satruación)
# -----------------------------------------------------------------------------
# Para demostrar el problema de "overplotting", necesitamos muchos puntos.
# Creamos 2000 puntos con una distribución normal para generar un centro denso.
np.random.seed(42) # Para reproducibilidad
n_puntos = 2000
x = np.random.normal(0, 1, n_puntos)
# Variable Y correlacionada con X, más ruido aleatorio para dispersión
y = (x * 1.5) + np.random.normal(0, 1, n_puntos)

df = pd.DataFrame({'Variable A': x, 'Variable B': y})

# -----------------------------------------------------------------------------
# MÓDULO 2: CONSTRUCCIÓN BASE (La Figura y las Trazas)
# -----------------------------------------------------------------------------
# Creamos el objeto figura.
# Nota: Usamos 'render_mode="webgl"' que es más eficiente para muchos puntos.
fig = px.scatter(
    df,
    x='Variable A',
    y='Variable B',
    title='Análisis de Correlación: Gestión de Densidad (Munzner, 2014)',
    labels={'Variable A': 'Variable Independiente (X)', 'Variable B': 'Variable Dependiente (Y)'},
    render_mode='webgl'
)

# -----------------------------------------------------------------------------
# MÓDULO 3: REFINAMIENTO VISUAL (Aplicación de la Teoría)
# -----------------------------------------------------------------------------
# Aquí aplicamos las reglas para mitigar la saturación visual descritas en el texto.
fig.update_traces(
    marker=dict(
        size=10,              # Tamaño legible
        opacity=0.3,          # <--- CLAVE 1: Reducir opacidad permite ver dónde se acumulan los datos
        line=dict(            # <--- CLAVE 2: Contornos (Outlines)
            width=1,          # Un borde fino ayuda a distinguir puntos individuales...
            color='DarkSlateGrey' # ...incluso cuando la opacidad es baja.
        )
    ),
    selector=dict(mode='markers')
)

# -----------------------------------------------------------------------------
# MÓDULO 4: LIMPIEZA DEL LAYOUT (Contexto)
# -----------------------------------------------------------------------------
# Eliminamos distracciones para centrar la atención en la densidad de los datos.
fig.update_layout(
    template='simple_white', # Fondo limpio sin rejillas que compitan (Tufte)
    height=600,
    width=800
)

fig.show()

# Histograma

In [8]:
import plotly.express as px
import pandas as pd
import numpy as np

# -----------------------------------------------------------------------------
# MÓDULO 1: GENERACIÓN DE DATOS ESTRATÉGICA (El "Por qué" del gráfico)
# -----------------------------------------------------------------------------
# Para demostrar la teoría, creamos dos distribuciones con estadísticas similares
# (media y mediana cercanas a 0) pero formas muy diferentes.

# Caso A: Distribución Normal (Unimodal) - La mayoría de datos en el centro.
grupo_a = np.random.normal(loc=0, scale=1, size=100)

# Caso B: Distribución Bimodal (Dos picos) - Datos en los extremos, vacío en el centro.
# Un boxplot simple escondería esta separación, pareciendo igual al Grupo A.
grupo_b = np.concatenate([
    np.random.normal(loc=-2, scale=0.5, size=50),
    np.random.normal(loc=2, scale=0.5, size=50)
])

# Unimos en un DataFrame
df = pd.DataFrame({
    'Valor': np.concatenate([grupo_a, grupo_b]),
    'Categoría': ['Normal (Unimodal)'] * 100 + ['Bimodal (Estructura Oculta)'] * 100
})

# -----------------------------------------------------------------------------
# MÓDULO 2: CONSTRUCCIÓN HÍBRIDA (Resumen + Detalle)
# -----------------------------------------------------------------------------
# Usamos px.box, pero activamos la visualización de los puntos crudos.
# Esto cumple la recomendación de no ocultar la estructura subyacente.
fig = px.box(
    df,
    x="Categoría",
    y="Valor",
    color="Categoría",

    # <--- CLAVE TEÓRICA: Superposición de datos crudos
    points="all",  # Muestra TODOS los puntos, no solo los outliers.

    title="Análisis de Distribución: Revelando Estructuras Ocultas",
    width=800,
    height=600
)

# -----------------------------------------------------------------------------
# MÓDULO 3: AJUSTE DE VISIBILIDAD (Jitter y Transparencia)
# -----------------------------------------------------------------------------
# Para evitar el solapamiento (overplotting) mencionado en la sección anterior,
# ajustamos cómo se dispersan los puntos sobre la caja.
fig.update_traces(
    jitter=0.5,          # Esparce los puntos horizontalmente para ver la densidad
    pointpos=-1.8,       # Mueve los puntos a la izquierda de la caja (no encima) para limpieza
    marker=dict(
        size=5,          # Puntos discretos
        opacity=0.6      # Semitransparencia para detectar aglomeraciones
    ),
    boxmean=True         # Añade la línea de la media para mayor contexto estadístico
)

# -----------------------------------------------------------------------------
# MÓDULO 4: DISEÑO ACADÉMICO (Layout)
# -----------------------------------------------------------------------------
fig.update_layout(
    template='simple_white', # Fondo blanco limpio
    showlegend=False,        # La categoría ya está en el eje X
    yaxis_title="Magnitud Cuantitativa",
    xaxis_title="Categoría de Análisis"
)

fig.show()

# Gráfico de Burbujas

In [8]:
import plotly.express as px
import pandas as pd
import numpy as np

# -----------------------------------------------------------------------------
# MÓDULO 1: GENERACIÓN DE DATOS (Tres Variables)
# -----------------------------------------------------------------------------
# Simulamos un análisis de cartera de proyectos.
# X e Y son posicionales (comparación precisa).
# Z es el presupuesto (comparación relativa/peso).
data = {
    'Proyecto': [f'P-{i}' for i in range(1, 11)],
    'Retorno (ROI) %': [15, 28, 12, 45, 30, 8, 22, 18, 35, 40],   # Eje X (Preciso)
    'Riesgo Asociado': [2, 4, 1, 5, 3, 1, 3, 2, 4, 5],            # Eje Y (Preciso)
    'Presupuesto ($M)': [10, 80, 5, 95, 40, 12, 38, 20, 85, 90]   # Tamaño (Relativo)
}
df = pd.DataFrame(data)

# Nota Teórica para tus alumnos:
# Observa los Proyectos con presupuesto 80, 85 y 90.
# Visualmente, sus burbujas parecerán casi idénticas, demostrando
# que el ojo no puede juzgar esas diferencias de área con precisión.

# -----------------------------------------------------------------------------
# MÓDULO 2: CONSTRUCCIÓN DEL GRÁFICO (Mapeo de la 3ra Variable)
# -----------------------------------------------------------------------------
fig = px.scatter(
    df,
    x='Retorno (ROI) %',
    y='Riesgo Asociado',
    size='Presupuesto ($M)', # <--- AQUÍ CODIFICAMOS EL PESO RELATIVO
    color='Proyecto',        # Opcional: Color para distinguir identidades
    title='Cartera de Proyectos: ROI vs Riesgo (Tamaño = Presupuesto)',

    # <--- CLAVE PARA TU FORMATO: Dimensiones compactas
    width=600,
    height=500
)

# -----------------------------------------------------------------------------
# MÓDULO 3: CALIBRACIÓN PERCEPTIVA (Ajuste de Área)
# -----------------------------------------------------------------------------
# Según Few (2012), si las burbujas son muy pequeñas o muy grandes,
# la comparación se vuelve imposible. Ajustamos el rango visual.
fig.update_traces(
    marker=dict(
        sizemode='area', # Asegura que el dato escale el ÁREA, no el diámetro (error común)
        sizeref=2.*max(df['Presupuesto ($M)'])/(40.**2), # Fórmula técnica de Plotly para escalar
        sizemin=4 # Tamaño mínimo para que nada desaparezca
    )
)
# Alternativa simple para enseñanza básica: usar simplemente `size_max=60` en px.scatter

# -----------------------------------------------------------------------------
# MÓDULO 4: REFUERZO DE PRECISIÓN (Hover)
# -----------------------------------------------------------------------------
# Como el tamaño es impreciso, el HOVER es obligatorio para dar el dato exacto.
fig.update_layout(
    template='simple_white',
    hovermode='closest', # Facilita seleccionar la burbuja específica
    showlegend=False     # En burbujas, a veces la leyenda estorba si hay muchas
)

fig.show()

# Gráfico con codificación por forma y color

In [10]:
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import pandas as pd
import numpy as np
import plotly.express as px

# -----------------------------------------------------------------------------
# MÓDULO 1: GENERACIÓN DE DATOS CON ESTRUCTURA (CLUSTERS)
# -----------------------------------------------------------------------------
# En lugar de ruido, creamos 5 grupos definidos espacialmente.
np.random.seed(42)
n_per_cluster = 30

# Definimos 5 centros para los grupos
centros = [(2, 10), (8, 10), (5, 5), (2, 0), (8, 0)]
labels_reales = ['Norte', 'Sur', 'Centro', 'Este', 'Oeste']

x_list = []
y_list = []
grupo_list = []
id_list = []

# Generamos puntos alrededor de cada centro
for i, (cx, cy) in enumerate(centros):
    x = np.random.normal(cx, 0.8, n_per_cluster)
    y = np.random.normal(cy, 0.8, n_per_cluster)
    x_list.extend(x)
    y_list.extend(y)
    grupo_list.extend([labels_reales[i]] * n_per_cluster)
    # Generamos IDs únicos para simular el error de "colorear todo"
    id_list.extend([f'ID_{k}' for k in range(len(id_list), len(id_list)+n_per_cluster)])

# Agregamos "Ruido" (Puntos dispersos que serán "Otros")
n_ruido = 20
x_list.extend(np.random.uniform(0, 10, n_ruido))
y_list.extend(np.random.uniform(0, 10, n_ruido))
grupo_list.extend(['Otros (Ruido)'] * n_ruido)
id_list.extend([f'R_{k}' for k in range(n_ruido)])

df = pd.DataFrame({'X': x_list, 'Y': y_list, 'Grupo': grupo_list, 'ID_Unico': id_list})

# -----------------------------------------------------------------------------
# MÓDULO 2: CONFIGURACIÓN COMPARATIVA
# -----------------------------------------------------------------------------
fig = make_subplots(
    rows=1, cols=2,
    subplot_titles=(
        "<b> Error Común </b><br><i>(El color no agrupa, solo decora)</i>",
        "<b> Correcto </b><br><i>(El color define regiones)</i>"
    ),
    horizontal_spacing=0.15
)

# -----------------------------------------------------------------------------
# MÓDULO 3: EL GRÁFICO "EMBUTIDO" (Mala Práctica)
# -----------------------------------------------------------------------------
# Aquí asignamos un color diferente a CADA pequeño subgrupo o ID.
# Usamos una paleta cíclica para que se repitan colores y sea confuso.
# Esto viola la regla de "máximo 6-8 colores".
fig.add_trace(
    go.Scatter(
        x=df['X'], y=df['Y'],
        mode='markers',
        # Coloreamos por ID (habrá más de 100 colores o colores repetidos sin sentido)
        marker=dict(
            color=np.random.randint(0, 20, len(df)), # Simula 20 categorías al azar
            colorscale='Turbo', # Escala muy colorida y ruidosa
            size=10,
            opacity=0.8
        ),
        showlegend=False # Ocultamos leyenda porque sería gigante
    ),
    row=1, col=1
)

# -----------------------------------------------------------------------------
# MÓDULO 4: EL GRÁFICO "LIMPIO" (Buena Práctica)
# -----------------------------------------------------------------------------
# Estrategia:
# 1. Mapear colores solo a los 5 grupos principales.
# 2. Usar GRIS para el ruido ("Otros").
# 3. Usar FORMA diferente para el ruido.

colors_map = {
    'Norte': '#636EFA', 'Sur': '#EF553B', 'Centro': '#00CC96',
    'Este': '#AB63FA', 'Oeste': '#FFA15A',
    'Otros (Ruido)': '#d3d3d3' # Gris claro
}

symbol_map = {
    'Norte': 'circle', 'Sur': 'circle', 'Centro': 'circle',
    'Este': 'circle', 'Oeste': 'circle',
    'Otros (Ruido)': 'x' # Forma redundante para diferenciar
}

# Iteramos para agregar trazas limpias a la leyenda
for grupo in ['Norte', 'Sur', 'Centro', 'Este', 'Oeste', 'Otros (Ruido)']:
    df_g = df[df['Grupo'] == grupo]

    # Tamaño: Hacemos el ruido un poco más pequeño para quitarle peso visual
    size_val = 6 if 'Otros' in grupo else 12

    fig.add_trace(
        go.Scatter(
            x=df_g['X'], y=df_g['Y'],
            mode='markers',
            name=grupo,
            marker=dict(
                color=colors_map[grupo],
                symbol=symbol_map[grupo], # <--- PRINCIPIO DE MUNZNER (Forma)
                size=size_val,
                line=dict(width=1, color='White') # Borde para definición
            )
        ),
        row=1, col=2
    )

# -----------------------------------------------------------------------------
# MÓDULO 5: AJUSTES FINALES
# -----------------------------------------------------------------------------
fig.update_layout(
    title_text="Impacto de la Gestión del Color en la Carga Cognitiva",
    template='simple_white',
    height=500,
    width=900
)

# Quitamos ejes para enfocar en el patrón
fig.update_xaxes(showticklabels=False, showgrid=False)
fig.update_yaxes(showticklabels=False, showgrid=False)

fig.show()

# Mapas

In [5]:
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import pandas as pd

# -----------------------------------------------------------------------------
# MÓDULO 1: DATOS CLAROS (El Ejemplo Clásico de Cairo)
# -----------------------------------------------------------------------------
# Usamos países extremos para que el efecto sea evidente.
data = {
    'País': ['Russia', 'Canada', 'Bangladesh', 'Nigeria', 'Japan'],
    'Código': ['RUS', 'CAN', 'BGD', 'NGA', 'JPN'],
    # Población (aprox) - El dato que importa
    'Población': [144, 38, 170, 210, 125],
    # Área visual (lo que el ojo ve en el mapa)
    'Tipo': ['Gigante Visual', 'Gigante Visual', 'Invisible', 'Medio', 'Pequeño']
}
df = pd.DataFrame(data)

# -----------------------------------------------------------------------------
# MÓDULO 2: LIENZO LIMPIO (Subplots)
# -----------------------------------------------------------------------------
fig = make_subplots(
    rows=1, cols=2,
    specs=[[{'type': 'geo'}, {'type': 'geo'}]], # Especificamos que son mapas
    subplot_titles=(
        "<b> Mapa de Coropletas</b><br><i>Rusia domina visualmente (Sesgo)</i>",
        "<b> Mapa de Burbujas</b><br><i>Nigeria y Bangladesh destacan (Realidad)</i>"
    ),
    horizontal_spacing=0.05
)

# -----------------------------------------------------------------------------
# MÓDULO 3: EL PROBLEMA (Coropleta)
# -----------------------------------------------------------------------------
# El color representa la población, pero el ojo es atraído por el ÁREA de Rusia.
fig.add_trace(
    go.Choropleth(
        locations=df['Código'],
        z=df['Población'],
        colorscale='Reds',
        marker_line_color='white',
        showscale=False, # Quitamos la barra de color para limpiar
        name='Coropleta'
    ),
    row=1, col=1
)

# -----------------------------------------------------------------------------
# MÓDULO 4: LA SOLUCIÓN (Burbujas / ScatterGeo)
# -----------------------------------------------------------------------------
# Aquí el ÁREA del círculo representa el dato. Rusia se vuelve pequeña.
fig.add_trace(
    go.Scattergeo(
        locations=df['Código'],
        text=df['País'],
        marker=dict(
            size=df['Población'],
            color=df['Población'],
            colorscale='Reds',
            sizemode='area',  # Importante: Escalar por área, no diámetro
            sizeref=2.*max(df['Población'])/(50.**2), # Calibración de tamaño (más grandes)
            line_color='black',
            line_width=1,
            opacity=0.9
        ),
        name='Burbujas'
    ),
    row=1, col=2
)

# -----------------------------------------------------------------------------
# MÓDULO 5: ESTÉTICA PROFESIONAL (El arreglo visual)
# -----------------------------------------------------------------------------
# Definimos un estilo de mapa "limpio" (sin lagos, sin líneas costeras complejas)
geo_style = dict(
    showframe=False,        # Quita el marco cuadrado feo
    showcoastlines=True,    # Muestra bordes simples
    coastlinecolor="#ddd",  # Bordes sutiles
    showland=True,          # Muestra la tierra de fondo
    landcolor="#f5f5f5",    # Color gris muy claro para el fondo
    projection_type='natural earth', # Proyección estándar y legible
    showlakes=False,        # Quita ruido visual
    showcountries=True,     # Muestra fronteras
    countrycolor="#fff"     # Fronteras blancas
)

fig.update_layout(
    title_text="Sesgo del Área Geográfica (Munzner, 2014)",
    geo=geo_style,   # Aplicar estilo al mapa 1
    geo2=geo_style,  # Aplicar estilo al mapa 2
    template='none', # Quitamos plantillas por defecto que causan márgenes raros
    margin=dict(l=10, r=10, t=80, b=10), # <--- ESTO ARREGLA EL ESPACIO
    height=500
)

fig.show()

# Animaciones

In [12]:
import plotly.express as px
import pandas as pd
import numpy as np

# -----------------------------------------------------------------------------
# MÓDULO 1: GENERACIÓN DE DATOS (Una historia de evolución)
# -----------------------------------------------------------------------------
# Creamos datos para 3 países ficticios a lo largo de 5 años.
# La "historia" es:
# - País A (Azul): Crece constantemente.
# - País B (Rojo): Crece y luego tiene una crisis (cae) en el año 4.
# - País C (Verde): Se mantiene estancado.

years = [2010, 2011, 2012, 2013, 2014]
data = []

# Datos simulados con trayectorias específicas
trayectorias = {
    'País A (Crecimiento)': [(10, 60), (12, 65), (15, 70), (18, 75), (22, 80)],
    'País B (Crisis)':      [(10, 50), (15, 55), (20, 60), (10, 40), (12, 45)], # Cae en el 4to punto
    'País C (Estancado)':   [(30, 30), (31, 31), (30, 30), (32, 32), (31, 31)]
}

for pais, puntos in trayectorias.items():
    for i, (pib, vida) in enumerate(puntos):
        data.append({
            'Año': years[i],
            'País': pais,
            'PIB per Cápita': pib * 1000,
            'Esperanza de Vida': vida,
            'Población': np.random.randint(20, 50) # Tamaño burbuja
        })

df = pd.DataFrame(data)

# -----------------------------------------------------------------------------
# MÓDULO 2: ENFOQUE NARRATIVO (Animación - Hans Rosling)
# -----------------------------------------------------------------------------
# Ideal para presentaciones. Captura la atención mediante el movimiento.
# ALTA CARGA COGNITIVA: El usuario debe memorizar la posición anterior.

fig_anim = px.scatter(
    df,
    x="PIB per Cápita",
    y="Esperanza de Vida",
    color="País",
    size="Población",

    # <--- EL MOTOR DE LA ANIMACIÓN
    animation_frame="Año",      # Crea el slider temporal
    animation_group="País",     # Asegura la continuidad del objeto (smooth transition)

    title="ENFOQUE 1: Narrativa (Animación) - ¿Recuerdas dónde estaba el punto azul hace un segundo?",
    range_x=[5000, 35000],      # <--- CRÍTICO: Fijar ejes para que no "bailen" con los datos
    range_y=[20, 90],
    template='simple_white',
    height=500
)

# Ajuste de velocidad para que sea agradable
fig_anim.layout.updatemenus[0].buttons[0].args[1]["frame"]["duration"] = 1000

# -----------------------------------------------------------------------------
# MÓDULO 3: ENFOQUE ANALÍTICO (Facetas / Small Multiples)
# -----------------------------------------------------------------------------
# Ideal para reportes. Permite comparar todos los estados simultáneamente.
# BAJA CARGA COGNITIVA: El ojo salta de un cuadro a otro sin usar memoria de trabajo.

fig_facet = px.scatter(
    df,
    x="PIB per Cápita",
    y="Esperanza de Vida",
    color="País",
    size="Población",

    # <--- LA ALTERNATIVA ANALÍTICA
    facet_col="Año",            # Desglosa el tiempo en el espacio, no en el slider

    title="ENFOQUE 2: Analítico (Facetas) - Comparación directa sin fatiga de memoria (Munzner, 2014)",
    range_x=[5000, 35000],
    range_y=[20, 90],
    template='simple_white',
    height=400
)

# Limpiamos un poco las etiquetas de los ejes para que no se repitan
fig_facet.for_each_annotation(lambda a: a.update(text=a.text.split("=")[-1]))

# -----------------------------------------------------------------------------
# MÓDULO 4: DESPLIEGUE
# -----------------------------------------------------------------------------
fig_anim.show()
fig_facet.show()
fig.write_html("fig_anim.html", auto_play=True)

In [22]:
!pip install -U kaleido==0.2.1

Collecting kaleido==0.2.1
  Downloading kaleido-0.2.1-py2.py3-none-manylinux1_x86_64.whl.metadata (15 kB)
Downloading kaleido-0.2.1-py2.py3-none-manylinux1_x86_64.whl (79.9 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m79.9/79.9 MB[0m [31m12.3 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: kaleido
  Attempting uninstall: kaleido
    Found existing installation: kaleido 1.2.0
    Uninstalling kaleido-1.2.0:
      Successfully uninstalled kaleido-1.2.0
Successfully installed kaleido-0.2.1


In [1]:
import plotly.express as px
import plotly.io as pio
import imageio.v3 as iio
import pandas as pd
import numpy as np
from google.colab import files

# --- 1. VOLVER A GENERAR LOS DATOS Y LA FIGURA (Porque al reiniciar se borraron) ---
years = [2010, 2011, 2012, 2013, 2014]
data = []
trayectorias = {
    'País A (Crecimiento)': [(10, 60), (12, 65), (15, 70), (18, 75), (22, 80)],
    'País B (Crisis)':      [(10, 50), (15, 55), (20, 60), (10, 40), (12, 45)],
    'País C (Estancado)':   [(30, 30), (31, 31), (30, 30), (32, 32), (31, 31)]
}
for pais, puntos in trayectorias.items():
    for i, (pib, vida) in enumerate(puntos):
        data.append({
            'Año': years[i], 'País': pais,
            'PIB per Cápita': pib * 1000, 'Esperanza de Vida': vida,
            'Población': np.random.randint(20, 50)
        })
df = pd.DataFrame(data)

fig_anim = px.scatter(
    df, x="PIB per Cápita", y="Esperanza de Vida", color="País", size="Población",
    animation_frame="Año", animation_group="País",
    range_x=[5000, 35000], range_y=[20, 90],
    title="Animación Exportada", template='simple_white', height=500
)

# --- 2. GENERAR EL GIF (Ahora sí funcionará Kaleido) ---
nombre_archivo = "fig_anim.gif"
print(f"Generando {nombre_archivo}... (Esto puede tardar unos segundos)")

frames_imagen = []

# Captura inicial
img_bytes = fig_anim.to_image(format="png", engine="kaleido", scale=1.5)
frames_imagen.append(iio.imread(img_bytes))

# Captura frame por frame
for frame in fig_anim.frames:
    fig_anim.update(data=frame.data)
    img_bytes = fig_anim.to_image(format="png", engine="kaleido", scale=1.5)
    frames_imagen.append(iio.imread(img_bytes))

# Guardar y Descargar
iio.imwrite(nombre_archivo, frames_imagen, duration=500, loop=0)
print("¡GIF creado!")
files.download(nombre_archivo)

Generando fig_anim.gif... (Esto puede tardar unos segundos)
¡GIF creado!


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>