In [None]:
import altair as alt
import pandas as pd

# Cargar datos
df = pd.read_excel('/content/database_limpia_intento2.xlsx')

# Convertir a categoría para mejor visualización
df['genero'] = df['genero'].astype('category')
df['roles'] = df['roles'].astype('category')

# Gráfico con jitter uniforme para dispersión
chart = alt.Chart(df).mark_circle(size=70).encode(
    x=alt.X('año:O', title='Año'),
    y=alt.Y('roles:N', title='Rol'),
    color=alt.Color(
        'genero:N',
        title='Género',
        scale=alt.Scale(
            domain=['Femenino', 'Masculino'],
            range=['#531788', '#fed74c']
        )
    ),
    yOffset=alt.YOffset('jitter:Q'),
    tooltip=['personaje', 'roles', 'genero', 'año']
).transform_calculate(
    jitter='random() * 0.4 - 0.2'  # Ruido controlado
).properties(
    title='Comparación de roles por género a lo largo del tiempo',
    width=500,
    height=400
)

chart


In [None]:
import altair as alt
import pandas as pd

# Cargar datos
df = pd.read_excel('')

# Orden manual de roles
role_order = ['Protagonista', 'Antagonista', 'Secundario']

# Gráfico con separaciones por rol
chart = alt.Chart(df).mark_circle(size=70).encode(
    x=alt.X('año:O', title='Año'),
    y=alt.Y('roles:N',
            title='Rol',
            sort=role_order,
            axis=alt.Axis(labelAngle=0),
            scale=alt.Scale(padding=20)  # ← separa visualmente los roles
           ),
    color=alt.Color('genero:N', title='Género'),
    yOffset=alt.YOffset('jitter:Q'),  # dispersión dentro de cada banda
    tooltip=['personaje', 'roles', 'genero', 'año']
).transform_calculate(
    jitter='random()*0.6 - 0.3'  # ruido controlado (más centrado)
).properties(
    title='Comparación de roles por género con separación visual clara',
    width=600,
    height=350
)

# Líneas divisorias entre roles
dividers = alt.Chart(pd.DataFrame({'y': ['Protagonista', 'Antagonista', 'Secundario']})).mark_rule(
    strokeDash=[5, 5],
    opacity=0.3
).encode(
    y='y:N'
)

chart_final = chart + dividers
chart_final

In [None]:
import altair as alt
import pandas as pd

# Cargar datos
df = pd.read_excel('/content/database_limpia_intento2.xlsx')

# Crear columna para desplazamiento según género
df['offset'] = df['genero'].map({'Femenino': -0.2, 'Masculino': 0.2})

# Orden personalizado por lógica narrativa
role_order = ['Protagonista', 'Antagonista', 'Secundario']

# Gráfico con separación de género controlada
chart = alt.Chart(df).mark_circle(size=70).encode(
    x=alt.X('año:O', title='Año'),
    y=alt.Y('roles:N', title='Rol', sort=role_order,
            scale=alt.Scale(padding=20)),
    color=alt.Color('genero:N', title='Género'),
    yOffset=alt.YOffset('offset:Q'),  # ← desplazamiento por género
    tooltip=['personaje', 'roles', 'genero', 'año']
).properties(
    title='Comparación de roles por género (con separación horizontal por género)',
    width=600,
    height=350
)

# Líneas divisoras entre roles
divider_df = pd.DataFrame({'y': role_order})
dividers = alt.Chart(divider_df).mark_rule(
    strokeDash=[5, 5],
    opacity=0.3
).encode(
    y='y:N'
)

# Resultado final
(chart + dividers)

In [None]:
import altair as alt
import pandas as pd
import numpy as np

# Cargar datos
df = pd.read_excel('/content/database_limpia_intento2.xlsx')

# Crear columna de desplazamiento por género
df['offset'] = df['genero'].map({'Femenino': 0.3, 'Masculino': -0.3})

# Agregar jitter adicional para evitar superposición (controlado)
np.random.seed(42)  # Opcional: mantiene consistencia
df['jitter'] = (np.random.rand(len(df)) - 0.5) * 0.4  # rango aprox. -0.2 a +0.2

# Combinar desplazamiento por grupo + jitter aleatorio
df['y_final'] = df['offset'] + df['jitter']

# Orden de roles
role_order = ['Protagonista', 'Antagonista', 'Secundario']

# Crear gráfico
chart = alt.Chart(df).mark_circle(size=70).encode(
    x=alt.X('año:O', title='Año'),
    y=alt.Y('roles:N', title='Rol', sort=role_order,
            scale=alt.Scale(padding=25)),
    color=alt.Color('genero:N', title='Género'),
    yOffset=alt.YOffset('y_final:Q'),  # ← combinación offset + jitter
    tooltip=['personaje', 'roles', 'genero', 'año']
).properties(
    title='Comparación de roles por género\n(con desplazamiento y dispersión controlada)',
    width=600,
    height=350
)

# Líneas divisorias
divider_df = pd.DataFrame({'y': role_order})
dividers = alt.Chart(divider_df).mark_rule(
    strokeDash=[4, 4],
    opacity=0.25
).encode(y='y:N')

# Mostrar
chart + dividers

In [None]:
import altair as alt
import pandas as pd

# Cargar datos
df = pd.read_excel('/content/database_limpia_intento2.xlsx')

# Orden de roles
role_order = ['Protagonista', 'Antagonista', 'Secundario']

chart = alt.Chart(df).mark_circle(size=70).encode(
    x=alt.X('año:O', title='Año'),
    y=alt.Y('roles:N', title='Rol', sort=role_order,
            scale=alt.Scale(padding=30)),  # separación visual por rol
    color=alt.Color('genero:N', title='Género'),
    yOffset='offset_jitter:Q',  # aplicamos combinación aquí
    tooltip=['personaje', 'roles', 'genero', 'año']
).transform_calculate(
    # offset por género + jitter aleatorio interno
    offset_jitter="(datum.genero == 'Femenino' ? 0.25 : -0.25) + ((random() - 0.5) * 0.4)"
).properties(
    title='Comparación de roles por género con dispersión y separación clara',
    width=650,
    height=380
)

# Añadir líneas divisorias entre roles
divider_df = pd.DataFrame({'y': role_order})
dividers = alt.Chart(divider_df).mark_rule(strokeDash=[4, 4], opacity=0.25).encode(y='y:N')

(chart + dividers)

In [None]:
import altair as alt
import pandas as pd
import numpy as np

df = pd.read_excel('/content/database_limpia_intento2.xlsx')

# Orden lógico
role_order = ['Protagonista', 'Antagonista', 'Secundario']

chart = alt.Chart(df).transform_calculate(
    # Calcula el offset por género y añade jitter aleatorio
    yOffset_combined="datum.genero == 'Femenino' ? 0.3 : -0.3" + " + ((random() - 0.5) * 0.4)"
).mark_circle(size=70, opacity=0.7).encode(
    x=alt.X('año:O', title='Año'),
    y=alt.Y('roles:N',
            title='Rol',
            sort=role_order,
            scale=alt.Scale(padding=35)),
    color=alt.Color('genero:N', title='Género'),
    yOffset=alt.YOffset('yOffset_combined:Q'), # Usa el nuevo campo combinado
    tooltip=['personaje', 'roles', 'genero', 'año']
).properties(
    width=650,
    height=380,
    title='Distribución de roles por género (con dispersión controlada)'
)

# Líneas separadoras
divider_df = pd.DataFrame({'y': role_order})
dividers = alt.Chart(divider_df).mark_rule(
    strokeDash=[4, 4],
    opacity=0.25
).encode(y='y:N')

chart + dividers