In [None]:
import pandas as pd
import altair as alt

# Cargar datos
df = pd.read_excel('/content/database_limpia_intento2.xlsx')

# Asegurar que las columnas que usas son categóricas o numéricas según corresponde
df['genero'] = df['genero'].astype('category')
df['roles'] = df['roles'].astype('category')
df['año'] = df['año'].astype(int)

# Agrupar para obtener los conteos
df_count = df.groupby(['año', 'genero', 'roles']).size().reset_index(name='cantidad')

# Gráfico
chart = alt.Chart(df_count).mark_bar().encode(
    x=alt.X('año:O', title='Año'),
    y=alt.Y('cantidad:Q', title='Cantidad'),
    color=alt.Color('genero:N', title='Género'),
    column=alt.Column('roles:N', title='Rol')   # Facet horizontal por roles
).properties(
    width=120,
    height=300,
    title='Distribución de Género por Año y Rol'
)

chart

  df_count = df.groupby(['año', 'genero', 'roles']).size().reset_index(name='cantidad')


In [None]:
import pandas as pd
import altair as alt

# Cargar datos
df = pd.read_excel('/content/database_limpia_intento2.xlsx')

# Asegurar tipos
df['genero'] = df['genero'].astype('category')
df['roles'] = df['roles'].astype('category')
df['año'] = df['año'].astype(int)

# Conteo por año, género y rol
df_count = df.groupby(['año', 'genero', 'roles']).size().reset_index(name='cantidad')

# Gráfico con facets verticales (row)
chart = alt.Chart(df_count).mark_bar().encode(
    x=alt.X('año:O', title='Año'),
    y=alt.Y('cantidad:Q', title='Cantidad'),
    color=alt.Color('genero:N', title='Género'),
    row=alt.Row('roles:N', title='Rol')   # facet vertical
).properties(
    width=600,
    height=120,
    title='Distribución de Género por Año y Rol'
).resolve_scale(
    x='shared'   # compartir eje X entre todos los facets
)

chart

  df_count = df.groupby(['año', 'genero', 'roles']).size().reset_index(name='cantidad')


In [None]:
import pandas as pd
import altair as alt

# Cargar datos
df = pd.read_excel('database_limpia_intento2.xlsx')

# Asegurar tipos correctos
df['genero'] = df['genero'].astype('category')
df['roles'] = df['roles'].astype('category')
df['año'] = df['año'].astype(int)

# Agrupar por año, género y rol (conteo)
df_count = df.groupby(['año', 'genero', 'roles']).size().reset_index(name='cantidad')

# Crear columna de valores negativos para mujeres
df_count['cantidad_signed'] = df_count.apply(
    lambda row: -row['cantidad'] if row['genero'] == 'Femenino' else row['cantidad'],
    axis=1
)

# Gráfico pirámide poblacional
chart = alt.Chart(df_count).mark_bar().encode(
    y=alt.Y('año:O', title='Año'),
    x=alt.X('cantidad_signed:Q',
            title='Cantidad',
            axis=alt.Axis(format='d')),
    color=alt.Color('roles:N', title='Rol'),
    tooltip=['año', 'genero', 'roles', 'cantidad']
).properties(
    width=350,
    height=450,
    title='Piramide de Personajes por Año, Género y Rol'
)

chart

  df_count = df.groupby(['año', 'genero', 'roles']).size().reset_index(name='cantidad')


In [None]:
import pandas as pd
import altair as alt

# Cargar datos
df = pd.read_excel('/content/database_limpia_intento2.xlsx')

# Asegurar tipos correctos
df['genero'] = df['genero'].astype('category')
df['roles'] = df['roles'].astype('category')
df['año'] = df['año'].astype(int)

# Agrupar por año, género y rol
df_count = df.groupby(['año', 'genero', 'roles']).size().reset_index(name='cantidad')

# Crear columna con valores negativos para mujeres
df_count['cantidad_signed'] = df_count.apply(
    lambda row: -row['cantidad'] if row['genero'] == 'Femenino' else row['cantidad'],
    axis=1
)

# --------------------------
#   GRÁFICO IZQUIERDO (Mujeres)
# --------------------------
left = alt.Chart(df_count[df_count['genero'] == 'Femenino']).mark_bar().encode(
    y=alt.Y('año:O', title='Año', axis=alt.Axis(title='Año')),
    x=alt.X('cantidad_signed:Q',
            title='Mujeres',
            scale=alt.Scale(domain=[df_count['cantidad_signed'].min(), 0])),
    color=alt.Color('roles:N', title='Rol'),
    tooltip=['año','genero','roles','cantidad']
).properties(
    width=250,
    height=450
)

# --------------------------
#   GRÁFICO DERECHO (Hombres)
# --------------------------
right = alt.Chart(df_count[df_count['genero'] == 'Masculino']).mark_bar().encode(
    y=alt.Y('año:O', title='', axis=alt.Axis(labels=False, ticks=False)),
    x=alt.X('cantidad:Q',
            title='Hombres',
            scale=alt.Scale(domain=[0, df_count['cantidad'].max()])),
    color=alt.Color('roles:N', title='Rol'),
    tooltip=['año','genero','roles','cantidad']
).properties(
    width=250,
    height=450
)

# --------------------------
#   UNIENDO AMBOS GRÁFICOS
# --------------------------
piramide = left | right

piramide.properties(title='Piramide de Personajes por Año, Género y Rol')

  df_count = df.groupby(['año', 'genero', 'roles']).size().reset_index(name='cantidad')


In [None]:
import pandas as pd
import altair as alt

# Cargar datos
df = pd.read_excel('/content/database_limpia_intento2.xlsx')

# Tipos
df['genero'] = df['genero'].astype('category')
df['roles'] = df['roles'].astype('category')
df['año'] = df['año'].astype(int)

# Agrupar
df_count = df.groupby(['año', 'genero', 'roles'], observed=False).size().reset_index(name='cantidad')

# Firmar negativo para mujeres
df_count['cantidad_signed'] = df_count.apply(
    lambda r: -r['cantidad'] if r['genero'] == 'Femenino' else r['cantidad'],
    axis=1
)

# --------------------------
# BLOQUE FEMENINO (negativo)
# --------------------------
female = alt.Chart(df_count[df_count['genero'] == 'Femenino']).mark_bar().encode(
    y=alt.Y('año:O', title='Año', axis=alt.Axis(title='Año')),
    x=alt.X('cantidad_signed:Q',
            title='',
            scale=alt.Scale(domain=[df_count['cantidad_signed'].min(), 0])),
    color=alt.Color('roles:N', title='Rol')
).properties(
    width=280 / 2, # Apply width to individual charts
    height=450
)

# --------------------------
# BLOQUE MASCULINO (positivo)
# --------------------------
male = alt.Chart(df_count[df_count['genero'] == 'Masculino']).mark_bar().encode(
    y=alt.Y('año:O', title='', axis=None),   # ❗ SIN eje aquí
    x=alt.X('cantidad:Q',
            title='',
            scale=alt.Scale(domain=[0, df_count['cantidad'].max()])),
    color=alt.Color('roles:N', title='Rol')
).properties(
    width=280 / 2, # Apply width to individual charts
    height=450
)

# --------------------------
# COMBINACIÓN CON EJE CENTRAL
# --------------------------
piramide = female | male

piramide.properties(
    title='Piramide poblacional por género y rol'
)

In [None]:
import altair as alt
import pandas as pd

# Cargar datos
df = pd.read_excel('/content/database_limpia_intento2.xlsx')

df['año'] = df['año'].astype(int)
df['roles'] = df['roles'].astype(str)
df['genero'] = df['genero'].astype(str)

# Conteos
df_count = df.groupby(['año','genero','roles']).size().reset_index(name='cantidad')

# Firmar negativos para mujeres
df_count['cantidad_signed'] = df_count.apply(
    lambda r: -r['cantidad'] if r['genero'] == 'Femenino' else r['cantidad'],
    axis=1
)

# --------------------------
# BLOQUE IZQUIERDO (Femenino)
# --------------------------
female = alt.Chart(df_count[df_count['genero']=='Femenino']).mark_bar().encode(
    x=alt.X('cantidad_signed:Q',
            title='Femenino',
            scale=alt.Scale(domain=[df_count['cantidad_signed'].min(), 0])),
    y=alt.Y('año:O', sort='ascending', title='', axis=None),
    color=alt.Color('roles:N', title='Rol')
).properties(width=200, height=500)

# ----------------------------------
# BLOQUE CENTRAL (EJE Y ÚNICO)
# ----------------------------------
middle = alt.Chart(df_count).transform_aggregate(
    count='count(*)',
    groupby=['año']
).mark_text(
    align='center',
    baseline='middle'
).encode(
    y=alt.Y('año:O', sort='ascending', title='')
).properties(
    width=40,  # ◈ ancho estrecho para que sea un eje central
    height=500
)

# ---------------------------
# BLOQUE DERECHO (Masculino)
# ---------------------------
male = alt.Chart(df_count[df_count['genero']=='Masculino']).mark_bar().encode(
    x=alt.X('cantidad:Q',
            title='Masculino',
            scale=alt.Scale(domain=[0, df_count['cantidad'].max()])),
    y=alt.Y('año:O', sort='ascending', title='', axis=None),
    color=alt.Color('roles:N', title='Rol')
).properties(width=200, height=500)

# ---------------------------
# UNIÓN FINAL
# ---------------------------
piramide_final = female | middle | male

piramide_final.properties(
    title='Pirámide poblacional con EJE CENTRAL'
)

In [4]:
import altair as alt
import pandas as pd

# Cargar datos
df = pd.read_excel('/content/database_limpia_intento2.xlsx')

# Asegurar categorías y orden
df['genero'] = df['genero'].astype('category')
df['roles'] = df['roles'].astype('category')
df['genero'] = df['genero'].cat.reorder_categories(['Femenino', 'Masculino'], ordered=True)

# Generar un índice por personaje para ubicar cada punto en una “celda”
df['id'] = df.groupby(['año', 'genero', 'roles']).cumcount() + 1

# Gráfico estilo punch card
chart = alt.Chart(df).mark_circle(size=70).encode(
    x=alt.X(
        'año:O',
        title='Año',
        axis=alt.Axis(labelAngle=0)
    ),
    y=alt.Y(
        'genero:N',
        sort=['Femenino', 'Masculino'],
        title='', # Eliminado el título 'Género'
        axis=alt.Axis(domain=True, ticks=True)
    ),
    # La posición vertical adicional (índice) para punch card
    row=alt.Row('roles:N', title='Rol'),
    color=alt.Color(
        'genero:N',
        scale=alt.Scale(
            domain=['Femenino', 'Masculino'],
            range=['#531788', '#fed74c']
        ),
        title='Género'
    ),
    # Una segunda dimensión visual: ID → offset discreto
    yOffset='id:Q',
    tooltip=['personaje', 'roles', 'genero', 'año']
).properties(
    width=700,
    height=150,
    title=alt.Title(text='¿En qué rol están más los personajes femeninos?', anchor='middle')
)

chart

  df['id'] = df.groupby(['año', 'genero', 'roles']).cumcount() + 1


In [5]:
chart.save('punch_card_chart.html')

In [None]:
piramide_final.save('piramide_poblacional.html')