In [1]:
# Instalar Altair y las librerías necesarias para la exportación de imágenes.
!pip install altair
!pip install altair_saver vl-convert-python

Collecting altair_saver
  Downloading altair_saver-0.5.0-py3-none-any.whl.metadata (5.2 kB)
Collecting vl-convert-python
  Downloading vl_convert_python-1.8.0-cp37-abi3-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (5.2 kB)
Collecting altair-data-server>=0.4.0 (from altair_saver)
  Downloading altair_data_server-0.4.1-py3-none-any.whl.metadata (4.0 kB)
Collecting altair-viewer (from altair_saver)
  Downloading altair_viewer-0.4.0-py3-none-any.whl.metadata (4.1 kB)
Collecting selenium (from altair_saver)
  Downloading selenium-4.36.0-py3-none-any.whl.metadata (7.5 kB)
Collecting trio<1.0,>=0.30.0 (from selenium->altair_saver)
  Downloading trio-0.31.0-py3-none-any.whl.metadata (8.5 kB)
Collecting trio-websocket<1.0,>=0.12.2 (from selenium->altair_saver)
  Downloading trio_websocket-0.12.2-py3-none-any.whl.metadata (5.1 kB)
Collecting outcome (from trio<1.0,>=0.30.0->selenium->altair_saver)
  Downloading outcome-1.3.0.post0-py2.py3-none-any.whl.metadata (2.6 kB)
Collecting wspr

In [4]:
import pandas as pd
import altair as alt

# Cargar archivo CSV
df = pd.read_csv("Florencia_database_limpia 2.csv", encoding='latin-1', sep=';')

# Corregir nombre de columna con carácter especial
df = df.rename(columns={'A\x96o': 'Año'})

# Filtrar solo categorías escolares
df_escolar = df[df['Categoria'].str.contains('Escolar', case=False, na=False)]

# Seleccionar solo las tres pruebas de salto relevantes
saltos = ['Salto Largo', 'Salto Alto', 'Salto Garrocha']
df_saltos = df_escolar[df_escolar['Prueba'].isin(saltos)]

# Extraer el sexo desde la categoría
df_saltos['Sexo'] = df_saltos['Categoria'].apply(
    lambda x: 'Masculino' if 'Masculino' in x else 'Femenino' if 'Femenino' in x else 'Otro'
)

# Asegurar que el año sea numérico
df_saltos['Año'] = pd.to_numeric(df_saltos['Año'], errors='coerce')

# Contar atletas únicos por prueba, sexo y año
participacion = (
    df_saltos.groupby(['Año', 'Prueba', 'Sexo'])['Nombre Atleta']
    .nunique()
    .reset_index()
    .rename(columns={'Nombre Atleta': 'Atletas Únicos'})
)

# Crear gráfico de barras con facetas por año
chart = (
    alt.Chart(participacion)
    .mark_bar()
    .encode(
        x=alt.X('Prueba:N', title='Prueba de Salto'),
        y=alt.Y('Atletas Únicos:Q', title='Número de Atletas Únicos'),
        color=alt.Color('Sexo:N', title='Sexo', scale=alt.Scale(scheme='tableau10')),
        column=alt.Column('Año:O', title='Año'),
        tooltip=['Año', 'Prueba', 'Sexo', 'Atletas Únicos']
    )
    .properties(
        title='Participación de Atletas Únicos por Prueba, Sexo y Año (Categorías Escolares)',
        width=180,
        height=350
    )
)

chart.show()
