In [90]:
import pandas as pd
import altair as alt

df = pd.read_excel('base de datos turismo por año.xlsx')

df['Continente'] = df['Continente']
# Asegurar formato uniforme en los nombres de continente
df['Continente'] = df['Continente'].str.strip().str.upper()

# Reemplazar Medio Oriente y Caribe (luego de normalizar)
df['Continente'] = df['Continente'].replace({
    'MEDIO ORIENTE': 'ASIA',
    'CARIBE': 'AMÉRICA CENTRAL'
}).replace({
    'MEDIO ORIENTE': 'ASIA',
    'CARIBE': 'AMÉRICA CENTRAL'
})

# Convertir de formato ancho a largo
df_long = df.melt(id_vars=["Nacionalidad", "Continente"],
                  var_name="Año",
                  value_name="Turistas")

# Limpiar columna "Año"
df_long["Año"] = df_long["Año"].str.replace("Total ", "")

# Agrupar por continente y año
df_grouped = df_long.groupby(["Continente", "Año"], as_index=False)["Turistas"].sum()

# Definir escala de colores por continente
color_scale = alt.Scale(
    domain=["ASIA", "AMERICA DEL SUR", "AMERICA DEL NORTE", "AFRICA", "OCEANIA", "EUROPA", "AMERICA CENTRAL"],
    range=["purple", "green", "red", "orange", "#8ECAE6", "blue", "yellow"]
)

# Crear gráfico
df_grouped = df_grouped[df_grouped["Año"] != "2025"]
chart = alt.Chart(df_grouped).mark_bar(
    cornerRadiusTopLeft=3,
    cornerRadiusTopRight=3
).encode(
    x=alt.X('Año:O', title='Año'),
    y=alt.Y('Turistas:Q', title='Total de turistas'),
    color=alt.Color('Continente:N', scale=color_scale, title='Continente'),tooltip=[
        alt.Tooltip('Año:N'),
        alt.Tooltip('Continente:N'),
        alt.Tooltip('Turistas:Q', title='Turistas', format=',')
    ]
).properties(
    width=700,
    height=400,
    title='Ingreso de Turistas por Continente y Año en Chile'
)

chart
chart.save('grafico_turismo.html')  # Guarda el gráfico como HTML
from google.colab import files
files.download('grafico_turismo.html')  # Inicia la descarga


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>