<style>
    /* Estilos generales de la portada */
    .presentation-container {
        font-family: 'Arial', sans-serif;
        text-align: center;
        padding: 50px;
        color: #333;
        max-width: 1000px;
        margin: 0 auto;
    }

    /* Título principal */
    .presentation-title {
        font-size: 50px;
        font-weight: bold;
        margin-bottom: 20px;
        text-transform: uppercase;
        letter-spacing: 3px;
    }

    /* Subtítulo */
    .presentation-subtitle {
        font-size: 28px;
        font-weight: 300;
        margin-bottom: 30px;
    }

    /* Sección de información */
    .presentation-text {
        font-size: 18px;
        max-width: 800px;
        margin: 0 auto;
        line-height: 1.8;
        opacity: 0.9;
    }

    /* Autor y fecha */
    .presentation-footer {
        font-size: 18px;
        margin-top: 50px;
        opacity: 0.8;
    }

    /* Sidebar estilos */
    .sidebar {
        height: 100%;
        width: 250px;
        position: fixed;
        top: 0;
        left: 0;
        background-color: #2d2d44;
        padding-top: 20px;
        transition: 0.3s;
        box-shadow: 2px 0 5px rgba(0, 0, 0, 0.2);
    }

    .sidebar a {
        padding: 10px 20px;
        text-decoration: none;
        font-size: 20px;
        color: #dcdcdc;
        display: block;
        transition: 0.3s;
    }

    .sidebar a:hover {
        background-color: #575766;
    }

    .sidebar .toggle-btn {
        position: absolute;
        top: 20px;
        right: -50px;
        background: #2d2d44;
        color: white;
        padding: 10px;
        cursor: pointer;
        border-radius: 5px;
    }

    /* Ocultar sidebar */
    .sidebar-hidden {
        margin-left: -250px;
    }

    /* Ajustar contenido con sidebar */
    .content,
    .jp-Cell {
        margin-left: 250px;
        transition: margin-left 0.3s;
    }

    .content.sidebar-collapsed,
    .jp-Cell.sidebar-collapsed {
        margin-left: 0;
    }

    /* Smooth scrolling effect */
    html {
        scroll-behavior: smooth;
    }
</style>

<!-- Contenido de la portada -->
<div id="content" class="content">
    <div class="presentation-container">
        <h1 class="presentation-title">Análisis Global del Turismo</h1>
        <h2 class="presentation-subtitle">Impacto Económico y Tendencias</h2>
        <p class="presentation-text">
            Este proyecto presenta un análisis detallado del impacto del turismo en la economía global 
            utilizando datos de <strong>World Bank Group</strong>. Se estudian tendencias clave como el crecimiento 
            de llegadas turísticas, ingresos generados y su relación con indicadores económicos como 
            el PIB y la inflación.  
            <br><br>
            Para la visualización y procesamiento de datos, se han utilizado herramientas avanzadas 
            como <strong>Pandas, Plotly y Dash</strong>, lo que permite una exploración interactiva de la información.
        </p>
        <div class="presentation-footer">
            <p><strong>Autor:</strong> Pau Bestard</p>
            <p><strong>Fecha:</strong> Enero 2025</p>
        </div>
    </div>
    <!-- Secciones de contenido -->
    <h2 id="intro">Introducción</h2>
    <p>
        El turismo es un sector clave en la economía global, representando una fuente significativa de ingresos y empleo para muchos países. 
        El análisis de datos turísticos puede proporcionar información valiosa para la formulación de políticas económicas, estrategias de 
        desarrollo sostenible y la promoción de destinos turísticos. 
    </p>
    <p>
        En este proyecto, se ha realizado una visualización interactiva de datos turísticos y económicos provenientes del 
        <a href="https://data.worldbank.org/indicator/ST.INT.ARVL?end=2019&start=2019&view=bar" target="_blank">World Bank Group</a>, con el objetivo de identificar patrones, correlaciones y tendencias que puedan 
        ayudar a comprender mejor el impacto del turismo en la economía global.
    </p>
    <p>
        Las preguntas clave que se pretenden responder con este análisis son:
    </p>
    <ul>
        <li>¿Cómo ha evolucionado el turismo a lo largo del tiempo en diferentes regiones?</li>
        <li>¿Existe una relación significativa entre el turismo y el PIB de los países?</li>
        <li>¿Qué países han experimentado el mayor crecimiento en llegadas de turistas?</li>
        <li>¿De qué manera el turismo influye en las tasas de desempleo e inflación?</li>
    </ul>   

</div>

<script>
    document.addEventListener("DOMContentLoaded", function() {
        // Crear la sidebar dinámicamente
        var sidebar = document.createElement("div");
        sidebar.id = "sidebar";
        sidebar.className = "sidebar";
        sidebar.innerHTML = `
            <a href="#intro">Introducción</a>
            <a href="#data-exploration">Exploración de los datos</a>
            <a href="#variable-evolution-visualization">Visualización de la Evolución Temporal</a>
            <a href="#per-year-tendencies">Tendencias por año</a>
            <a href="#interactive-top-10">Top 10 interactivo</a>
        `;
        document.body.insertBefore(sidebar, document.body.firstChild);
    });


    function toggleSidebar() {
        var sidebar = document.getElementById("sidebar");
        var content = document.getElementById("content");
        var jpCells = document.querySelectorAll(".jp-Cell");

        // Si la barra está oculta, mostrarla
        if (sidebar.classList.contains("sidebar-hidden")) {
            sidebar.classList.remove("sidebar-hidden");
            content.classList.remove("sidebar-collapsed");
            jpCells.forEach(cell => cell.classList.remove("sidebar-collapsed"));
        } else {
            // Ocultar la barra
            sidebar.classList.add("sidebar-hidden");
            content.classList.add("sidebar-collapsed");
            jpCells.forEach(cell => cell.classList.add("sidebar-collapsed"));
        }
    }
</script>

<style>
    .md-container {
        border-left: 6px solid #007bff;
        background-color: #f8f9fa;
        padding: 20px;
        border-radius: 5px;
        margin-bottom: 20px;
        box-shadow: 0 4px 8px rgba(0,0,0,0.1);
    }

    .md-title {
        color: #007bff;
        font-size: 24px;
        font-weight: bold;
        margin-bottom: 10px;
    }

    .md-text {
        font-size: 16px;
        color: black;
        line-height: 1.6;
    }

    .variable-list {
        list-style: none;
        padding: 0;
    }

    .variable-list li {
        padding: 8px 0;
        font-size: 16px;
    }

    .emoji {
        font-size: 18px;
        margin-right: 5px;
    }
</style>

<div class="md-container" id="data-exploration">
    <div class="md-title">Exploración Inicial de los Datos</div>
    <p class="md-text">
        En esta sección se exploran las principales variables relacionadas con el turismo y la economía, obtenidas de <strong>World DataBank</strong>.
        Se analizarán diversos indicadores para comprender la relación entre el turismo y el desarrollo económico de cada país.
    </p>
    <ul class="variable-list">
        <li><span class="emoji">💰</span><strong>tourism_receipts:</strong> Ingresos totales generados por el turismo internacional (USD).</li>
        <li><span class="emoji">🌍</span><strong>tourism_arrivals:</strong> Número total de turistas internacionales que llegan al país (conteo).</li>
        <li><span class="emoji">🛍️</span><strong>tourism_expenditures:</strong> Gasto total de los turistas internacionales dentro del país (USD).</li>
        <li><span class="emoji">📈</span><strong>tourism_exports:</strong> Porcentaje de exportaciones derivadas de los ingresos turísticos.</li>
        <li><span class="emoji">✈️</span><strong>tourism_departures:</strong> Número de residentes del país que viajan al extranjero por turismo.</li>
        <li><span class="emoji">🛫</span><strong>tourism_expenditures:</strong> Porcentaje de importaciones gastadas en turismo internacional.</li>
        <li><span class="emoji">📊</span><strong>gdp:</strong> Valor total de bienes y servicios producidos en el país (USD).</li>
        <li><span class="emoji">📉</span><strong>inflation:</strong> Cambio porcentual anual en el precio promedio de bienes y servicios.</li>
        <li><span class="emoji">👷‍♂️</span><strong>unemployment:</strong> Porcentaje de personas desempleadas dentro de la fuerza laboral.</li>
    </ul>
</div>


In [2]:
import pandas as pd
import pycountry

df = pd.read_csv("./world_tourism_economy_data.csv")
df = df[df['year'] < 2020]
# Función para obtener el código de 2 caracteres a partir del código de 3 caracteres
def get_country_code_2(char_3):
    country = pycountry.countries.get(alpha_3=char_3)
    if country:
        return country.alpha_2
    else:
        return None  # Si no se encuentra el país

# Aplicar la función para crear la nueva columna
df['country_code_2'] = df['country_code'].apply(get_country_code_2)

df.sample(5)


Unnamed: 0,country,country_code,year,tourism_receipts,tourism_arrivals,tourism_exports,tourism_departures,tourism_expenditures,gdp,inflation,unemployment,country_code_2
3834,Not classified,INX,2013,,,,,,,,,
2879,Sao Tome and Principe,STP,2009,8300000.0,15200.0,42.319235,,0.399027,200668100.0,16.957476,,ST
1152,Equatorial Guinea,GNQ,2003,,,,,,2484746000.0,7.323544,,GQ
3246,Czechia,CZE,2011,8930000000.0,22810000.0,5.484537,5279000.0,3.16774,231429400000.0,1.917219,6.712,CZ
4973,Panama,PAN,2017,6827000000.0,2517000.0,25.144328,869000.0,4.198888,64327690000.0,0.875586,5.461,PA


<div class="md-container" id="data-cleaning">
    <div class="md-title">Limpieza de Datos</div>
    <p class="md-text">
    Para optimizar el análisis y garantizar resultados más precisos, hemos eliminado 
    los <strong>grupos regionales y asociaciones</strong> del conjunto de datos.  
    Ahora trabajamos exclusivamente con <strong>datos individuales por país</strong>, 
    lo que permite un enfoque más detallado y específico en el análisis de tendencias 
    y comparaciones a nivel nacional.  
    <br><br>
    Esta decisión facilita la interpretación de los resultados, evitando agregaciones 
    que podrían distorsionar los hallazgos clave.
    </p>
</div>



In [3]:
# Lista de países a eliminar
paises_excluir = [
    "Africa Eastern and Southern", "Africa Western and Central", "Arab World", 
    "Caribbean small states", "Central Europe and the Baltics", "Early-demographic dividend", 
    "East Asia & Pacific", "East Asia & Pacific (excluding high income)", 
    "East Asia & Pacific (IDA & IBRD countries)", "Euro area", "Europe & Central Asia", 
    "Europe & Central Asia (excluding high income)", "Europe & Central Asia (IDA & IBRD countries)", 
    "European Union", "Fragile and conflict affected situations", 
    "Heavily indebted poor countries (HIPC)", "High income", "IBRD only", "IDA & IBRD total", 
    "IDA blend", "IDA only", "IDA total", "Late-demographic dividend", 
    "Latin America & Caribbean", "Latin America & Caribbean (excluding high income)", 
    "Latin America & the Caribbean (IDA & IBRD countries)", 
    "Least developed countries: UN classification", "Low & middle income", "Low income", 
    "Lower middle income", "Middle East & North Africa", 
    "Middle East & North Africa (excluding high income)", 
    "Middle East & North Africa (IDA & IBRD countries)", "Middle income", "North America", 
    "Not classified", "OECD members", "Other small states", "Pacific island small states", 
    "Post-demographic dividend", "Pre-demographic dividend", "Small states", "South Asia", 
    "South Asia (IDA & IBRD)", "Sub-Saharan Africa", "Sub-Saharan Africa (excluding high income)", 
    "Sub-Saharan Africa (IDA & IBRD countries)", "Upper middle income", "World"
]

# Filtrar el DataFrame eliminando los países especificados
df_countries = df[~df['country'].isin(paises_excluir)]

<div class="md-container" id="variable-evolution-visualization">
    <div class="md-title">Visualización de la Evolución Temporal</div>
    <p class="md-text">
        En esta sección se presenta un <strong>mapa interactivo</strong> que permite explorar la evolución de diferentes indicadores turísticos 
        y económicos a lo largo del tiempo. Los datos utilizados provienen de <strong>World DataBank</strong>, proporcionando una visión 
        global de cómo las variables clave han cambiado en diversos países a lo largo de los años.
    </p>
    <p class="md-text">
        El usuario puede seleccionar entre diversas variables como <strong>llegadas turísticas, ingresos por turismo, PIB, inflación</strong>, entre otras. 
        El mapa permitirá visualizar estos datos de manera interactiva, mostrando tendencias a lo largo del tiempo con opciones de filtrado por país y año.
    </p>
    <ul class="variable-list">
        <li><span class="emoji">🌍</span> <strong>Interactividad:</strong> Se pueden seleccionar distintos indicadores para analizar su evolución temporal.</li>
        <li><span class="emoji">📅</span> <strong>Animación por años:</strong> El mapa permite visualizar cambios año por año mediante un control deslizante.</li>
        <li><span class="emoji">📊</span> <strong>Escalabilidad:</strong> Los datos abarcan múltiples años y países, proporcionando una visión comparativa.</li>
        <li><span class="emoji">🛠️</span> <strong>Herramientas utilizadas:</strong> Se han usado <strong>Dash</strong> y <strong>Plotly</strong> para la creación del mapa interactivo.</li>
    </ul>
    <p class="md-text">
        Utiliza las opciones de selección disponibles para explorar las tendencias y obtener información detallada sobre cada país. 
        La visualización facilita la comprensión de cómo el turismo influye en la economía global a lo largo del tiempo.
    </p>
</div>


In [4]:
import pandas as pd
import plotly.express as px
from dash import Dash, dcc, html, Input, Output, jupyter_dash

# Configurar modo de ejecución en Jupyter (inline para mostrar dentro de la celda)
jupyter_dash.default_mode = "inline"

# Eliminar valores nulos en las columnas esenciales
df_filtered = df_countries[['country', 'country_code', 'year', 'tourism_arrivals', 'tourism_receipts', 
                           'gdp', 'tourism_expenditures', 'inflation', 'unemployment']].dropna()

# Crear la aplicación Dash
app = Dash("evolucionPorPais")

# Layout de la aplicación
app.layout = html.Div([
    
    # Contenedor con posición absoluta para superponer el selector sobre el gráfico
    html.Div([
        dcc.Dropdown(
            id="variable-selector",
            options=[
                {'label': 'Llegadas Turísticas', 'value': 'tourism_arrivals'},
                {'label': 'Ingresos por Turismo', 'value': 'tourism_receipts'},
                {'label': 'Gastos en Turismo', 'value': 'tourism_expenditures'},
                {'label': 'Producto Interno Bruto (PIB)', 'value': 'gdp'},
                {'label': 'Inflación Anual', 'value': 'inflation'},
                {'label': 'Porcentaje de Desempleo', 'value': 'unemployment'}
            ],
            value='tourism_arrivals',  # Valor por defecto
            style={'width': '250px', 'margin': '0 auto'}
        ),
    ], style={'position': 'absolute', 'top': '20px', 'left': '50px', 'transform': 'translateX(-20%)', 'zIndex': '1000'}),
    
    # Contenedor para el gráfico con márgenes superiores
    html.Div([
        dcc.Graph(id="map-chart")
    ], style={'marginTop': '10px'}),


])


# Callback para actualizar el mapa basado en la selección del usuario
@app.callback(
    Output("map-chart", "figure"),
    [Input("variable-selector", "value")]
)
def update_map(selected_variable):
    # Crear el mapa coroplético con Plotly Express
    fig = px.choropleth(
        df_filtered,
        locations="country_code",
        color=selected_variable,
        hover_name="country",
        animation_frame="year",
        color_continuous_scale="RdYlGn",
        title=f"<b>Evolución de {selected_variable.replace('_', ' ').capitalize()} por País</b>"
    )

    # Actualizar diseño del mapa
    fig.update_layout(
        geo=dict(
            showframe=False, 
            showcoastlines=False, 
            projection_type='equirectangular'
        ),
        coloraxis_colorbar=dict(
            title=selected_variable.replace('_', ' ').capitalize(),
            tickprefix="", 
            ticksuffix=""
        ),
        title={'x': 0.5, 'xanchor': 'center', 'yanchor': 'top', 'font': {'size': 22}},
        width=1000,
        height=600,
        template='plotly_white'
    )

    return fig


# Ejecutar la aplicación en modo inline dentro de Jupyter
app.run(jupyter_mode="inline", jupyter_width=1050, jupyter_height=640,port=8061)

Dropdown(description='Variable:', options=(('Llegadas Turísticas', 'tourism_arrivals'), ('Ingresos por Turismo…

Button(description='Ver Mapa Interactivo', style=ButtonStyle())

<div class="md-container" id="per-year-tendencies">
    <div class="md-title">Tendencias por año</div>
    <p class="md-text">
        En esta sección se presenta el siguiente análisis tiene como objetivo proporcionar una visión estructurada del número de llegadas de turistas internacionales a lo largo de los años para cada país. La metodología utilizada permite identificar tanto los principales destinos turísticos como aquellos países con menor recepción de turistas, además de calcular estadísticas globales relevantes como la media y la mediana de llegadas.
    </p>
    <p class="md-text">
        Podemos en estos datos ver algunas tendencias, como un consistente incremento del turismo a nivel global, y unos claros líderes a nivel de turistas, Francia, Estados Unidos y China
    </p>
</div>


In [5]:
import pandas as pd
from tabulate import tabulate
from IPython.display import display

# Filtrar columnas necesarias y eliminar filas con valores NaN en 'tourism_arrivals'
df_table = df_countries[['country', 'year', 'tourism_arrivals']].dropna()

# Convertir 'tourism_arrivals' a numérico (por si hay errores de formato)
df_table['tourism_arrivals'] = pd.to_numeric(df_table['tourism_arrivals'], errors='coerce')

# Obtener la lista de años únicos disponibles en los datos
years = sorted(df_table['year'].unique())

# Lista para almacenar los datos organizados por año
summary_data = []

# Procesar cada año para generar la tabla requerida
for year in years:
    df_year = df_table[df_table['year'] == year].sort_values(by='tourism_arrivals', ascending=False)

    top_3 = df_year.head(3)[['country', 'tourism_arrivals']]
    bottom_3 = df_year.tail(3)[['country', 'tourism_arrivals']]
    
    mean_value = df_year['tourism_arrivals'].mean()
    median_value = df_year['tourism_arrivals'].median()

    summary_data.append({
        'Año': year,
        'Top 3 países': ', '.join(top_3['country'].tolist()),
        'Llegadas Top 3': ', '.join(top_3['tourism_arrivals'].apply(lambda x: f"{x:,.0f}").tolist()),
        'Bottom 3 países': ', '.join(bottom_3['country'].tolist()),
        'Llegadas Bottom 3': ', '.join(bottom_3['tourism_arrivals'].apply(lambda x: f"{x:,.0f}").tolist()),
        'Media Global': f"{mean_value:,.0f}",
        'Mediana Global': f"{median_value:,.0f}"
    })

# Crear un DataFrame con los resultados
summary_df = pd.DataFrame(summary_data)

# Para Jupyter Notebook, mostrar como tabla HTML
display(summary_df)


Unnamed: 0,Año,Top 3 países,Llegadas Top 3,Bottom 3 países,Llegadas Bottom 3,Media Global,Mediana Global
0,1999,"Mexico, Poland, United States","99,869,000, 89,118,000, 75,796,000","Marshall Islands, Tajikistan, Tuvalu","4,600, 4,500, 1,100",5501252,694000
1,2000,"Mexico, Poland, China","105,673,000, 84,515,000, 83,444,000","Marshall Islands, Solomon Islands, Tuvalu","5,200, 5,200, 1,100",5790935,759000
2,2001,"Mexico, China, Spain","100,718,000, 89,013,000, 75,564,000","Marshall Islands, Tajikistan, Tuvalu","5,400, 5,200, 1,100",5620617,819500
3,2002,"Mexico, China, Spain","100,153,000, 97,908,000, 79,313,000","Bhutan, Central African Republic, Tuvalu","5,600, 2,900, 1,300",5809230,884000
4,2003,"Mexico, China, Spain","92,330,000, 91,662,000, 82,326,000","Bhutan, Central African Republic, Tuvalu","6,300, 5,700, 1,400",5829414,897000
5,2004,"France, China, Mexico","190,282,000, 109,038,000, 99,250,000","Central African Republic, Solomon Islands, Tuvalu","8,200, 5,600, 1,300",7616218,1107500
6,2005,"France, China, Mexico","185,829,000, 120,292,000, 103,146,000","Marshall Islands, Guinea-Bissau, Tuvalu","9,200, 5,000, 1,100",7789378,1111000
7,2006,"France, United States, China","193,882,000, 183,178,000, 124,942,000","Kiribati, Marshall Islands, Tuvalu","10,800, 5,800, 1,100",8542113,1136000
8,2007,"France, United States, China","193,319,000, 175,299,000, 131,873,000","Sao Tome and Principe, Marshall Islands, Tuvalu","11,800, 7,200, 1,100",8617366,1227500
9,2008,"France, United States, China","193,571,000, 175,703,000, 130,027,000","Sao Tome and Principe, Marshall Islands, Tuvalu","14,500, 6,000, 1,700",8536228,1311500


<div class="md-container" id="interactive-top-10">
    <div class="md-title">Tendencias por año</div>
    <p class="md-text">
El siguiente código implementa una aplicación interactiva, cuyo objetivo es permitir la exploración visual de diversas métricas turísticas y económicas a nivel mundial. Esta herramienta ofrece la posibilidad de identificar patrones, comparar y analizar los líderes de cada una de las variables.
    </p>
    <p class="md-text">
        Podemos en estos datos ver algunas tendencias, como un consistente incremento del turismo a nivel global, y unos claros líderes a nivel de turistas, Francia, Estados Unidos y China
    </p>
</div>


In [7]:
import pandas as pd
import plotly.express as px
from dash import Dash, dcc, html, Input, Output
import dash_daq as daq
import dash
import plotly.graph_objects as go
import requests

variables = ['tourism_arrivals', 'tourism_receipts', 'gdp', 'tourism_expenditures', 'inflation', 'unemployment']


app = Dash("barplotCountryHighlights")

# Layout de la aplicación Dash
app.layout = html.Div([
    
    # Filtro para seleccionar la variable
    dcc.Dropdown(
        id="variable-selector",
        options=[{'label': var.replace('_', ' ').capitalize(), 'value': var} for var in variables],

        value='tourism_arrivals',  # Valor por defecto
        style={'position': 'absolute', 'top': '10px', 'left': '15%', 'transform': 'translateX(-50%)', 'zIndex': '1000','width':'200px'}

    ),
    
    # Filtro para seleccionar si es Top o Bottom
    dcc.Dropdown(
        id="top-bottom-selector",
        options=[
            {'label': 'Top 10', 'value': 'top'},
            {'label': 'Bottom 10', 'value': 'bottom'}
        ],
        value='top',  # Valor por defecto
        style={'position': 'absolute', 'top': '10px', 'left': '30%', 'transform': 'translateX(-50%)', 'zIndex': '1000','width':'200px'}

    ),
    
    # Filtro para seleccionar el año
    dcc.Dropdown(
        id="year-selector",
        options=[{'label': str(year), 'value': year} for year in sorted(df_countries['year'].unique())],
        value=1999,  # Año por defecto
        style={'position': 'absolute', 'top': '10px', 'left': '45%', 'transform': 'translateX(-50%)', 'zIndex': '1000','width':'200px'}

    ),
    
    # Gráfico de barras
    dcc.Graph(id="bar-chart",style={'margin-top':'40px'}),

  
])

# Función para obtener la bandera de cada país (nueva URL ya que countryflags.io ha sido descontinuado)
def get_flag(alpha2_code):
    if alpha2_code == None:
        alpha2_code = "un"
    return f'https://flagcdn.com/h40/{alpha2_code.lower()}.png'

# Callback para actualizar el gráfico de barras con banderas
@app.callback(
    Output("bar-chart", "figure"),
    [
        Input("variable-selector", "value"),
        Input("top-bottom-selector", "value"),
        Input("year-selector", "value")
    ]
)
def update_chart(selected_variable, selected_top_bottom, selected_year):
    # Filtrar los datos por el año seleccionado
    df_year = df_countries[df_countries['year'] == selected_year]

    # Ordenar los países según la variable seleccionada
    df_year = df_year.sort_values(by=selected_variable, ascending=False)

    # Seleccionar los Top o Bottom según la elección
    if selected_top_bottom == 'top':
        df_top_bottom = df_year.head(10)
    else:
        df_top_bottom = df_year.tail(10)

    # Obtener las banderas de los países
    df_top_bottom = df_top_bottom.copy()
    df_top_bottom['flag_url'] = df_top_bottom['country_code_2'].apply(get_flag)
    # Crear la figura de barras
    fig = go.Figure()

    # Agregar las barras
    fig.add_trace(go.Bar(
        x=df_top_bottom['country'],
        y=df_top_bottom[selected_variable],
        marker=dict(color='rgb(51, 204, 255)'),
        text=df_top_bottom['country'],  # Mostrar nombres de los países al pasar el mouse
        textposition='auto'
    ))

    # Agregar imágenes de banderas como "layout images"
    flag_images = []
    for i, row in df_top_bottom.iterrows():
        flag_images.append({
            "source": row['flag_url'],  # URL de la bandera
            "xref": "x",
            "yref": "paper",  # Coordenadas relativas al gráfico
            "x": row['country'],  # Posición en el eje X (nombre del país)
            "y": -0.1,  # Por debajo del eje X
            "xanchor": "center",
            "yanchor": "middle",
            "sizex": 0.4,  # Ancho relativo
            "sizey": 0.3,  # Alto relativo
            "layer": "below"
        })

    # Configurar el diseño del gráfico
    fig.update_layout(
        title=f"<b>Top 10 / Bottom 10 países por {selected_variable.replace('_', ' ').capitalize()} ({selected_year})</b>",
        yaxis=dict(title=selected_variable.replace('_', ' ').capitalize()),
        template="plotly_white",
        showlegend=False,
        width=1000,
        height=600,
        margin=dict(b=100),  # Espacio adicional para las banderas
        images=flag_images  # Agregar las imágenes de banderas
    )

    return fig

# Ejecutar la aplicación
app.run(jupyter_mode="inline", width=1050,port=8063)


In [8]:
import pandas as pd
import geopandas as gpd
import folium
import branca
import numpy as np
from ipywidgets import interact

# Limpiar el DataFrame, asegurándonos de que no haya valores nulos
df_countries_clean = df_countries.dropna(subset=['tourism_arrivals', 'gdp', 'year'])
df_countries_clean.loc[:, 'year'] = df_countries_clean['year'].astype(int)

# Asegurarse de que las columnas necesarias están presentes
df_countries_clean = df_countries_clean[['country', 'country_code', 'year', 'tourism_arrivals', 'gdp']]

# Cargar el shapefile de los países (asegúrate de que la ruta sea correcta)
world = gpd.read_file("./ne_110m_admin_0_countries/ne_110m_admin_0_countries.shp")

# Filtrar el mapa solo por países válidos (sin regiones ni continentes)
world = world.rename(columns={"name": "country"})

# Realizar el merge con la columna correcta 'SOV_A3' y 'country_code', asegurándonos de conservar la geometría
df_map = pd.merge(world, df_countries_clean, left_on="ADM0_A3", right_on="country_code", how="left")

# Función optimizada para crear los colores en base a turismo y PIB
def get_color(tourism, gdp):
    """
    Asignar un color en base a los valores bivariados de turismo y PIB usando una escala lineal sencilla.
    """
    if pd.isna(tourism) or pd.isna(gdp):
        return '#d3d3d3'  # color gris si hay datos faltantes
    
    # Normalizar los valores de turismo y PIB en una escala de 0 a 1
    tourism_normalized = (tourism - df_countries_clean['tourism_arrivals'].min()) / \
                         (df_countries_clean['tourism_arrivals'].max() - df_countries_clean['tourism_arrivals'].min())
    gdp_normalized = (gdp - df_countries_clean['gdp'].min()) / \
                     (df_countries_clean['gdp'].max() - df_countries_clean['gdp'].min())
    
    # Crear una paleta de colores combinados: amarillo claro para turismo y azul claro para PIB
    tourism_colormap = branca.colormap.LinearColormap(['#fcfcde', '#ffff57', '#ffeb3b'], vmin=0, vmax=1)  # Amarillo claro a amarillo más saturado
    gdp_colormap = branca.colormap.LinearColormap(['#ebf9ff', '#81d4fa', '#61d0ff'], vmin=0, vmax=1)  # Blanco a azul claro
    
    # Generar colores para turismo y PIB
    tourism_color = tourism_colormap(tourism_normalized)
    gdp_color = gdp_colormap(gdp_normalized)
    
    # Mezclar los dos colores de manera más eficiente
    blended_color = blend_colors(tourism_color, gdp_color)

    return blended_color

def blend_colors(color1, color2):
    """
    Mezcla dos colores en formato hexadecimal de manera eficiente.
    """
    # Convertir de hexadecimal a RGB
    color1_rgb = [int(color1[i:i+2], 16) for i in (1, 3, 5)]
    color2_rgb = [int(color2[i:i+2], 16) for i in (1, 3, 5)]
    
    # Promediar los valores de RGB
    blended_rgb = [(c1 + c2) // 2 for c1, c2 in zip(color1_rgb, color2_rgb)]
    
    # Convertir de vuelta a hexadecimal
    blended_hex = f"#{blended_rgb[0]:02x}{blended_rgb[1]:02x}{blended_rgb[2]:02x}"
    
    return blended_hex

# Función para añadir la leyenda con texto explicativo
def add_legend(m):
    tourism_colormap = branca.colormap.LinearColormap(['#fcfcde', '#ffff57', '#ffeb3b'], vmin=0, vmax=1)
    gdp_colormap = branca.colormap.LinearColormap(['#ebf9ff', '#81d4fa', '#61d0ff'], vmin=0, vmax=1)
    
    # Crear una leyenda explicativa con ambas paletas
    tourism_colormap.caption = 'Índice de Turismo: de menor a mayor'
    gdp_colormap.caption = 'Índice de PIB: de menor a mayor'
    
    tourism_colormap.add_to(m)
    gdp_colormap.add_to(m)
    
    return m

# Función para actualizar el mapa según el año
def update_map(year):
    # Filtramos los datos según el año
    df_year = df_countries_clean.loc[df_countries_clean['year'] == year]
    
    # Crear el mapa con los datos del año seleccionado
    m = folium.Map(location=[20, 0], zoom_start=2.5, width='75%', height='75%')  # Reducir el zoom y tamaño del mapa
    
    # Iterar sobre el GeoDataFrame combinado con geometría
    for _, row in df_map.iterrows():
        if row['year'] == year:
            color = get_color(row['tourism_arrivals'], row['gdp'])
            
            folium.GeoJson(
                row['geometry'],
                style_function=lambda feature, color=color: {
                    'fillColor': color,  # Asignar el color combinado
                    'fillOpacity': 0.7,
                    'weight': 0.5,
                    'color': 'black'
                },
                tooltip=folium.Tooltip(f"País: {row['country']}<br>Tourism Arrivals: {row['tourism_arrivals']:,}<br>GDP: {row['gdp']:,}")
            ).add_to(m)
    
    # Añadir la leyenda
    m = add_legend(m)
    
    return m

# Usar ipywidgets para crear un deslizador de año, comenzando en el primer año disponible
interact(update_map, year=(1999, 2019, 1))


interactive(children=(IntSlider(value=2009, description='year', max=2019, min=1999), Output()), _dom_classes=(…

<function __main__.update_map(year)>

In [9]:
import pandas as pd
import plotly.express as px
from dash import Dash, dcc, html, Input, Output, jupyter_dash

# Configuración global para ejecutar en Jupyter (modo externo o pestaña)
jupyter_dash.default_mode = "external"

# Seleccionar las columnas relevantes y eliminar filas con NaN
variables = ['tourism_receipts', 'unemployment', 'gdp']
df_filtered = df_countries[['year'] + variables].dropna()

# Convertir a valores numéricos
for col in variables:
    df_filtered[col] = pd.to_numeric(df_filtered[col], errors='coerce')

# Agrupar por año y calcular el promedio de las variables
df_grouped_by_year = df_filtered.groupby('year')[['tourism_receipts', 'unemployment', 'gdp']].mean().reset_index()

# Calcular el cambio porcentual de las variables
df_grouped_by_year['Cambio en Recepción de Turismo'] = df_grouped_by_year['tourism_receipts'].pct_change() * 100
df_grouped_by_year['Cambio en Desempleo'] = df_grouped_by_year['unemployment'].pct_change() * 100
df_grouped_by_year['Cambio en PIB'] = df_grouped_by_year['gdp'].pct_change() * 100

# Crear la aplicación Dash
app = Dash("unemploymentTourismGainsRelation")

# Layout de la aplicación
app.layout = html.Div([

    # Contenedor con flexbox para alinear los gráficos uno al lado del otro
    html.Div([
        # Gráfico 1: Relación entre tourism_receipts y unemployment a nivel global
        html.Div([
            dcc.Graph(id="global-relation-chart")
        ], style={'width': '48%', 'padding': '10px'}),  # Ajuste el tamaño y el margen

        # Gráfico 2: Cambio porcentual de tourism_receipts, unemployment y gdp entre año y año
        html.Div([
            dcc.Graph(id="yearly-change-chart")
        ], style={'width': '48%', 'padding': '10px'}),  # Ajuste el tamaño y el margen
    ], style={'display': 'flex', 'justifyContent': 'space-between', 'flexWrap': 'wrap'}),
])

# Callback para actualizar los gráficos
@app.callback(
    [Output("global-relation-chart", "figure"),
     Output("yearly-change-chart", "figure")],
    [Input("global-relation-chart", "id")]  # Necesario para el callback
)
def update_charts(_):
    # Gráfico 1: Relación global entre tourism_receipts y unemployment
    fig1 = px.scatter(
        df_filtered, x='tourism_receipts', y='unemployment',
        labels={'tourism_receipts': 'Recepción de Turismo', 'unemployment': 'Desempleo'},
        title='<b>Relación entre Recepción de Turismo y Desempleo a Nivel Global</b>'
    )
    
    # Personalización del gráfico 1
    fig1.update_layout(
        title={'x': 0.5, 'xanchor': 'center', 'yanchor': 'top', 'font': {'size': 22}},
        template='plotly_white'
    )

    # Gráfico 2: Cambio porcentual de las variables entre año y año (con nombres personalizados)
    fig2 = px.line(
        df_grouped_by_year, x='year', 
        y=['Cambio en Recepción de Turismo', 'Cambio en Desempleo', 'Cambio en PIB'],
        labels={'value': 'Cambio Porcentual (%)', 'year': 'Año'},
        title='<b>Cambio Porcentual Anual de Turismo, Desempleo y PIB</b>'
    )

    # Personalización del gráfico 2
    fig2.update_layout(
        title={'x': 0.5, 'xanchor': 'center', 'yanchor': 'top', 'font': {'size': 22}},
        legend_title_text='Indicador',
        template='plotly_white'
    )

    return fig1, fig2

# Ejecutar la aplicación en Jupyter con modo externo
app.run(jupyter_mode="inline", port=8054)


In [10]:
import pandas as pd
import plotly.express as px
from dash import Dash, dcc, html, Input, Output
import plotly.graph_objects as go
from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler
import warnings

warnings.filterwarnings("ignore")


# Variables disponibles para clustering
variables = ['tourism_arrivals', 'tourism_receipts', 'gdp', 
             'tourism_expenditures', 'inflation', 'unemployment']

# Inicializar la app Dash
app = Dash("clustering")

# Layout de la aplicación Dash
app.layout = html.Div([
    html.H1("Clustering de Países por Indicadores Turísticos y Económicos", style={'textAlign': 'center'}),

    # Dropdowns para seleccionar las variables de clustering
    html.Div([
        dcc.Dropdown(
            id="x-variable-selector",
            options=[{'label': var.replace('_', ' ').capitalize(), 'value': var} for var in variables],
            value='tourism_arrivals',  # Valor por defecto en eje X
            style={'width': '45%', 'display': 'inline-block', 'margin-right': '5%'}
        ),

        dcc.Dropdown(
            id="y-variable-selector",
            options=[{'label': var.replace('_', ' ').capitalize(), 'value': var} for var in variables],
            value='gdp',  # Valor por defecto en eje Y
            style={'width': '45%', 'display': 'inline-block'}
        )
    ], style={'width': '70%', 'margin': 'auto', 'padding': '10px'}),

    # Slider para seleccionar el número de clusters
    html.Div([
        dcc.Slider(
            id="cluster-slider",
            min=2,
            max=10,
            step=1,
            value=3,  # Valor inicial de clusters
            marks={i: str(i) for i in range(2, 11)},
            tooltip={"placement": "bottom", "always_visible": True}
        )
    ], style={'width': '50%', 'margin': 'auto', 'padding': '20px'}),

    # Gráfico de clustering
    dcc.Graph(id="cluster-graph")
])

# Función para obtener la URL de la bandera de un país
def get_flag_url(alpha2_code):
    if pd.isnull(alpha2_code):
        alpha2_code = "un"
    return f"https://flagcdn.com/w40/{alpha2_code.lower()}.png"

# Callback para actualizar el gráfico de clustering
@app.callback(
    Output("cluster-graph", "figure"),
    [Input("x-variable-selector", "value"),
     Input("y-variable-selector", "value"),
     Input("cluster-slider", "value")]
)
def update_clusters(x_var, y_var, n_clusters):
    # Filtrar datos por las variables seleccionadas y normalizar
    data = df_countries[['country', 'country_code_2', x_var, y_var]].dropna()
    scaler = StandardScaler()
    X = scaler.fit_transform(data[[x_var, y_var]])

    # Aplicar K-Means clustering
    kmeans = KMeans(n_clusters=n_clusters, random_state=42)
    data['cluster'] = kmeans.fit_predict(X)

    # Obtener banderas
    data['flag_url'] = data['country_code_2'].apply(get_flag_url)

    # Crear gráfico de dispersión interactivo con banderas
    fig = px.scatter(
        data, 
        x=x_var, 
        y=y_var, 
        color=data['cluster'].astype(str), 
        title=f"Clustering de países basado en {x_var.replace('_', ' ').capitalize()} y {y_var.replace('_', ' ').capitalize()}",
        labels={x_var: x_var.replace('_', ' ').capitalize(), 
                y_var: y_var.replace('_', ' ').capitalize(), 
                'cluster': 'Cluster'},
        hover_name='country',
        hover_data={'country': True, x_var: True, y_var: True, 'cluster': True},
        color_discrete_sequence=px.colors.qualitative.Pastel
    )

    # Agregar imágenes de banderas en el gráfico
    for i, row in data.iterrows():
        fig.add_layout_image(
            dict(
                source=row['flag_url'],
                x=row[x_var], y=row[y_var],
                xref="x", yref="y",
                sizex=0.05, sizey=0.05,
                xanchor="center", yanchor="middle",
            )
        )

    fig.update_layout(height=600, width=900, template="plotly_white")

    return fig

# Ejecutar la aplicación
app.run(jupyter_mode="inline", port=8055, debug="True")
