In [1]:


import pandas as pd
import geopandas as gpd
import plotly.express as px

from jupyter_dash import JupyterDash
import dash_core_components as dcc
import dash_html_components as html
from dash.dependencies import Input, Output

# Reemplaza con tu token de acceso de Mapbox
mapbox_access_token = "pk.eyJ1IjoiaW5mYW50ZXNyb21lcm9hZHJpYW4iLCJhIjoiY2xncXAyOXZmMHJuZjNxbW0yZmM2dTAyayJ9.qqmlPTzwF0bNcuaHd3FzHQ"

# Cargar datos de ejemplo con información de países
url = "https://raw.githubusercontent.com/plotly/datasets/master/2014_world_gdp_with_codes.csv"
df = pd.read_csv(url)

# Leer geometría de países
world = gpd.read_file(gpd.datasets.get_path('naturalearth_lowres'))

# Unir datos de países con geometría de países
merged = world.merge(df, left_on='iso_a3', right_on='CODE')

# Crear la aplicación de Jupyter Dash
app = JupyterDash(__name__)

# Definir la estructura de la aplicación
app.layout = html.Div([
    html.H1("Mapa de países"),
    dcc.Dropdown(
        id="country-dropdown",
        options=[{"label": country, "value": code} for country, code in df[["COUNTRY", "CODE"]].values],
        value="USA",
        placeholder="Selecciona un país",
    ),
    dcc.Graph(id="country-map")
])

# Definir la función de actualización
@app.callback(
    Output("country-map", "figure"),
    [Input("country-dropdown", "value")]
)
def update_map(selected_country_code):
    # Obtener las coordenadas del país seleccionado
    country_data = merged[merged["CODE"] == selected_country_code]
    center_lat, center_lon = country_data.geometry.centroid.y.values[0], country_data.geometry.centroid.x.values[0]

    # Crear un mapa centrado en el país seleccionado
    fig = px.scatter_mapbox(
        country_data,
        lat=[center_lat],
        lon=[center_lon],
        hover_name="COUNTRY",
        zoom=3,
        height=600
    )

    fig.update_layout(
        mapbox_style="dark",  # Aquí puedes cambiar el estilo del mapa. Ejemplos: "streets", "outdoors", "light", "dark", "satellite", "satellite-streets"
        mapbox_accesstoken=mapbox_access_token,
        showlegend=False,
        margin={"r": 0, "t": 0, "l": 0, "b": 0},
        title_text=f"País seleccionado: {selected_country_code}",
    )

    fig.update_traces(marker=dict(size=15, color="red"))

    return fig

# Ejecutar la aplicación
app.run_server(mode="inline")

The dash_core_components package is deprecated. Please replace
`import dash_core_components as dcc` with `from dash import dcc`
  import dash_core_components as dcc
The dash_html_components package is deprecated. Please replace
`import dash_html_components as html` with `from dash import html`
  import dash_html_components as html


Dash is running on http://127.0.0.1:8050/



Vamos a crear una app de dash con las siguientes características:

- Un dropdown con los nombres de los paises del mundo
- Un gráfico de barras con datos del csv y poder seleccionar la característica que queremos ver con otro dropdown

In [None]:
# Comenzamos leyendo los datos del csv:

import pandas as pd

df = pd.read_csv('Data/countries of the world.csv')
df.head()

In [None]:
df.columns

In [None]:
import pandas as pd
import plotly.express as px

from jupyter_dash import JupyterDash
import dash_core_components as dcc
import dash_html_components as html
from dash.dependencies import Input, Output

# Cargar datos de países
country_data = pd.read_csv("Data/countries of the world.csv")

# Crear la aplicación de Jupyter Dash
app = JupyterDash(__name__)

# Definir la estructura de la aplicación
app.layout = html.Div([
    html.H1("Información de países"),
    dcc.Dropdown(
        id="country-dropdown",
        options=[{"label": country, "value": country} for country in country_data["Country"]],
        value="United States",
        placeholder="Selecciona un país",
        multi=True
    ),
    dcc.Dropdown(
        id="feature-dropdown",
        options=[{"label": feature, "value": feature} for feature in country_data.columns[2:]],
        value="Population",
        placeholder="Selecciona una característica",
    ),
    dcc.Graph(id="bar-chart")
])

# Definir la función de actualización para el gráfico de barras
@app.callback(
    Output("bar-chart", "figure"),
    [Input("country-dropdown", "value"),
     Input("feature-dropdown", "value")]
)
def update_bar_chart(selected_countries, selected_feature):
    if selected_countries:
        data = country_data[country_data["Country"].isin(selected_countries)]
    else:
        data = country_data

    # Crear un gráfico de barras con información de la característica seleccionada
    fig = px.bar(
        data,
        x="Country",
        y=selected_feature,
        text=selected_feature,
        height=400
    )

    fig.update_traces(texttemplate='%{text:.2s}', textposition='outside')
    fig.update_layout(
        xaxis=dict(title="Países"),
        yaxis=dict(title=selected_feature),
        title_text=f"{selected_feature} de los países seleccionados",
        uniformtext_minsize=8,
        uniformtext_mode='hide',
        margin={"r": 0, "t": 40, "l": 0, "b": 0},
    )

    return fig

# Ejecutar la aplicación
app.run_server(mode="inline")


# Ejercicio 2:

- Crea una app de dash con un dropdown con los nombres de los paises del mundo, donde podamos ver con un scatter plot la relación entre la población y la esperanza de vida de cada país.

In [None]:
import pandas as pd
import plotly.express as px

from jupyter_dash import JupyterDash
import dash_core_components as dcc
import dash_html_components as html
from dash.dependencies import Input, Output

# Cargar datos de países
country_data = pd.read_csv("Data/countries of the world.csv")

# Crear la aplicación de Jupyter Dash
app = JupyterDash(__name__)

# Definir la estructura de la aplicación
app.layout = html.Div([
    html.H1("Información de países"),
    dcc.Dropdown(
        id="country-dropdown",
        options=[{"label": country, "value": country} for country in country_data["Country"]],
        value="United States",
        placeholder="Selecciona un país",
        multi=True
    ),
    dcc.Dropdown(
        id="feature-dropdown",
        options=[{"label": feature, "value": feature} for feature in ["Population", "Life_expectancy"]],
        value="Population",
        placeholder="Selecciona una característica",
    ),
    dcc.Graph(id="scatter-plot")
])

# Definir la función de actualización para el gráfico de dispersión
@app.callback(
    Output("scatter-plot", "figure"),
    [Input("country-dropdown", "value"),
     Input("feature-dropdown", "value")]
)
def update_scatter_plot(selected_country, selected_feature):
    if selected_country:
        data = country_data[country_data["Country"].isin(selected_country)]
    else:
        data = country_data

    fig = px.scatter(
        data,
        x="Population",
        y=selected_feature,
        text="Country",
        height=400
    )

    fig.update_traces(textposition='top center')
    fig.update_layout(
        xaxis=dict(title="Población"),
        yaxis=dict(title=selected_feature),
        title_text=f"Relación entre la población y {selected_feature} de los países seleccionados",
        uniformtext_minsize=8,
        uniformtext_mode='hide',
        margin={"r": 0, "t": 40, "l": 0, "b": 0},
    )

    return fig

# Ejecutar la aplicación
app.run_server(mode="inline")


# Ejercicio 3:

- Crea un graficos de plotly donde veamos la evolucion de la natalidad en España:

In [1]:
import pandas as pd
import plotly.express as px

In [2]:

data = pd.read_csv('Data/España_natalidad.csv', sep=';')
data

Unnamed: 0,Comunidades y Ciudades Autónomas,Nacionalidad,Periodo,Total
0,Total Nacional,Ambas nacionalidades,2021,712
1,Total Nacional,Ambas nacionalidades,2020,719
2,Total Nacional,Ambas nacionalidades,2019,762
3,Total Nacional,Ambas nacionalidades,2018,794
4,Total Nacional,Ambas nacionalidades,2017,841
...,...,...,...,...
1195,19 Melilla,Extranjera,2006,6633
1196,19 Melilla,Extranjera,2005,6404
1197,19 Melilla,Extranjera,2004,6946
1198,19 Melilla,Extranjera,2003,7298


In [3]:
data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1200 entries, 0 to 1199
Data columns (total 4 columns):
 #   Column                            Non-Null Count  Dtype 
---  ------                            --------------  ----- 
 0   Comunidades y Ciudades Autónomas  1200 non-null   object
 1   Nacionalidad                      1200 non-null   object
 2   Periodo                           1200 non-null   int64 
 3   Total                             1200 non-null   object
dtypes: int64(1), object(3)
memory usage: 37.6+ KB


In [4]:
data['Periodo'].value_counts()

2021    60
2020    60
2003    60
2004    60
2005    60
2006    60
2007    60
2008    60
2009    60
2010    60
2011    60
2012    60
2013    60
2014    60
2015    60
2016    60
2017    60
2018    60
2019    60
2002    60
Name: Periodo, dtype: int64

In [5]:
# Convertimos la columan Total a float

data['Total'] = data['Total'].str.replace(',', '.').astype(float)
data

Unnamed: 0,Comunidades y Ciudades Autónomas,Nacionalidad,Periodo,Total
0,Total Nacional,Ambas nacionalidades,2021,7.12
1,Total Nacional,Ambas nacionalidades,2020,7.19
2,Total Nacional,Ambas nacionalidades,2019,7.62
3,Total Nacional,Ambas nacionalidades,2018,7.94
4,Total Nacional,Ambas nacionalidades,2017,8.41
...,...,...,...,...
1195,19 Melilla,Extranjera,2006,66.33
1196,19 Melilla,Extranjera,2005,64.04
1197,19 Melilla,Extranjera,2004,69.46
1198,19 Melilla,Extranjera,2003,72.98


In [6]:
# Vamos a crear un gráfico de lineas con plotly para ver la evolución de la natalidad en España


data['Periodo'].value_counts()

2021    60
2020    60
2003    60
2004    60
2005    60
2006    60
2007    60
2008    60
2009    60
2010    60
2011    60
2012    60
2013    60
2014    60
2015    60
2016    60
2017    60
2018    60
2019    60
2002    60
Name: Periodo, dtype: int64

In [8]:
# Ahora vamos a crear un gráfico e barras por cada nacionalidad para ver la evolución de la natalidad en España

fig = px.bar(data, x='Periodo', y='Total', color='Nacionalidad', barmode='group')
fig.show()

# Ejercicio 4:

Vamos a crear un grafico scatter plot con plotly donde vamos a poder ver la correlación entre el crecimiento de la población española vs el crecimiento de la población mundial.

In [17]:
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go

# Cargamos los datos de la población española

data = pd.read_csv('Data/España_natalidad.csv', sep=';')
data

Unnamed: 0,Comunidades y Ciudades Autónomas,Nacionalidad,Periodo,Total
0,Total Nacional,Ambas nacionalidades,2021,712
1,Total Nacional,Ambas nacionalidades,2020,719
2,Total Nacional,Ambas nacionalidades,2019,762
3,Total Nacional,Ambas nacionalidades,2018,794
4,Total Nacional,Ambas nacionalidades,2017,841
...,...,...,...,...
1195,19 Melilla,Extranjera,2006,6633
1196,19 Melilla,Extranjera,2005,6404
1197,19 Melilla,Extranjera,2004,6946
1198,19 Melilla,Extranjera,2003,7298


In [2]:
# Convertimos la columan Total a float

data['Total'] = data['Total'].str.replace(',', '.').astype(float)

In [3]:
data['Nacionalidad'].value_counts()

Ambas nacionalidades    400
Española                400
Extranjera              400
Name: Nacionalidad, dtype: int64

In [4]:
# Creamos una variable donde aislemos la población española

poblacion_española = data[data['Nacionalidad'] == 'Española']
poblacion_española

Unnamed: 0,Comunidades y Ciudades Autónomas,Nacionalidad,Periodo,Total
20,Total Nacional,Española,2021,6.31
21,Total Nacional,Española,2020,6.28
22,Total Nacional,Española,2019,6.65
23,Total Nacional,Española,2018,7.01
24,Total Nacional,Española,2017,7.53
...,...,...,...,...
1175,19 Melilla,Española,2006,11.72
1176,19 Melilla,Española,2005,11.10
1177,19 Melilla,Española,2004,11.57
1178,19 Melilla,Española,2003,12.10


In [5]:
# Agrupamos los datos por año y sumamos la población

natalidad_española = poblacion_española.groupby('Periodo')['Total'].sum().reset_index()
natalidad_española

Unnamed: 0,Periodo,Total
0,2002,189.8
1,2003,194.58
2,2004,194.28
3,2005,194.34
4,2006,195.92
5,2007,193.68
6,2008,199.14
7,2009,190.07
8,2010,186.9
9,2011,182.96


In [6]:
# Creamos la variable donde vamos a guardar los datos de la población mundial

poblacion_mundial = data[data['Nacionalidad'] == 'Extranjera']
poblacion_mundial

Unnamed: 0,Comunidades y Ciudades Autónomas,Nacionalidad,Periodo,Total
40,Total Nacional,Extranjera,2021,13.51
41,Total Nacional,Extranjera,2020,14.39
42,Total Nacional,Extranjera,2019,15.72
43,Total Nacional,Extranjera,2018,16.27
44,Total Nacional,Extranjera,2017,16.75
...,...,...,...,...
1195,19 Melilla,Extranjera,2006,66.33
1196,19 Melilla,Extranjera,2005,64.04
1197,19 Melilla,Extranjera,2004,69.46
1198,19 Melilla,Extranjera,2003,72.98


In [7]:
# Agrupamos los datos por año y sumamos la población

natalidad_mundial = poblacion_mundial.groupby('Periodo')['Total'].sum().reset_index()
natalidad_mundial

Unnamed: 0,Periodo,Total
0,2002,470.0
1,2003,475.3
2,2004,478.41
3,2005,446.88
4,2006,452.93
5,2007,454.8
6,2008,487.67
7,2009,448.13
8,2010,441.09
9,2011,407.08


In [12]:
# Combinar los DataFrames de natalidad_espanola y poblacion_general:

datos_correlacion = natalidad_española.merge(natalidad_mundial, on='Periodo', suffixes=('_natalidad_espanola', '_poblacion_general'))
datos_correlacion

Unnamed: 0,Periodo,Total_natalidad_espanola,Total_poblacion_general
0,2002,189.8,470.0
1,2003,194.58,475.3
2,2004,194.28,478.41
3,2005,194.34,446.88
4,2006,195.92,452.93
5,2007,193.68,454.8
6,2008,199.14,487.67
7,2009,190.07,448.13
8,2010,186.9,441.09
9,2011,182.96,407.08


In [23]:
# Creamos el gráfico de dispersión

# Crear la traza de natalidad española
trace_natalidad_española = go.Scatter(
    x=natalidad_española['Periodo'],
    y=natalidad_española['Total'],
    mode='markers',
    name='Natalidad Española',
    marker=dict(color='red')
)

# Crear la traza de población general
trace_poblacion_mundial = go.Scatter(
    x=poblacion_mundial['Periodo'],
    y=poblacion_mundial['Total'],
    mode='markers',
    name='Población General',
    marker=dict(color='blue')
)

# Combinar las trazas en un solo gráfico
data = [trace_natalidad_española, trace_poblacion_mundial]

# Definir el diseño del gráfico
layout = go.Layout(
    title='Correlación entre la natalidad española y la población general',
    xaxis=dict(title='Período'),
    yaxis=dict(title='Total')
)

# Crear el objeto Figure con los datos y el diseño
fig = go.Figure(data=data, layout=layout)

# Mostrar el gráfico
fig.show()


In [None]:
# Ejercicio 5: Vamos a combinar 2 tipos de graficos en un mismo dashboard

In [24]:
datos = {
    'periodo': [2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018, 2019],
    'natalidad_espanola': [1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900],
    'poblacion_general': [40000, 41000, 42000, 43000, 44000, 45000, 46000, 47000, 48000, 49000],
}

df = pd.DataFrame(datos)
df

Unnamed: 0,periodo,natalidad_espanola,poblacion_general
0,2010,1000,40000
1,2011,1100,41000
2,2012,1200,42000
3,2013,1300,43000
4,2014,1400,44000
5,2015,1500,45000
6,2016,1600,46000
7,2017,1700,47000
8,2018,1800,48000
9,2019,1900,49000


In [25]:
# Crear la traza del gráfico de barras para natalidad española
trace_natalidad_espanola = go.Bar(
    x=df['periodo'],
    y=df['natalidad_espanola'],
    name='Natalidad Española',
    marker=dict(color='red')
)

# Crear la traza del gráfico de línea para población general
trace_poblacion_general = go.Scatter(
    x=df['periodo'],
    y=df['poblacion_general'],
    mode='lines+markers',
    name='Población General',
    marker=dict(color='blue')
)

# Combinar las trazas en un solo gráfico
data = [trace_natalidad_espanola, trace_poblacion_general]

# Definir el diseño del gráfico
layout = go.Layout(
    title='Natalidad Española y Población General',
    xaxis=dict(title='Período'),
    yaxis=dict(title='Total')
)

# Crear el objeto Figure con los datos y el diseño
fig = go.Figure(data=data, layout=layout)

# Mostrar el gráfico
fig.show()
