<a href="https://colab.research.google.com/github/patricialuca/visualizacion/blob/main/Luengo_Carretero_Patricia_PEC3.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **¿Un incremento en la población es indicador de un incremento en esperanza de vida?**

In [2]:
import pandas as pd
import plotly.express as px
import matplotlib.pyplot as plt

Analizamos el sencillo dataset de gapminder que recoge datos de la población mundial distribuida por paises y continentes, además de contener datos de esperanza de vida y renta per cápita.

Creamos en primer lugar una animación de como ha ido incrementandose la población en función de los continentes.

In [33]:
df=px.data.gapminder()
df.head()

Unnamed: 0,country,continent,year,lifeExp,pop,gdpPercap,iso_alpha,iso_num
0,Afghanistan,Asia,1952,28.801,8425333,779.445314,AFG,4
1,Afghanistan,Asia,1957,30.332,9240934,820.85303,AFG,4
2,Afghanistan,Asia,1962,31.997,10267083,853.10071,AFG,4
3,Afghanistan,Asia,1967,34.02,11537966,836.197138,AFG,4
4,Afghanistan,Asia,1972,36.088,13079460,739.981106,AFG,4


In [34]:
fig = px.bar(df, y="continent", x='pop', animation_frame="year", orientation='h', range_x=[0, 4000000000], color="continent")
fig.update_layout(width=1000,
                  height=800,
                  xaxis_showgrid=False,
                  yaxis_showgrid=False,
                  paper_bgcolor='rgba(0,0,0,0)',
                  plot_bgcolor='rgba(0,0,0,0)',
                  title_text='Evolución de la población por continente',
                  showlegend=False)
fig.update_xaxes(title_text='Población')
fig.update_yaxes(title_text='')
fig.show()

En esta animación vemos como Europa parece ser quien menos incremento en su población ha experimentado desde 1952 hasta 2007, en comparación con Asia donde el incremento ha sido enorme.

Vamos a tomar solo el continente asiático para seguir indagando entre los datos de población, renta per cápita y esperanza de vida.

In [35]:
df_asia = df[df['continent'] == 'Asia']
df_asia.describe()

Unnamed: 0,year,lifeExp,pop,gdpPercap,iso_num
count,396.0,396.0,396.0,396.0,396.0
mean,1979.5,60.064903,77038720.0,7902.150428,404.666667
std,17.282097,11.864532,206885200.0,14045.373112,224.656047
min,1952.0,28.801,120447.0,331.0,4.0
25%,1965.75,51.42625,3844393.0,1056.993223,275.0
50%,1979.5,61.7915,14530830.0,2646.786844,400.0
75%,1993.25,69.50525,46300350.0,8549.255654,524.0
max,2007.0,82.603,1318683000.0,113523.1329,887.0


Si ponemos el foco en Asia y como ha ido incrementandóse la población en cada uno de los países vemos que la mayor variación se ha producido en China.

In [41]:
fig = px.bar(df_asia, y="country", x='pop', animation_frame="year", orientation='h', range_x=[0, 1400000000], color="country")
fig.update_layout(width=1000,
                  height=700,
                  xaxis_showgrid=False,
                  yaxis_showgrid=False,
                  paper_bgcolor='rgba(0,0,0,0)',
                  plot_bgcolor='rgba(0,0,0,0)',
                  title_text='Evolución de la población por pais',
                  showlegend=False)
fig.update_xaxes(title_text='Población')
fig.update_yaxes(title_text='')
fig.show()

In [42]:
import plotly.graph_objects as go

df_china = df_asia[df_asia['country'] == 'China']
df_total_poblacion_china = df_china.groupby('year')['pop'].sum().reset_index()
df_total_poblacion_china =df_total_poblacion_china.sort_values('year')

Frame_1 = []

year_list = [1952]
pop_list = [0]

for ind, df_r in df_total_poblacion_china.iterrows():
    year_list.append(df_r["year"])
    pop_list.append(df_r["pop"])
    Frame_1.append(go.Frame(data=[go.Scatter(x=year_list, y=pop_list, mode="lines")]))

fig = go.Figure(
    data=[go.Scatter(x=[1952, 1952], y=[0, 0])],
    layout=go.Layout(
        xaxis=dict(range=[1952, 2007], autorange=False),
        yaxis=dict(range=[0, df_total_poblacion_china['pop'].max()], autorange=False),
        title="Evolución de la Población en China (1952-2007)",
        updatemenus=[dict(
            type="buttons",
            buttons=[dict(label="Play",
                          method="animate",
                          args=[None, dict(frame=dict(duration=500, redraw=True), fromcurrent=True)])]
        )]
    ),
    frames=Frame_1
)

fig.show()

¿Este incremento en la población China será un indicador de que su esperanza de vida también se ha incrementado?

Ahora analizaremos en global la relación entre la población, la renta per cápita y la esperanza de vida.

In [38]:
fig=px.scatter(df_asia,
           x='gdpPercap',
           y='lifeExp',
           size='pop',
           color='country',
           log_x=True,
           animation_frame='year',
           animation_group='country',
           size_max=55,
           range_x=[100,120000],
           range_y=[20,100],
           hover_name='country')

fig.update_layout(width=1200,
                  height=800,
                  xaxis_showgrid=False,
                  yaxis_showgrid=False,
                  paper_bgcolor='rgba(0,0,0,0)',
                  plot_bgcolor='rgba(0,0,0,0)',
                  title_text='Evolución de la esperanza de vida por pais en Asia')
fig.update_xaxes(title_text='Esperanza de vida')
fig.update_yaxes(title_text='Renta per cápita')
fig.show()

Vemos que paises como China e India han incrementado mucho su población a lo largo de los años y también lo ha hecho su esperanza de vida, sin embargo, paises como Japon e Irán que no han incrementado en esos niveles su población si que también han dado un salto cuantitativo en cuanto al incremento en su esperanza de vida, esto se debe, al incremento en la renta per cápita.

Para ver mejor el efecto vamos a poner el foco en estos cuatro países con esta última visualización.

In [43]:
countries = ['China', 'India', 'Japan', 'Iran']
sel = df[df['country'].isin(countries)]
fig = px.scatter(sel, x='gdpPercap', y='lifeExp', color='country', size='pop', size_max=60,
                hover_name='country', facet_col='country', log_x=True)
fig.show()