# TRABAJO PRACTICO NRO. 2
## ANALISIS DE COMPARACION DE INDICADORES POR PAISES. 

Gente querida,

Al final de la clase pasada, les presenté nuestro próximo desafío: un DataSet enorme con decenas de indicadores de calidad de vida tabulados en los últimos 60 años por la ONU para todos los países del mundo!! Hay allí como para hacer dulce... un conjunto de datos súper interesante! Pero además, propone ciertos desafíos. A continuación van algunas consideraciones:

 

Material a trabajar para nuestra próximo encuentro

El DataSet completo pueden descargarlo de este link:
https://mega.nz/file/gx00xSpb#IwxEcT72T-eUhMGZARN7lyiG-zOcwBECE3rz3Mw_YT8

Como verán, tienen información distribuida en diferentes archivos .CSV: Sólo uno contiene los datos a analizar (HNP_StatsData.csv) y el resto contienen información que nos permite entender lo que leemos allí... Hay referencias sobre los indicadores tabulados, su significado y su manera de cálculo; referencias sobre los países y qué datos se disponen para cada país, etc... Deberán mirar cada tabla para entender su estructura y la información que nos aporta.

Puntualmente, para este DataSet, tengo la intención que puedan poner en práctica las herramientas específicas de pandas para poder manipular datos en columnas, ya que habitualmente los habríamos encontrado en filas con la clave: {"Country Code","Indicator Code","Year"}

 

Un Tip para tener presente: vean el método .melt de pandas... les permitirá acomodar los datos, trasponiendo "sólo las columnas necesarias"!! Pueden dejar la clave que identifica al país e indicador que nos interesa, y agregar una columna para el año y otra para el valor registrado en dicha posición!

 

Tener en cuenta la siguiente pauta para el trabajo:

1. Considerar los siguientes índices ** :

* SP.DYN.CBRT.IN
* SP.DYN.LE00.IN
* HD.HCI.OVRL
* NY.GNP.PCAP.CD

Averiguar a qué se refiere cada uno de ellos...

2. Quedarnos sólo con las filas del DataSet principal que contienen los datos indicados.

3. Establecer una “comparativa gráfica” de Argentina respecto de otros países para estos indicadores… Habrá que bucear un poco en los datos para ver qué y cómo pueden comparar. También deberemos elegir contra qué países comparar en función de lo que nos interese observar: deberá cada uno justificar su elección.

4. Procurar establecer una suerte de correlación “visual” entre ellos. Por ejemplo, me parece que puede ser interesante revisar los primeros dos respecto del tercero (Tasa de Natalidad y Mortalidad vs Índice de Capital Humano); o también entre el tercero y el cuarto (Índice de Capital Humano vs. Ingreso Bruto per Cápita).

 

Finalmente, a lo anterior agregar un último desafío: puede ser de difícil lectura una gráfica que incluya tantas columnas de datos… estamos hablando de casi 60! Una lectura visualmente más abarcable puede lograrse si recortamos en periodos más grandes, como por ejemplo, por lustros (agrupando o tomando información cada 5 años). Ya tienen las herramientas para generar esto también!

Deseándoles una linda semana, los saludo con un abrazo!!

## Empezamos.

Lo primero que hacemos es cargar las librerias con las que vamos a trabajar. 

In [1]:
import numpy as np 
import pandas as pd 
import plotly.express as px
from plotly.offline import plot 
import pycountry

#### Cargamos el el archivo con los datos.

In [2]:
df = pd.read_csv("data/HNP_StatsData.csv")

Elimino la ultima columna que no vamos a utilizar. 

In [3]:
df = df.drop([r"Unnamed: 65"], axis = 1)

Para poder trabajar mejor con el dataframe decidi cambiarle el nombre a las columnas por los siguientes nombres. 
* Country Name: pais
* Country Code: codigo_pais
* Indicator Name : indicador
* Indicator Code : codigo_indicador

In [4]:
df = df.rename(columns= {'Country Name': 'pais', 'Country Code': 'codigo_pais', 
                         'Indicator Name': 'indicador', 'Indicator Code':'codigo_indicador'})

Creo un nuevo data frame donde van a estar los paises con los que vamos a trabajar y los indicadores que vamos a usar. 

In [56]:
df1 = pd.DataFrame()
df1 = df[df["codigo_pais"].isin(['ARG','CHL','BRA','FRA','NZL','CAN'])]
df1 = df1[df1["codigo_indicador"].isin(["SP.DYN.CBRT.IN","SP.DYN.LE00.IN","HD.HCI.OVRL","NY.GNP.PCAP.CD"])]

In [6]:
df1

Unnamed: 0,pais,codigo_pais,indicador,codigo_indicador,1960,1961,1962,1963,1964,1965,...,2011,2012,2013,2014,2015,2016,2017,2018,2019,2020
20401,Argentina,ARG,"Birth rate, crude (per 1,000 people)",SP.DYN.CBRT.IN,23.775,23.569,23.372,23.191,23.033,22.909,...,18.055,17.949,17.831,17.698,17.548,17.383,17.205,17.021,,
20453,Argentina,ARG,"GNI per capita, Atlas method (current US$)",NY.GNP.PCAP.CD,,,,,1120.0,1230.0,...,10710.0,11870.0,12840.0,12330.0,12570.0,12220.0,13120.0,12390.0,11200.0,
20455,Argentina,ARG,Human capital index (HCI) (scale 0-1),HD.HCI.OVRL,,,,,,,...,,,,,,,0.611,0.617367,,0.602145
20483,Argentina,ARG,"Life expectancy at birth, total (years)",SP.DYN.LE00.IN,65.055,65.176,65.269,65.348,65.426,65.518,...,75.439,75.598,75.756,75.913,76.068,76.221,76.372,76.52,,
28286,Brazil,BRA,"Birth rate, crude (per 1,000 people)",SP.DYN.CBRT.IN,42.28,41.932,41.481,40.914,40.234,39.453,...,15.11,14.93,14.772,14.624,14.472,14.307,14.125,13.924,,
28338,Brazil,BRA,"GNI per capita, Atlas method (current US$)",NY.GNP.PCAP.CD,,,,,,,...,11080.0,12310.0,12790.0,12120.0,10190.0,8920.0,8700.0,9080.0,9130.0,
28340,Brazil,BRA,Human capital index (HCI) (scale 0-1),HD.HCI.OVRL,,,,,,,...,,,,,,,0.56,0.545724,,0.551498
28368,Brazil,BRA,"Life expectancy at birth, total (years)",SP.DYN.LE00.IN,54.143,54.634,55.13,55.627,56.121,56.61,...,73.921,74.209,74.483,74.745,74.994,75.23,75.456,75.672,,
32021,Canada,CAN,"Birth rate, crude (per 1,000 people)",SP.DYN.CBRT.IN,26.7,26.0,25.2,24.6,23.4,21.3,...,11.0,11.0,10.8,10.8,10.7,10.6,10.3,10.1,,
32073,Canada,CAN,"GNI per capita, Atlas method (current US$)",NY.GNP.PCAP.CD,,,,,,,...,47180.0,51000.0,52770.0,52180.0,47570.0,43870.0,42990.0,45000.0,46370.0,


In [7]:
#df1.info()

### Empezamos el analisis con el primer indicador "SP.DYN.CBRT.IN".

Este indicador es sobre la tasa de natalidad, bruta (por cada 1000 personas)


In [57]:
#Genero un nuevo df con lo que vamos a trabajar. 
df_natalidad = pd.DataFrame()
df_natalidad = df1[df1["codigo_indicador"].isin(["SP.DYN.CBRT.IN"])]
años = df_natalidad.columns[4:63]
años
df_natalidad

Unnamed: 0,pais,codigo_pais,indicador,codigo_indicador,1960,1961,1962,1963,1964,1965,...,2011,2012,2013,2014,2015,2016,2017,2018,2019,2020
20401,Argentina,ARG,"Birth rate, crude (per 1,000 people)",SP.DYN.CBRT.IN,23.775,23.569,23.372,23.191,23.033,22.909,...,18.055,17.949,17.831,17.698,17.548,17.383,17.205,17.021,,
28286,Brazil,BRA,"Birth rate, crude (per 1,000 people)",SP.DYN.CBRT.IN,42.28,41.932,41.481,40.914,40.234,39.453,...,15.11,14.93,14.772,14.624,14.472,14.307,14.125,13.924,,
32021,Canada,CAN,"Birth rate, crude (per 1,000 people)",SP.DYN.CBRT.IN,26.7,26.0,25.2,24.6,23.4,21.3,...,11.0,11.0,10.8,10.8,10.7,10.6,10.3,10.1,,
34096,Chile,CHL,"Birth rate, crude (per 1,000 people)",SP.DYN.CBRT.IN,35.556,35.108,34.588,33.994,33.332,32.614,...,14.463,14.258,14.002,13.7,13.369,13.031,12.711,12.428,,
45716,France,FRA,"Birth rate, crude (per 1,000 people)",SP.DYN.CBRT.IN,18.7,18.7,18.6,18.5,18.4,18.2,...,12.7,12.6,12.4,12.4,12.0,11.8,11.5,11.3,,
76011,New Zealand,NZL,"Birth rate, crude (per 1,000 people)",SP.DYN.CBRT.IN,26.5,27.1,26.2,25.5,24.2,22.9,...,14.0,13.87,13.2,12.68,13.27,12.65,12.43,11.98,,


Para poder experesar los datos que tenemos sobre la tasa de natalidad, invertimos el data frame.

In [58]:
#Aplico el metodo melt para acomodar los columnas como corresponden
df_natalidad = pd.melt(df_natalidad, id_vars= ['pais','codigo_indicador'], value_vars = años, 
                       var_name = 'años',value_name= 'tasa_natalidad')

In [10]:
df_natalidad

Unnamed: 0,pais,codigo_indicador,años,tasa_natalidad
0,Argentina,SP.DYN.CBRT.IN,1960,23.775
1,Brazil,SP.DYN.CBRT.IN,1960,42.280
2,Canada,SP.DYN.CBRT.IN,1960,26.700
3,Chile,SP.DYN.CBRT.IN,1960,35.556
4,France,SP.DYN.CBRT.IN,1960,18.700
...,...,...,...,...
349,Brazil,SP.DYN.CBRT.IN,2018,13.924
350,Canada,SP.DYN.CBRT.IN,2018,10.100
351,Chile,SP.DYN.CBRT.IN,2018,12.428
352,France,SP.DYN.CBRT.IN,2018,11.300


Generamos una funcion que nos permite, utilizando la biblioteca pycountry, que nos permite obtener las coordenadas geograficas de los paices con los que vamos a trabajar y luego de eso lo aplicamos a una columna de nuestro data frame. 

In [70]:
def get_alpha_3(location):
    try:
        return pycountry.countries.get(name = location).alpha_3
    except: 
        return None
df_natalidad['coordenadas']= df_natalidad['pais'].apply(lambda x: get_alpha_3(x))
df_natalidad

Unnamed: 0,pais,codigo_indicador,años,tasa_natalidad,coordenadas
0,Argentina,SP.DYN.CBRT.IN,1960,23.775,ARG
1,Brazil,SP.DYN.CBRT.IN,1960,42.280,BRA
2,Canada,SP.DYN.CBRT.IN,1960,26.700,CAN
3,Chile,SP.DYN.CBRT.IN,1960,35.556,CHL
4,France,SP.DYN.CBRT.IN,1960,18.700,FRA
...,...,...,...,...,...
349,Brazil,SP.DYN.CBRT.IN,2018,13.924,BRA
350,Canada,SP.DYN.CBRT.IN,2018,10.100,CAN
351,Chile,SP.DYN.CBRT.IN,2018,12.428,CHL
352,France,SP.DYN.CBRT.IN,2018,11.300,FRA


#### Graficos.

Mostramos los graficos con la informacion del data frame de natalidad. 

In [60]:
fig = px.line(df_natalidad,x = df_natalidad.años, y = df_natalidad.tasa_natalidad, color =df_natalidad.pais,
             title = "Tasa de natalidad.")
fig.update_xaxes(rangeslider_visible=True)
fig.show()
#plot(fig)

In [61]:
fig0 = px.line_3d(df_natalidad,x = df_natalidad.años, y = df_natalidad.tasa_natalidad,z=df_natalidad.años,  color =df_natalidad.pais,
             title = "Tasa de natalidad.")
fig0.show()
#plot(fig0)

In [62]:
fig2 = px.choropleth(df_natalidad, locations = 'coordenadas', color = 'tasa_natalidad', hover_name='pais',
                     animation_frame = 'años', title= 'Evolución taza de natalidad.')
fig2.show()
#plot(fig2)

Lo que podemos apreciar en los graficos es lo siguiente:
* A medida que los años pasan se puede observar que la natalidad por cada mil personas va decreciendo. En algunos casos con mas fuerza que en otros. 
* Siempre los paices latinos estuvieron por ensima de Canada, Francia y Nueva Zelanda. 
* En America en los años 60s brasil estuvo a la cabeza con la mayor taza de natalidad seguido por Chile y despues Argentina. Pero por el año 2018 se ubico primero Argentina, luego Brasil y despues Chile.
 

## Empezamos el analisis con el segunod indicador SP.DYN.LE00.IN

Este indicador se vasa en la esperanza de vida al nacer, total (años)

In [63]:
#Genero un nuevo df con lo que vamos a trabajar. 
df_esper_vida = pd.DataFrame()
df_esper_vida = df1[df1["codigo_indicador"].isin(["SP.DYN.LE00.IN"])]
años1 = df_esper_vida.columns[4:63]
df_esper_vida

Unnamed: 0,pais,codigo_pais,indicador,codigo_indicador,1960,1961,1962,1963,1964,1965,...,2011,2012,2013,2014,2015,2016,2017,2018,2019,2020
20483,Argentina,ARG,"Life expectancy at birth, total (years)",SP.DYN.LE00.IN,65.055,65.176,65.269,65.348,65.426,65.518,...,75.439,75.598,75.756,75.913,76.068,76.221,76.372,76.52,,
28368,Brazil,BRA,"Life expectancy at birth, total (years)",SP.DYN.LE00.IN,54.143,54.634,55.13,55.627,56.121,56.61,...,73.921,74.209,74.483,74.745,74.994,75.23,75.456,75.672,,
32103,Canada,CAN,"Life expectancy at birth, total (years)",SP.DYN.LE00.IN,71.133171,71.346098,71.367073,71.380732,71.776341,71.872195,...,81.44878,81.64878,81.74878,81.8,81.9,81.9,81.94878,81.94878,,
34178,Chile,CHL,"Life expectancy at birth, total (years)",SP.DYN.LE00.IN,57.219,57.616,58.031,58.467,58.927,59.415,...,78.986,79.176,79.349,79.504,79.646,79.779,79.909,80.042,,
45798,France,FRA,"Life expectancy at birth, total (years)",SP.DYN.LE00.IN,69.868293,70.117073,70.314634,70.514634,70.663415,70.812195,...,82.114634,81.968293,82.219512,82.719512,82.321951,82.573171,82.57561,82.72439,,
76093,New Zealand,NZL,"Life expectancy at birth, total (years)",SP.DYN.LE00.IN,71.236585,70.985366,71.231707,71.280488,71.329268,71.226829,...,80.904878,81.156098,81.407317,81.404878,81.456829,81.612439,81.658537,81.858537,,


In [64]:
#Aplico el metodo melt para acomodar los columnas como corresponden
df_esper_vida = pd.melt(df_esper_vida, id_vars= ['pais','codigo_indicador'], value_vars = años, 
                       var_name = 'años',value_name= 'Esperanza_vida')
df_esper_vida.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 354 entries, 0 to 353
Data columns (total 4 columns):
 #   Column            Non-Null Count  Dtype  
---  ------            --------------  -----  
 0   pais              354 non-null    object 
 1   codigo_indicador  354 non-null    object 
 2   años              354 non-null    object 
 3   Esperanza_vida    354 non-null    float64
dtypes: float64(1), object(3)
memory usage: 11.2+ KB


In [17]:
df_esper_vida

Unnamed: 0,pais,codigo_indicador,años,Esperanza_vida
0,Argentina,SP.DYN.LE00.IN,1960,65.055000
1,Brazil,SP.DYN.LE00.IN,1960,54.143000
2,Canada,SP.DYN.LE00.IN,1960,71.133171
3,Chile,SP.DYN.LE00.IN,1960,57.219000
4,France,SP.DYN.LE00.IN,1960,69.868293
...,...,...,...,...
349,Brazil,SP.DYN.LE00.IN,2018,75.672000
350,Canada,SP.DYN.LE00.IN,2018,81.948780
351,Chile,SP.DYN.LE00.IN,2018,80.042000
352,France,SP.DYN.LE00.IN,2018,82.724390


In [65]:
def get_alpha_3(location):
    try:
        return pycountry.countries.get(name = location).alpha_3
    except: 
        return None
df_esper_vida['coordenadas']= df_esper_vida['pais'].apply(lambda x: get_alpha_3(x))
df_esper_vida

Unnamed: 0,pais,codigo_indicador,años,Esperanza_vida,coordenadas
0,Argentina,SP.DYN.LE00.IN,1960,65.055000,ARG
1,Brazil,SP.DYN.LE00.IN,1960,54.143000,BRA
2,Canada,SP.DYN.LE00.IN,1960,71.133171,CAN
3,Chile,SP.DYN.LE00.IN,1960,57.219000,CHL
4,France,SP.DYN.LE00.IN,1960,69.868293,FRA
...,...,...,...,...,...
349,Brazil,SP.DYN.LE00.IN,2018,75.672000,BRA
350,Canada,SP.DYN.LE00.IN,2018,81.948780,CAN
351,Chile,SP.DYN.LE00.IN,2018,80.042000,CHL
352,France,SP.DYN.LE00.IN,2018,82.724390,FRA


In [66]:
fig = px.line(df_esper_vida,x = df_esper_vida.años, y = df_esper_vida.Esperanza_vida, color =df_esper_vida.pais,
             title = "Taza de esperanza de vida.")
fig.update_xaxes(rangeslider_visible=True)
fig.show()
#plot(fig)

In [67]:
fig0 = px.line_3d(df_esper_vida,x = df_esper_vida.años, y = df_esper_vida.Esperanza_vida,z=df_esper_vida.años,  
                  color =df_esper_vida.pais,
             title = "Taza de esperanza de vida al nacer.")
fig0.show()
#plot(fig0)

In [68]:
fig2 = px.choropleth(df_esper_vida, locations = 'coordenadas', color = 'Esperanza_vida', hover_name='pais',
                     animation_frame = 'años', title= 'Evolución taza de vida al nacer.')
fig2.show()
#plot(fig2)

#### Conclucion de lo analizado en los graficos:
* Podemos aprecias que la esperanza de vida en todos los paises a medida que pasa el tiempo va incrementando, esto puede ser por:
    * Mejora en el sistema sanitario. 
    * Avance en la tecnologia:
        * En el area de saludo. 
        * En el area de produccion de alimentos. 
        * Y tambien en la creacion de comodidades para las personas. 
* Por otro lado, lo que notamos tambien es que las personas de latam, siempre tuvieron una esperanza de vida menor que las personas de Canada, Francia y Nueva Zelanda. Esto puede ser por:
    * Los puntos nombrados anterioremente. 
    * Aparte por la cultura que maneja cada pais. 
* Veamos el caso de Argentina, Brasil y Chile. 
    * 1960: Argentina comienza liderando con 65 años, es seguida de Chile con 57 años y luego Brasil con 54 años. 
    * A medida que el tiempo va transcurriendo al llegar al Año 2018, Chile queda 1ro con 80 años, 2do Argentina con 76 años y en 3er luegar Brasil con 75 años. 
    * Lo que podemos deducir de esto es que Chile tuvo un mayor crecimiento en el sistema sanitario y en las politas de salud, en cambio los otros dos paises, no realizaron la inversion correspondiente para estar al alcance de tanto de Chile como de los otros paises a los cuales estuvimos estudiando. 

## Ahora vamos a trabajar con el tercer indicador HD.HCI.OVRL
Este indicador informa el Índice de capital humano (HCI) (escala 0-1)

In [22]:
#Genero un nuevo df con lo que vamos a trabajar. 
df_cap_hum = pd.DataFrame()
df_cap_hum = df1[df1["codigo_indicador"].isin(["HD.HCI.OVRL"])]
años2 = df_cap_hum.columns[4:]
df_cap_hum

Unnamed: 0,pais,codigo_pais,indicador,codigo_indicador,1960,1961,1962,1963,1964,1965,...,2011,2012,2013,2014,2015,2016,2017,2018,2019,2020
20455,Argentina,ARG,Human capital index (HCI) (scale 0-1),HD.HCI.OVRL,,,,,,,...,,,,,,,0.611,0.617367,,0.602145
28340,Brazil,BRA,Human capital index (HCI) (scale 0-1),HD.HCI.OVRL,,,,,,,...,,,,,,,0.56,0.545724,,0.551498
32075,Canada,CAN,Human capital index (HCI) (scale 0-1),HD.HCI.OVRL,,,,,,,...,,,,,,,0.799,0.80009,,0.79752
34150,Chile,CHL,Human capital index (HCI) (scale 0-1),HD.HCI.OVRL,,,,,,,...,,,,,,,0.674,0.665265,,0.651604
45770,France,FRA,Human capital index (HCI) (scale 0-1),HD.HCI.OVRL,,,,,,,...,,,,,,,0.765,0.75596,,0.762737
76065,New Zealand,NZL,Human capital index (HCI) (scale 0-1),HD.HCI.OVRL,,,,,,,...,,,,,,,0.767,0.771214,,0.775932


In [23]:
#Aplico el metodo melt para acomodar los columnas como corresponden
df_cap_hum = pd.melt(df_cap_hum, id_vars= ['pais','codigo_indicador'], value_vars = años, 
                       var_name = 'años',value_name= 'capital_humano')
df_cap_hum

Unnamed: 0,pais,codigo_indicador,años,capital_humano
0,Argentina,HD.HCI.OVRL,1960,
1,Brazil,HD.HCI.OVRL,1960,
2,Canada,HD.HCI.OVRL,1960,
3,Chile,HD.HCI.OVRL,1960,
4,France,HD.HCI.OVRL,1960,
...,...,...,...,...
349,Brazil,HD.HCI.OVRL,2018,0.545724
350,Canada,HD.HCI.OVRL,2018,0.800090
351,Chile,HD.HCI.OVRL,2018,0.665265
352,France,HD.HCI.OVRL,2018,0.755960


In [24]:
df_cap_hum.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 354 entries, 0 to 353
Data columns (total 4 columns):
 #   Column            Non-Null Count  Dtype  
---  ------            --------------  -----  
 0   pais              354 non-null    object 
 1   codigo_indicador  354 non-null    object 
 2   años              354 non-null    object 
 3   capital_humano    18 non-null     float64
dtypes: float64(1), object(3)
memory usage: 11.2+ KB


Como podemos observar este indice tiene muy pocos datos para poder sacar una observacion. 

Lo que podemos interpretar es que en estos paises no se le dio mucha importancia de saber esta informacion. 

In [25]:
def get_alpha_3(location):
    try:
        return pycountry.countries.get(name = location).alpha_3
    except: 
        return None
df_cap_hum['coordenadas']= df_cap_hum['pais'].apply(lambda x: get_alpha_3(x))
df_cap_hum

Unnamed: 0,pais,codigo_indicador,años,capital_humano,coordenadas
0,Argentina,HD.HCI.OVRL,1960,,ARG
1,Brazil,HD.HCI.OVRL,1960,,BRA
2,Canada,HD.HCI.OVRL,1960,,CAN
3,Chile,HD.HCI.OVRL,1960,,CHL
4,France,HD.HCI.OVRL,1960,,FRA
...,...,...,...,...,...
349,Brazil,HD.HCI.OVRL,2018,0.545724,BRA
350,Canada,HD.HCI.OVRL,2018,0.800090,CAN
351,Chile,HD.HCI.OVRL,2018,0.665265,CHL
352,France,HD.HCI.OVRL,2018,0.755960,FRA


In [26]:
fig2 = px.choropleth(df_cap_hum, locations = 'coordenadas', color = 'capital_humano', hover_name='pais',
                     animation_frame = 'años', title= 'Evolución taza de vida al nacer.')
fig2.show()
#plot(fig2)

In [38]:
fig = px.line(df_cap_hum,x = df_cap_hum.años, y = df_cap_hum.capital_humano, color =df_cap_hum.pais,
             title = "Capital humano")
fig.update_xaxes(rangeslider_visible=True)
fig.show()
#plot(fig)

In [40]:
fig0 = px.line_3d(df_cap_hum,x = df_cap_hum.años, y = df_cap_hum.capital_humano,z=df_natalidad.años,  
                  color =df_cap_hum.pais,
             title = "Capital humano.")
fig0.show()
#plot(fig0)

## Trabajamos con el ultimo indicador NY.GNP.PCAP.CD

El siguiente indicador es INB per cápita, método Atlas (US $ a precios actuales)

In [29]:
#Genero un nuevo df con lo que vamos a trabajar. 
df_inb = pd.DataFrame()
df_inb = df1[df1["codigo_indicador"].isin(["NY.GNP.PCAP.CD"])]
años3 = df_inb.columns[4:]
df_inb

Unnamed: 0,pais,codigo_pais,indicador,codigo_indicador,1960,1961,1962,1963,1964,1965,...,2011,2012,2013,2014,2015,2016,2017,2018,2019,2020
20453,Argentina,ARG,"GNI per capita, Atlas method (current US$)",NY.GNP.PCAP.CD,,,,,1120.0,1230.0,...,10710.0,11870.0,12840.0,12330.0,12570.0,12220.0,13120.0,12390.0,11200.0,
28338,Brazil,BRA,"GNI per capita, Atlas method (current US$)",NY.GNP.PCAP.CD,,,,,,,...,11080.0,12310.0,12790.0,12120.0,10190.0,8920.0,8700.0,9080.0,9130.0,
32073,Canada,CAN,"GNI per capita, Atlas method (current US$)",NY.GNP.PCAP.CD,,,,,,,...,47180.0,51000.0,52770.0,52180.0,47570.0,43870.0,42990.0,45000.0,46370.0,
34148,Chile,CHL,"GNI per capita, Atlas method (current US$)",NY.GNP.PCAP.CD,,,580.0,630.0,670.0,670.0,...,12340.0,14350.0,15160.0,14940.0,14130.0,13370.0,13270.0,14620.0,15010.0,
45768,France,FRA,"GNI per capita, Atlas method (current US$)",NY.GNP.PCAP.CD,,,1550.0,1700.0,1870.0,2030.0,...,44350.0,43380.0,43780.0,43320.0,41100.0,39070.0,38340.0,41080.0,42400.0,
76063,New Zealand,NZL,"GNI per capita, Atlas method (current US$)",NY.GNP.PCAP.CD,,,,,,,...,32270.0,36730.0,39910.0,41630.0,40560.0,39390.0,38170.0,41100.0,42670.0,


In [30]:
#Aplico el metodo melt para acomodar los columnas como corresponden
df_inb = pd.melt(df_inb, id_vars= ['pais','codigo_indicador'], value_vars = años, 
                       var_name = 'años',value_name= 'INB')
df_inb

Unnamed: 0,pais,codigo_indicador,años,INB
0,Argentina,NY.GNP.PCAP.CD,1960,
1,Brazil,NY.GNP.PCAP.CD,1960,
2,Canada,NY.GNP.PCAP.CD,1960,
3,Chile,NY.GNP.PCAP.CD,1960,
4,France,NY.GNP.PCAP.CD,1960,
...,...,...,...,...
349,Brazil,NY.GNP.PCAP.CD,2018,9080.0
350,Canada,NY.GNP.PCAP.CD,2018,45000.0
351,Chile,NY.GNP.PCAP.CD,2018,14620.0
352,France,NY.GNP.PCAP.CD,2018,41080.0


In [31]:
df_inb.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 354 entries, 0 to 353
Data columns (total 4 columns):
 #   Column            Non-Null Count  Dtype  
---  ------            --------------  -----  
 0   pais              354 non-null    object 
 1   codigo_indicador  354 non-null    object 
 2   años              354 non-null    object 
 3   INB               318 non-null    float64
dtypes: float64(1), object(3)
memory usage: 11.2+ KB


In [32]:
def get_alpha_3(location):
    try:
        return pycountry.countries.get(name = location).alpha_3
    except: 
        return None
df_inb['coordenadas']= df_inb['pais'].apply(lambda x: get_alpha_3(x))
df_inb

Unnamed: 0,pais,codigo_indicador,años,INB,coordenadas
0,Argentina,NY.GNP.PCAP.CD,1960,,ARG
1,Brazil,NY.GNP.PCAP.CD,1960,,BRA
2,Canada,NY.GNP.PCAP.CD,1960,,CAN
3,Chile,NY.GNP.PCAP.CD,1960,,CHL
4,France,NY.GNP.PCAP.CD,1960,,FRA
...,...,...,...,...,...
349,Brazil,NY.GNP.PCAP.CD,2018,9080.0,BRA
350,Canada,NY.GNP.PCAP.CD,2018,45000.0,CAN
351,Chile,NY.GNP.PCAP.CD,2018,14620.0,CHL
352,France,NY.GNP.PCAP.CD,2018,41080.0,FRA


In [34]:
fig2 = px.choropleth(df_inb, locations = 'coordenadas', color = 'INB', hover_name='pais',
                     animation_frame = 'años', title= 'INB')
fig2.show()
#plot(fig2)

In [35]:
fig = px.line(df_inb,x = df_inb.años, y = df_inb.INB, color =df_inb.pais,
             title = "Taza INB")
fig.update_xaxes(rangeslider_visible=True)
fig.show()
#plot(fig)

In [42]:
fig0 = px.line_3d(df_inb,x = df_inb.años, y = df_inb.INB,z=df_inb.años,  
                  color =df_inb.pais,
             title = "Taza INB")
fig0.show()
#plot(fig0)