#  Explorar el Dataset "Gapminder" con Plotly Express

### Tutorial basado en un curso llevado por Luis R. Furlán (2020)

#### Requiere la previa instalación de las librerías para Python:

1. Numpy
2. Pandas
3. Plotly

Sobre los datos:
[Fuente de Datos](https://gapminder.org/tools/#$state$time$value=2007;;&chart-type=bubbles)

## Tarea 1:  Carga de los Datos

In [None]:
import plotly.offline as py
import plotly.graph_objs as go
import pandas as pd
import numpy as np

In [None]:
import plotly.express as px

#  La siguiente librería se usa sólo para desplegar tablas en forma más bonita, se puede usar solo .head() 
from plotly.figure_factory import create_table   

### Una forma de ver qué conjuntos de datos hay disponibles con Plotly Express

In [None]:
for name in dir(px.data):
    if '__' not in name:
        print(name)

### Usaremos el conjunto de datos "gapminder"

In [None]:
gapminder = px.data.gapminder()    #   El dataset Gapminder se incluye en Plotly Express

table = create_table(gapminder.head(10))   #  Una forma más bonita de presentar tablas
py.iplot(table)

In [None]:
gapminder.head(10)   # La forma más acostumbrada...todo depende del gusto del usuario

## Tarea 2:  Visualizaciones rápidas "ad hoc" con gráficas de barra


In [None]:
datos_canada = px.data.gapminder().query('country == "Canada"')  #  Seleccionamos solo los datos de Canadá
fig = px.bar(datos_canada, x = 'year', y = 'pop', height = 400)
fig.show() 

#### La gráfica anterior es interactiva.  Se puede mover el cursor sobre la misma y ver los datos.  También, arriba hay íconos para "panear", hacer "zoom", guardar una imágen estática, etc.

#### Plottly Express usa los mismos nombres de las columnas para las etiquetas y los datos a desplegar al pasar el cursor encima.  Podemos modificar las etiquetas (labels) y agregar datos a desplegar (hover_data).

In [None]:
fig = px.bar(datos_canada, x = 'year', y = 'pop',
            hover_data = ['lifeExp', 'gdpPercap'], 
            labels = {'pop': 'población de Canadá', 'year': 'Año'}, height = 400)
fig.show()

### Podemos agregar color basado en otra variable (color)

In [None]:
fig = px.bar(datos_canada, x = 'year', y = 'pop',
            hover_data = ['lifeExp', 'gdpPercap'], 
            color = 'lifeExp',
            labels = {'pop': 'población de Canadá'}, height = 400)
fig.show()

### Podemos exportar la gráfica a un archivo de formato .html, que luego puede verse en un navegador

In [None]:
py.plot(fig, filename = "Poblacion_Canada.html")

## Tarea 3:  Graficar esperanza de vida vrs GDP per cápita usando una gráfica de dispersión "scatter"


In [None]:
gapminder2007 = gapminder.query('year == 2007')    #solo se usarán los datos del 2007
px.scatter(gapminder2007, x = 'gdpPercap', y = 'lifeExp')

### La gráfica anterior contiene datos de todos los continentes.  Utilicemos color para identificarlos

In [None]:
px.scatter(gapminder2007, x = 'gdpPercap', y = 'lifeExp', color = 'continent')

### Nótese que podemos "encender" y "apagar" los puntos correspondientes a cada continente solo dando un "click" en la leyenda de cada uno

## Tarea 4:  Gráfica interactiva "ad hoc" de burbuja

### El tamaño de cada punto de la gráfica anterior puede hacerse proporcional a otra variable (size)


In [None]:
px.scatter(gapminder2007, x = 'gdpPercap', y = 'lifeExp', color = 'continent',
          size = 'pop', size_max = 60)

### Apliquémos todo lo que hemos aprendido para mejorar la gráfica anterior

In [None]:
px.scatter(gapminder2007, 
           x = 'gdpPercap', 
           y = 'lifeExp', 
           color = 'continent',
           size = 'pop', 
           size_max = 60, 
           hover_name = 'country',
           labels = dict(lifeExp = "Esperanza de vida (años)", gdpPercap = "GDP per cápita (Millones $)"))

#  Otra posibilidad para la línea 8 es la siguiente...son intercambiables
#           labels = {"lifeExp": "Esperanza de vida (años)", "gdpPercap": "GDP per cápita (Millones $)"})

## Tarea 5:  Crear gráficas de facetas (Facet Plots) y animaciones interactivas

### Nos ponemos más creativos con la gráfica anterior, separemos los continentes (habrá que cambiar la escala del eje X, con una logarítmica, para que nos quepa)


In [None]:
px.scatter(gapminder2007, x = 'gdpPercap', y = 'lifeExp', color = 'continent',
          size = 'pop', size_max = 60, hover_name = 'country', facet_col = 'continent',
          log_x = True)

### Ahhhh....y que fácil hacer una gráfica animada.  Queremos ver cómo cambia cada país a través de los años!

In [None]:
px.scatter(gapminder, x = 'gdpPercap', y = 'lifeExp', color = 'continent',
          size = 'pop', size_max = 60, hover_name = 'country',
          animation_frame = 'year', animation_group = 'country',
          log_x = True, range_x = [100, 100000],
          range_y = [25, 90],
          labels = dict(pop = 'Población', gdpPercap = 'GDP per Cápita',
                        lifeExp = 'Esperanza de Vida'))

### Y el "postre" de este tutorial!!! Con gráficas "choropeth" (del Griego χῶρος "área/región" y πλῆθος "multitud") 

## Tarea 6:  Representar datos geográficos como mapas animados


In [None]:
px.choropleth(gapminder, locations = 'iso_alpha', color = 'lifeExp', hover_name = 'country',
              animation_frame = 'year', color_continuous_scale = px.colors.sequential.Plasma, 
              projection = 'natural earth')


In [None]:
px.choropleth(gapminder, locations = 'iso_alpha', color = 'lifeExp', hover_name = 'country',
              animation_frame = 'year', color_continuous_scale = px.colors.sequential.Plasma, 
              projection = 'orthographic')