## Visualizaciones en plotly
Una de las librerias más poderosas de visualización en Python es Plotly. Hay [muchas razones para usarlo](https://towardsdatascience.com/4-reasons-why-im-choosing-plotly-as-the-main-visualization-library-dc4a961a402f) pero la más importante es tal vez su capacidad de hacer gráficas interactivas. Cualquier visualización le deja al usuario seleccionar el subconjunto de datos de su elección. Pueden ver [la galería de plotly](https://plotly.com/python/) para darse una idea de su flexibilidad. Empecemos instalando plotly: 


## Instalar plotly

Corra en su terminal:


`pip install plotly`


## Ejemplo 1 - Casos globales de Covid-19

Como primer ejemplo, visualicemos los casos globales de Covid-19 en función del tiempo. Para eso, tomaremos el dataset de casos compilado por la universidad Johns Hopkins.


In [None]:
# Importemos plotly. A diferencia de seaborn o matplotlib,
# dependiendo de lo que queramos hacer, vamos a necesitar 
# plotly.express o plotly.graph_objects. Importemos ambos

import plotly.express as px
import plotly.graph_objects as go

# Importemos pandas
import pandas as pd

# Esta librería nos va a ayudar manipular los datos,
# No es necesario que sepan que hace pero si quireren explorar
# más en esta área, se la recomendamos.

import numpy as np

In [None]:
# pro tip: ''' o """ empiezan un comentario de muchas lineas:

''' 
Los datos globales de casos de covid 19 - cortesia de Johns Hopkins.
Noten que pandas puede importar datos de una url! Así, con el pasar de los días,
solo hay que correr el notebook otra vez para obtener los datos actualizados. 
'''

covidData = pd.read_csv('https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv')

In [None]:
# Manipulemos los datos para quedar con los valores
# de los casos clobales en la variable casosGlobales y 
# las fechas asociadas en la variable fechas

dateColumns = covidData.columns[4:]
casosGlobales = covidData[dateColumns].sum()
fechas = pd.to_datetime(casosGlobales.index)

Con los casos globales y las fechas respectivas en variables, podemos hacer la visualizacion. Miremos la visualización más sencilla, un line plot. Podemos hacer eso con [plotly express](https://plotly.com/python/plotly-express/), la sublibrería de plotly que nos permite crear gráficas completas interactivas con un comando.

In [None]:
# Creemos el plot
fig = px.line(x=fechas, y=casosGlobales)

# Configuremos el titulo y los ejes
fig.update_layout(  xaxis_title="Tiempo",
                    yaxis_title="Casos globales de COVID 19",
                    title='Casos globales de Covid 19 en el tiempo')

# Mostremos la figura 
fig.show()

## Ejercicio 1 - Interactuar con la gráfica

La mayoría de las gráficas que se hacen con plotly tienen la misma interactividad. 

> 1.1 Con el mouse, seleccione el área de la gráfica que sea necesaria y posicione el mouse sobre la curva cuantes veces sea necesario para identificar el día exacto en el que el número de casos globales pasó un millón. (Respuesta 2 de Abril 2020). 

> 1.2 Cuando tenga una ventana en la que se vea claramente donde la curva cruza el millón de casos, haga click sobre el ícono de la cámara en la parte superior derecha de la gráfica para exportar la ventana a una imagen `.png`. Abra la imagen con su visualizador de preferencia y asegúrese de que la misma ventana haya sido exportada.  

Para resetear los ejes de la gráfica, puede hacer click sobre el ícono de la casa en la esquina superior derecha de la gráfica.


## Ejercicio 2 - Nuevos casos de Covid 19 en Colombia

Usando los datos anteriores, podemos calcular los casos por país e incluso calcular los casos nuevos, a diario, por país. Hagamos eso: 

In [None]:
dataByCountry = covidData.groupby('Country/Region').sum()[dateColumns]
countries = dataByCountry.index

In [None]:
def getNewCasesInCountry(country,dataByCountry):
    N = 15
    countryData = dataByCountry.loc[country]
    casesInCountry = countryData.values
    datesCasesInCountry = pd.to_datetime(countryData.index)

    newCasesInCountry = np.convolve(np.diff(casesInCountry), np.ones(N)/N, mode='valid')
    datesCasesInCountry = datesCasesInCountry[N:]
    return datesCasesInCountry, newCasesInCountry

fechasCasosNuevosEnColombia,casosNuevosEnColombia = getNewCasesInCountry('Colombia',dataByCountry)

> Grafique los casos nuevos de Colombia en el tiempo en un line plot de plotly. Los nuevos casos en Colombia se encuenctran en la variable `casosNuevosEnColombia`, y en la variable `fechasCasosNuevosEnColombia` están sus respectivas fechas.

In [None]:
# Su código acá - Ejercicio 2


## Ejercicio 3 - Nuevos casos de Covid 19 en Brasil, Argentina, Chile y Colombia

El modo express de plotly es muy sencillo, tan sencillo que puede ser limitante. Para gráficas más complejas se puede usar la sublibrería `graph_objects` de plotly que hemos importado como `go`. 

Usemos `go` para graficar múltiples líneas. Primero, repliquemos lo que hicimos en la gráfica pasada con `go`:


In [None]:
fechasCasosNuevosEnColombia,casosNuevosEnColombia = getNewCasesInCountry('Colombia',dataByCountry)

In [None]:
fig = go.Figure()
fig.add_trace(go.Scatter(x=fechasCasosNuevosEnColombia, y=casosNuevosEnColombia,
                    mode='lines',
                    name='Colombia'))

fig.update_layout(  xaxis_title="Tiempo",
                    yaxis_title="Casos nuevos de COVID 19",
                    title='Casos nuevos de Covid 19 por país')
fig.show()

Bastante sencillo, ¿no? Notemos que cambian un par de cosas. Primero, tenemos que crear una figura. Luego, a esa figura tenemos que agregarle una *traza*. Esto se vuelve poderoso cuando agregamos muchas trazas. Por ejemplo, así se visualizarían los datos de Brasil y Colombia en una sola gráfica:

In [None]:
fechasCasosNuevosEnBrazil,casosNuevosEnBrazil = getNewCasesInCountry('Brazil',dataByCountry)

In [None]:
fig = go.Figure()
fig.add_trace(go.Scatter(x=fechasCasosNuevosEnColombia, y=casosNuevosEnColombia,
                    mode='lines',
                    name='Colombia'))
fig.add_trace(go.Scatter(x=fechasCasosNuevosEnBrazil, y=casosNuevosEnBrazil,
                    mode='lines',
                    name='Brazil'))

fig.update_layout(  xaxis_title="Tiempo",
                    yaxis_title="Casos nuevos de COVID 19",
                    title='Casos nuevos de Covid 19 por país')
fig.show()

> Grafique los nuevos casos de covid 19 en Brazil, Colombia, Argentina y Chile. Las 4 lineas deberían ser visibles en una sola gráfica. 

In [None]:
fechasCasosNuevosEnArgentina,casosNuevosEnArgentina = getNewCasesInCountry('Argentina',dataByCountry)
fechasCasosNuevosEnChile,casosNuevosEnChile = getNewCasesInCountry('Chile',dataByCountry)

In [None]:
# Su código acá


## Ejercicio 4 - Bar plots

Veamos como hacer barplots en plotly. Para eso vamos a tomar los nuevos casos de covid 19 que se dieron hoy en Canadá:

In [None]:
canada = covidData.loc[covidData['Country/Region']=='Canada',['Province/State']+list(dateColumns[-2:])]
canada = canada.groupby('Province/State').sum()
canada.loc[:,'NuevosCasos'] = canada[canada.columns[-1]] - canada.loc[:,canada.columns[-2]]
canadaOrdenado = canada.sort_values(by='NuevosCasos', ascending=False)
provinciasCanada = canadaOrdenado.index
nuevosCasosCanadaHoy = canadaOrdenado.loc[:,'NuevosCasos']

In [None]:
fig = go.Figure(
            go.Bar(
                x=provinciasCanada, 
                y=nuevosCasosCanadaHoy
            )       
)


fig.update_layout(  xaxis_title="Provincia",
                    yaxis_title="Nuevos casos de covid 19",
                    title='Nuevos casos de covid 19 en Canadá por provincia hoy')
fig.show()


In [None]:
dataByCountry.loc[:,'NuevosCasos'] = dataByCountry[dataByCountry.columns[-1]] - dataByCountry[dataByCountry.columns[-2]]
dataByCountry = dataByCountry.sort_values(by='NuevosCasos',ascending=False)
paises = dataByCountry.index
casosNuevosPaises = dataByCountry['NuevosCasos']

> Haga un barplot de los nuevos casos reportados hoy en cada pais. Hemos calulado los nuevos casos en la variable `casosNuevosPaises` y sus paises respectivos en `paises`

In [None]:
# su codigo al ejericio 4 acá


# Ejercicio 5 - exportar a html

Plotly permite exportar las gráficas a html para que usted pueda tener una página interactiva con su visualización. Veamos como hacer eso con la gráfica de ejemplo del Ejercicio 3:

In [None]:
fig = go.Figure()
fig.add_trace(go.Scatter(x=fechasCasosNuevosEnColombia, y=casosNuevosEnColombia,
                    mode='lines',
                    name='Colombia'))
fig.add_trace(go.Scatter(x=fechasCasosNuevosEnBrazil, y=casosNuevosEnBrazil,
                    mode='lines',
                    name='Brazil'))

fig.update_layout(  xaxis_title="Tiempo",
                    yaxis_title="Casos nuevos de COVID 19",
                    title='Casos nuevos de Covid 19 por país')
fig.show()

# con esta linea exportamos la grafica a un archivo que se llama casos.html
fig.write_html("casos.html")


Si abre el archivo que generó plotly, su browser debería abrir una página en donde se encuentra la visualización anterior en pantalla completa.

> Haga la visualización que usted quiera usando los datos de covid 19. Si de verdad quiere aprender, procure que su visualización no sea ninguna de las que ha hecho antes. Como fuente de inspiración puede usar [la galeria de plotly](https://plotly.com/python/). Al finalizar su visualización, expórtela como html. Ábra la página en su browser y verifique que se renderise correctamente.

In [None]:
# su código acá

## Showcase - Calentamiento global


Plotly es MUY poderoso. Los ejercicios de arriba apenas mostraron algunas de las funcionalidades básicas. En este pequeño showcase queremos mostrarles hasta donde puede llegar plotly.

Para eso, veamos el antropoceno en pleno furor.

In [None]:
# datos de la temperatura global de la NASA
tempData = pd.read_csv('./data/worldTemperature/temperatureWorld.csv', sep=';')

In [None]:
# transformemos los datos al formato que necesitamos
monthsStr = ['Enero','Febrero','Marzo','Abril','Mayo','Junio','Julio','Agosto','Septiembre','Octubre','Noviembre','Diciembre']
tempData['Year'] = tempData.Date.apply(lambda x: int(str(x)[:4]))
tempData['Month'] = tempData.Date.apply(lambda x: int(str(x)[-2:]))
tempData['MonthLabel'] = tempData.Month.apply(lambda x: monthsStr[x-1])

In [None]:
# creemos la figura
fig=px.bar_polar(tempData, 
                    r="Anomaly", 
                    theta="MonthLabel", 
                    range_r=(-1,1.5), 
                    color="Anomaly",
                    animation_frame='Year',
                    title = 'Anomalía de la temperatura promedio de la tierra',
                    range_color=[-1,1.5],
                    color_continuous_scale='Inferno')

# acortemos el tiempo de cada frame
fig.layout.updatemenus[0].buttons[0].args[1]["frame"]["duration"] = 10

# actualicemos el label y la posición de la barra de color
fig.update_layout(coloraxis_colorbar=dict(
    title={'text': "Anomaly (°C)",'side':'right'},
))

fig.show()

# Exportemos la visualización a html. 
fig.write_html("worldTemp.html")