![verao](imagens/verao_uff.png)

---
# Univerisdade Federal Fluminense - UFF
## Programa de Pós-graduação em Engenharia de Biossistemas

---
# Escola de Verão 2021
### Professor: Jorge Zavaleta. <jorge.zavaleta@ppgi.ufrj.br>

---

# Módulo 05 - Graficos Avançados e Aplicações

## Gráficos interativos - Bokeh
> **Bokeh** é uma biblioteca Python para a criação de visualizações interativas para navegadores da web modernos e permite construir belos gráficos, desde plotagens simples a painéis complexos com conjuntos de dados de "streaming". Bokeh permite criar visualizações baseadas em JavaScript sem escrever código. Maiores detalhes -> [Bokeh](https://bokeh.org/). [Docs](http://docs.bokeh.org/en/dev/index.html)

> - Visualização interativa em navegadores modernos
> - Documentos HTML autônomos ou aplicativos de servidor
> - Gráficos expressivos e versáteis
> - Dados grandes, dinâmicos ou de streaming
> - Fácil uso de python (ou Scala, ou R)

> Instalar: ```pip install bokeh```

### Importando a biblioteca

In [None]:
# 1. importando as bibliotecas
#import matplotlib as mpl                       # usada ocasionalmente 3D
import matplotlib.pyplot as plt                # importar a biblioteca matplotlib
import numpy as np                             # importar numpy
import pandas as pd                            # importat pandas
#--
from bokeh.io import output_notebook           # bokeh
from bokeh.plotting import figure, show        # figura
#--
plt.style.use('classic')                       # estilo da biblioteca
%matplotlib inline                            
#%config InlineBackend.figure_format='svg'

In [None]:
# 2. verificar se está funcioando corretamente
output_notebook()

In [None]:
# 3. gerando os dados
x = np.linspace(-6, 6, 100)
y = np.cos(x)

In [None]:
# 4. gerando o grafico
f = figure(width=500, height=500)                             # gera figura de 500x500
f.circle(x, y, size=4, color="firebrick", alpha=0.5)          # circulos de tamanho 7
show(f)                                                       # mostra a figura

> ### Bokeh - Bar

In [None]:
# dados pre-inslados
from bokeh.sampledata.autompg import autompg
#
#print(autompg)
#dados = pd.DataFrame(autompg)
#print(dados.head(10))
#
grouped = autompg.groupby("yr")
#
mpg = grouped.mpg
avg, std = mpg.mean(), mpg.std()
years = list(grouped.groups)
american = autompg[autompg["origin"]==1]
japanese = autompg[autompg["origin"]==3]

In [None]:
# graficar a distribuicao por ano
p = figure(title="MPG by Year (Japan and US)")

p.vbar(x=years, bottom=avg-std, top=avg+std, width=0.8, 
       fill_alpha=0.2, line_color=None, legend_label="MPG 1 stddev")

p.circle(x=japanese["yr"], y=japanese["mpg"], size=10, alpha=0.5,
         color="red", legend_label="Japanese")

p.triangle(x=american["yr"], y=american["mpg"], size=10, alpha=0.3,
           color="blue", legend_label="American")

p.legend.location = "top_left"
show(p)

> ### Bokeh - Colunas (subplots)

In [None]:
# exemplo de linked colunas (subplor)
from bokeh.models import ColumnDataSource      # dados das colunas
from bokeh.layouts import gridplot
#
source = ColumnDataSource(autompg)
#
options = dict(plot_width=300, plot_height=300, tools="pan,wheel_zoom,box_zoom,box_select,lasso_select")
#
p1 = figure(title="MPG by Year", **options)
p1.circle("yr", "mpg", color="blue", source=source)
#
p2 = figure(title="HP vs. Displacement", **options)
p2.circle("hp", "displ", color="green", source=source)
#
p3 = figure(title="MPG vs. Displacement", **options)
p3.circle("mpg", "displ", size="cyl", line_color="red", fill_color=None, source=source)
#
p = gridplot([[ p1, p2, p3]], toolbar_location="right")
#
show(p)

> ### Bokeh - Standalone HTML

In [None]:
# Abre em outra pagina HTML
from bokeh.plotting import output_file
#
output_file("exemplo_bokeh.html")             # pagina html
#
p = figure(title="MPG by Year (Japan and US)")
#
p.vbar(x=years, bottom=avg-std, top=avg+std, width=0.8, 
       fill_alpha=0.2, line_color=None, legend_label="MPG 1 stddev")
#
p.circle(x=japanese["yr"], y=japanese["mpg"], size=10, alpha=0.3,
         color="red", legend_label="Japanese")
#
p.triangle(x=american["yr"], y=american["mpg"], size=10, alpha=0.3,
           color="blue", legend_label="American")
#
p.legend.location = "top_left"
show(p)                          # mostra o grafico

> ### Bokeh - Aplicações

In [None]:
# bokeh - frame
from IPython.display import IFrame
IFrame('https://demo.bokeh.org/sliders', width=900, height=410)

## Plotly
> **Plotly** é uma biblioteca de gráficos Python que permite fazer gráficos interativos de alta qualidade. [Plotly](https://plotly.com/python/)
>> - Instalar: ```pip install plotly``` #  plotly==4.14.3
>> - Instalar: ```pip install dash```           # dash 
>> - Instalar: ```pip install jupyter-dash```   # dash para Jupyter

In [None]:
# grafico simples
import plotly.graph_objects as go
fig = go.FigureWidget(data=go.Bar(y=[2, 5, 10, 3, 1 , 8]))
fig.show()

In [None]:
# plot de regiao geografica em forma discreta
import plotly.express as px

df = px.data.gapminder().query("year == 2007")
fig = px.scatter_geo(df, locations="iso_alpha",
                     color="continent", # which column to use to set the color of markers
                     hover_name="country", # column added to hover information
                     size="pop", # size of markers
                     projection="natural earth")
fig.show()

In [None]:
# exemplo usando GEOPANDAS
import plotly.express as px
import geopandas as gpd

geo_df = gpd.read_file(gpd.datasets.get_path('naturalearth_cities'))
#
#px.set_mapbox_access_token(open(".mapbox_token").read())
fig = px.scatter_geo(geo_df,lat=geo_df.geometry.y,lon=geo_df.geometry.x,hover_name="name")
fig.show()

In [None]:
# leitura dos dados do dataset total
world_df = gpd.read_file(gpd.datasets.get_path('naturalearth_lowres'))
world_df

In [None]:
# procurando dados do Brasil
sd_df = world_df[(world_df.continent =='South America')]
sd_df

In [None]:
br_df = world_df[(world_df.continent =='South America') & (world_df.name =='Brazil')]
br_df

In [None]:
# Brazil
import matplotlib.pyplot as plt
#
fig, ax = plt.subplots(1, 1)
ax.legend('Brazil')
br_df.plot(column='pop_est', ax=ax, legend=True);

In [None]:
# exemplo mostra o exemplo em outra pagina html
import plotly.graph_objects as go
fig = go.Figure(data=go.Bar(y=[2, 5, 10, 3, 1 , 8]))
fig.write_html('bar_figure.html', auto_open=True)

## Aplicações - Covid 19
> Instalar o pacote covid - Johns Hopkins University e World-O-Meter.

> ```pip install covid ```

In [None]:
# importar a biblioteca
from covid import Covid
# dados
#covid = Covid(source="john_hopkins") # dados = default
#covid = Covid()
# ou
covid = Covid(source="worldometers")
#
data = covid.get_data()   # visualizar os dados
# convertir para DataFrame
dados = pd.DataFrame(data)
dados.head()

In [None]:
# usando o dados iniciais de lista
br0 = covid.get_status_by_country_name("Brazil")
br0

In [None]:
# covid - paises
#countries = covid.list_countries()
#countries

In [None]:
# visualizar dados por país
br = dados[dados.country == 'Brazil']
br

In [None]:
# Visualizar paises
paises = dados['country']
paises

In [None]:
# confirmar dados totais
#covid.get_total_active_cases()       # casos totais ativos
#covid.get_total_confirmed_cases()    # casos torais confirmados
#covid.get_total_recovered()          # casos totais recuperados
#covid.get_total_deaths()             # casos totais de mortos

In [None]:
# classificar os dados
ordenados = dados.sort_values(by=['confirmed'], ascending=False)
ordenados.head(10)

In [None]:
# os 10 paises mais afetados pelo covid-19
excluidos = ordenados[~ordenados.country.isin(['Europe', 'South America', 'Asia', 'World', 'North America', 'Africa'])]
top10 = excluidos.head(10)
top10

In [None]:
# Extraindo os dados para variaveis
x = top10.country
y1 = top10.confirmed
y2 = top10.active
y3 = top10.deaths
y4 = top10.recovered

In [None]:
# visualizar os resultados dos paise
%matplotlib inline
#
plt.plot(x, y1,'r')
plt.xticks(rotation=90)
plt.grid()
plt.title('Paises afetados pelo covid-19')
plt.show()

In [None]:
# grafico de barras
plt.bar(x, y1, color='red')
plt.xticks(rotation=90)
plt.title('Paises afetados pelo covid-19')
plt.show()

In [None]:
# multigrafico
plt.plot(x, y1, label='Confirmados')
plt.plot(x, y2, label='Ativos')
plt.plot(x, y3, label='Mortos')
plt.plot(x, y4, label='Recuperados')
plt.legend(loc='upper right')
plt.xticks(rotation=90)
plt.title('Paises afetados pelo covid-19')
plt.show()

In [None]:
# grafico de barra vertical
df2 = pd.DataFrame([y1, y2, y3, y4])
df2.plot.bar();
plt.legend(x, loc='upper center')
plt.xticks(rotation=90)
plt.title('Paises afetados pelo covid-19')
plt.grid()
plt.show()

In [None]:
# grafico de barra vertical
df2 = pd.DataFrame([y1, y2, y3, y4])
df2.plot.bar(stacked=True);
plt.legend(x, loc='upper center')
plt.xticks(rotation=90)
plt.title('Paises afetados pelo covid-19')
plt.grid()
plt.show()

In [None]:
# visualiza barra horizontal
df2.plot.barh(stacked=True);
plt.legend(x, loc='upper right')
plt.xticks(rotation=90)
plt.grid()
plt.title('Paises afetados pelo covid-19')
plt.show()

In [None]:
# visualiza area
df2.plot.area();
plt.legend(x, loc='upper right')
plt.xticks(rotation=90)
plt.grid()
plt.title('Paises afetados pelo covid-19')
plt.show()

In [None]:
# scatter
#labels = ['Confirmados', 'Ativos', 'Mortos', 'Recuperados']
labels = ['Confirmed', 'Active', 'Deaths', 'Recovered']
factor=0.0001
plt.scatter(x, y1, s=y1*factor, color='red', label='confirmados');
plt.scatter(x, y2, s=y2*factor, color='green', label='ativos');
plt.scatter(x, y3, s=y3*factor, label='mortos');
#plt.scatter(x, y4, s=y4*factor, label='recuperados');
#plt.legend(labels, loc='upper right')
plt.legend(loc='upper right')
plt.xticks(rotation=90)
plt.grid()
plt.title('Paises afetados pelo covid-19')
plt.show()

In [None]:
# Pie chart
plt.pie(y1, labels=x)
plt.title('Casos Confirmados')
plt.show()

In [None]:
# conta os valores confirmados
top10['confirmed'].plot(kind='pie', autopct='%.2f%%', labels=x)
plt.axis('equal');
plt.ylabel('casos confirmados')
plt.title('Paises afetados pelo covid-19')
plt.show()

In [None]:
# visualizar os 10 primeiros e plotly
top10

> **Pergunta**: Qual a incidência diária de casos confirmados e mortes no período?

In [None]:
# Agrupar os dados
agrupados = top10.groupby(['country'])[['confirmed','deaths']].agg('sum')
agrupados.head(10)

In [None]:
# grafico
import datetime                         # date
import plotly.graph_objects as go
from plotly.subplots import make_subplots
from plotly.graph_objs import *
#
today = datetime.datetime.now().strftime('%d/%m/%Y')  # dia atual
#
layout = Layout(
    paper_bgcolor='rgba(0,0,0,0)',
    plot_bgcolor='rgba(0,0,0,0)',
    title="Visualização Conjunta de Casos Confirmados e Óbitos até " + today,)

In [None]:
# graficando usando o plotly
fig = go.Figure(data=[
    go.Bar(name='Confirmados', x=agrupados.index, y=agrupados['confirmed']),
    go.Bar(name='Óbitos', x=agrupados.index, y=agrupados['deaths'])])
fig.update_xaxes(title_text='Dados por País')
fig.update_yaxes(title_text='Quantidade')
fig.update_layout(barmode='stack')
fig['layout'].update(layout)
#
fig.show()

### Geoplotlib

> - instalar o pyglet: pip install Pyglet
> - pip install geoplotlib
> - baixar geospatila dataset - https://www.latlong.net/
> - https://simplemaps.com/data/world-cities

In [None]:
# Exemplo
import geoplotlib as geo
#import pandas as pd
#
br_cities = pd.read_csv('data/br-cities.csv',delimiter=',')
br_cities.head()

In [None]:
geo.dot(br_cities,point_size=3)
geo.show()

In [None]:
rio = br_cities[br_cities['admin_name']=='Rio de Janeiro']
rio.head(10)

In [None]:
geo.dot(rio,point_size=5)
geo.show()

---
#### Python para Data Science &copy; Copyright 2021, Jorge Zavaleta