![PPGI_UFRJ](imagens/ppgi-ufrj.png)
# Fundamentos de Ciência de Dados

---
[![DOI](https://zenodo.org/badge/335308405.svg)](https://zenodo.org/badge/latestdoi/335308405)

---
# PPGI/UFRJ 2020.3, 2002.2, 2024.2
## Prof. Sergio Serra e Jorge Zavaleta

---
# Módulo 3 - Gráficos Avançados

## Bokeh - Gráficos interativos

**Bokeh** é uma biblioteca Python para a criação de visualizações interativas para navegadores da web modernos e permite construir belos gráficos, desde plotagens simples a painéis complexos com conjuntos de dados de "streaming". Bokeh permite criar visualizações baseadas em JavaScript sem escrever código. Maiores detalhes -> [Bokeh](https://bokeh.org/). [Docs](https://docs.bokeh.org/en/latest/)

> - Visualização interativa em navegadores modernos
> - Documentos HTML autônomos ou aplicativos de servidor
> - Gráficos expressivos e versáteis
> - Dados grandes, dinâmicos ou de streaming
> - Fácil uso de python (ou Scala, ou R)

> **Instalação**:
> 
> Anaconda:```conda install -c bokeh bokeh```
>
> pip:```pip install bokeh```

### Importando a bibliotecas

In [1]:
# importando as bibliotecas
import matplotlib as mpl                       # usada ocasionalmente 3D
import matplotlib.pyplot as plt                # importar a biblioteca matplotlib
import numpy as np                             # importar numpy
import pandas as pd                            # importat pandas
#plt.style.use('classic')                       # estilo da biblioteca
%matplotlib inline                            
#%config InlineBackend.figure_format='svg'

In [2]:
# 1.importar a biblioteca
from bokeh.io import output_notebook
from bokeh.plotting import figure, show

In [None]:
# 2. verificar se está funcioando corretamente
output_notebook()

In [4]:
# 3. gerando os dados
x = np.linspace(-6, 6, 100)
y = np.cos(x)

In [None]:
# 4. gerando o grafico
f = figure(width=500, height=500, title='coseno(x)')           # gera figura de 500x500
f.xaxis.axis_label = 'valores de x'
f.yaxis.axis_label = 'valores de cosen(x)'
#f.circle(x, y, size=7, color="firebrick", alpha=0.5)          # circulos de tamanho 7
f.scatter(x, y, size=7, color="blue", alpha=0.7) 
show(f)                                                       # mostra a figura

### Bokeh - Bar

In [None]:
# exemplo barras cidades com maior população - Brasil
from bokeh.io import output_file, show
from bokeh.models import ColumnDataSource
from bokeh.palettes import Spectral6, viridis
from bokeh.plotting import figure
from bokeh.transform import factor_cmap
# 
#output_file("bar_colormapped.html")       #saida externa HTML
output_notebook()                          # saida no notebook

In [None]:
# leitura de dados
br_data = pd.read_csv('data/br-cities.csv',delimiter=',')  # leitura dataset
#br_data.head(10)
maior_popu = br_data.sort_values(by=['population'], ascending=False)  # ordena de maior a menor
cid_pop = maior_popu[['city','population']]                           # dataset = cidade e popu
cp_10 = cid_pop[0:10]                                                 # extrae as 10 cidades com maior populacao
cp_10.head(10)

In [None]:
# arruma dos valores
ci_po = cp_10.copy()   # copy
ci_po['population'] = cp_10['population']/100000    # fator de divisão
#
ci_po.head(10)

In [10]:
# cria a data
x_data = ci_po['city']
y_data = ci_po['population']
data = ColumnDataSource(data=dict(x_data=x_data, y_data=y_data))     

In [None]:
from bokeh.palettes import magma, Category10                  # paleta de cores
#
p = figure(x_range=x_data,
           #plot_width=600,
           #plot_height=450, 
           outer_height = 450,
           #toolbar_location=None, 
           title="Cidades do Brasil com maior população"
          )  # cria figura
p.vbar(x='x_data', 
       top='y_data', 
       width=0.9, 
       source=data, 
       legend_field="x_data",
       line_color='white',
       #fill_color=factor_cmap('x_data', palette=viridis(10), factors=x_data)  # cores
       #fill_color=factor_cmap('x_data', palette=magma(10), factors=x_data)
       #fill_color=factor_cmap('x_data', palette=Spectral6[10], factors=x_data)   # 6 cores
       fill_color=factor_cmap('x_data', palette=Category10[10], factors=x_data)
      )
#
#p.xaxis.major_label_orientation = "vertical"  # legend orientation
#p.legend.orientation = "horizontal"
p.xaxis.major_label_orientation = np.pi/4 #np.math.pi/4   # legend orientation by angle pi/x
#p.legend.location = "top_center"
show(p)

In [None]:
from bokeh.io import curdoc
from bokeh.plotting import figure, output_file, show
#
x = np.random.randint(-5,5,10)
y = x*x+10
#
# theme
#curdoc().theme = 'dark_minimal'
#
p = figure(title='Grafico de linhas', width=350, height=350)
p.line(x, y)
#
show(p)

In [20]:
# dados pre-inslados
from bokeh.sampledata.autompg import autompg
#
#print(autompg)
#dados = pd.DataFrame(autompg)
#print(dados.head(10))
#
grouped = autompg.groupby("yr")

mpg = grouped.mpg
avg, std = mpg.mean(), mpg.std()
years = list(grouped.groups)
american = autompg[autompg["origin"]==1]
japanese = autompg[autompg["origin"]==3]

In [None]:
# graficar a distribuicao por ano
#
curdoc().theme = 'caliber'
#
p = figure(title="MPG by Year (Japan and US)")
#
p.vbar(x=years, bottom=avg-std, top=avg+std, width=0.8, 
       fill_alpha=0.2, line_color=None, legend_label="MPG 1 stddev")
#
p.scatter(x=japanese["yr"], y=japanese["mpg"], size=10, alpha=0.5,
         color="red", legend_label="Japanese")
#
p.scatter(marker='triangle',x=american["yr"], y=american["mpg"], size=10, alpha=0.3,
           color="blue", legend_label="American")
#
p.legend.location = "top_left"                          #  posicao dos rotulos
show(p)

### Bokeh - Colunas (subplots)

In [None]:
# exemplo de linked colunas (subplor)
from bokeh.models import ColumnDataSource      # dados das colunas
from bokeh.layouts import gridplot
from bokeh.layouts import row
#
source = ColumnDataSource(autompg)
#
options = dict(width=300, height=300, tools="pan,wheel_zoom,box_zoom,box_select,lasso_select,save,reset")
#
p1 = figure(title="MPG by Year",**options)
p1.scatter("yr", "mpg", color="blue", source=source)
#
p2 = figure(title="HP vs. Displacement",**options)
p2.scatter("hp", "displ", color="green", source=source)
#
p3 = figure(title="MPG vs. Displacement", **options)
p3.scatter("mpg", "displ", size="cyl", line_color="red", fill_color=None, source=source)
# row
show(row(p1,p2,p3))
#p = gridplot([[ p1, p2, p3]], toolbar_location="right")
#
#show(p)

### Bokeh - Iris

In [None]:
from bokeh.plotting import figure, output_file, show
from bokeh.sampledata.iris import flowers
#
colormap = {'setosa': 'red', 'versicolor': 'green', 'virginica': 'blue'}
colors = [colormap[x] for x in flowers['species']]
#
p = figure(title = "Morfologia do Iris dataset")
p.xaxis.axis_label = 'Petal Length'
p.yaxis.axis_label = 'Petal Width'
#
p.scatter(flowers["petal_length"], flowers["petal_width"],color=colors, fill_alpha=0.2, size=10)
#
#output_file("iris.html", title="iris.py example")
#
show(p)

### Bokeh - Standalone HTML

In [None]:
# Abre em outra pagina HTML
from bokeh.plotting import output_file
#
output_file("exemplo_bokeh.html",title="exemplo_bokeh.py")             # pagina externa html
#
p = figure(title="MPG by Year (Japan and US)")
#
p.vbar(x=years, bottom=avg-std, top=avg+std, width=0.8, 
       fill_alpha=0.2, line_color=None, legend_label="MPG 1 stddev")
#
p.scatter(x=japanese["yr"], y=japanese["mpg"], size=10, alpha=0.3,
         color="red", legend_label="Japanese")
#
p.scatter(marker='triangle',x=american["yr"], y=american["mpg"], size=10, alpha=0.3,
           color="blue", legend_label="American")
#
p.legend.location = "top_left"
show(p)                          # mostra o grafico

### Bokeh - Aplicações

In [None]:
# bokeh - frame
from IPython.display import IFrame
IFrame('https://demo.bokeh.org/sliders', width=900, height=410)

## Plotly
> **Plotly** é uma biblioteca de gráficos Python que permite fazer gráficos interativos de alta qualidade. [Plotly](https://plotly.com/python/)
>> **Instalação**:
>> - Anaconda: ```conda install -c conda-forge plotly```
>> - Anaconda: ```conda install -c conda-forge dash```
>> - Anaconda: ```conda install -c conda-forge jupyter-dash```
>>
>> ou
>> - pip: ```pip install plotly```         #  plotly==4.14.3
>> - pip: ```pip install dash```           # dash 
>> - pip: ```pip install jupyter-dash```   # dash para Jupyter

In [None]:
# notebook
import plotly.graph_objects as go
#
x = ['Colombia','Chile','Argentina','Peru','Bolivia','Brasil','Equador','Uruguay']
#
fig = go.Figure(
    data = go.Bar(x=x,                                                # valores de X
                  y=[2, 5, 8, 10, 5, 15, 3, 1]),                      # valores de y
                  layout_title_text="Gráfico de Barras",              # titulo

)
# adicionar rotulos
fig.update_xaxes(tickangle=-45, title_text='Países sul-americanos')   # tickangle --> mudar angulo
fig.update_yaxes(title_text='Valores y')
fig.show()
#fig.show(renderer="png")
#offline.iplot(fig, filename='imagens/bar.png')

In [None]:
# barras de cores
import plotly.graph_objects as go
#
x=['Rio de Janeiro', 'Niterói', 'Seropédica', 'Araruama']
#
fig = go.Figure(go.Bar(x=x, y=[2 ,5 , 1, 9], name='Rio de Janeiro'))
fig.add_trace(go.Bar(x=x, y=[1, 4, 9, 16], name='Araruama'))
fig.add_trace(go.Bar(x=x, y=[6, 8, 4.5, 8], name='Cabo Frio'))
#
fig.update_layout(barmode='stack')
fig.update_xaxes(categoryorder='category ascending')  # orednar os vaores do eixo x
#fig.show(renderer="png")
fig.show()

> ### Plotly - subplots

In [None]:
# exemplo de subplots
from plotly.subplots import make_subplots
#
filas = ['a','b']                          # titiulo das filas
coluna = ['caso 1','caso 2']               # titulo dos sunplots

fig = make_subplots(rows=1, cols=2,                        # numero de filas e colunas = subplot
                    x_title ='Subplots verticais', 
                    y_title='Valores', 
                    row_titles=[], 
                    column_titles=coluna)   # 1 fila e 2 colunas
#
fig.add_scatter(y=[6, 2, 3.5], mode="markers",
                marker=dict(size=20, color="Green"),
                name="a", row=1, col=1)
#
fig.add_bar(y=[2, 1, 3],
            marker=dict(color="MediumPurple"),
            name="b", row=1, col=1)
#
fig.add_scatter(y=[2, 3.5, 4], mode="markers",
                marker=dict(size=20, color="MediumPurple"),
                name="c", row=1, col=2)
#
fig.add_bar(y=[1.5, 3, 2],
            marker=dict(color="Green"),
            name="d", row=1, col=2)
#
#fig.show(renderer="png")
fig.show()

> ### Plotly - População do Brasil --> gapminder()

In [None]:
# Exemplo de dados sobre crescimento populacional do Brasil
import plotly.express as px
#
data = px.data.gapminder()   # datasets de varios items: https://www.gapminder.org/data/
#
data_brasil = data[data.country == 'Brazil']   # dado do Brasil
#print(data_brasil)
fig = px.bar(data_brasil, x='year', y='pop',
             hover_data=['lifeExp', 'gdpPercap'], color='lifeExp',
             labels={'pop':'Population of Brazil'}, height=400)
#
fig.update_layout(title="População do Brasil até 2007")
fig.show()

> ### Plotly - Covid-19

In [None]:
# dataset = 20/02/2021
import pandas as pd
covid_data = pd.read_csv('data/WHO_COVID-19_global.csv',delimiter=',')
covid_data.head()

In [None]:
# dataset = 18/03/2021
covid_data_1803 = pd.read_csv('data/WHO-COVID-19-global_18_03_2021.csv',delimiter=',')
covid_data_1803.head()

In [None]:
# restringir busca as americas
sula_data = covid_data[covid_data['WHO Region']=='Americas']
sula_data.head(10)

In [None]:
# restringir busca as americas
sula_data_1803 = covid_data_1803[covid_data_1803['WHO_region']=='AMRO']
sula_date_1803 = sula_data_1803[sula_data_1803['Date_reported']=='2021-03-17']
sula_date_1803.head(10)

In [None]:
# ordenar por mortos em 24 horas: 20/02/2021
tmp_data = sula_data.sort_values(by='Deaths - newly reported in last 24 hours',ascending=False)
tmp_data.head(10)

In [None]:
# ordenar por mortos em 24 horas: 18/03/2021

tmp_date_1803 = sula_date_1803.sort_values(by='Cumulative_deaths',ascending=False)
tmp_date_1803.head(10)

In [None]:
# 10 paises x numero de mortos
death10_data = tmp_data.head(10)
death10_data.head()

In [None]:
# Exemplo de dados sobre covid-19 no Brasil
import plotly.express as px
#
fig = px.bar(death10_data, 
             x=death10_data['Name'], 
             y=death10_data['Deaths - newly reported in last 24 hours'],
             hover_data=['Deaths - newly reported in last 7 days', 'Deaths - cumulative total'], 
             color='Deaths - newly reported in last 7 days',
             labels={'Name':'COVID-19 - Países da America'}, #height=400
            )
fig.update_layout(title_text='Covid-19 - Mortes reportadas nas últimas 24 horas - 20/02/2021',title_font_color='red')
fig.update_xaxes(tickangle=-45) 
fig.show()

In [None]:
# 10 paises x numero de mortos ao 18-03
death10_1803 = tmp_date_1803.head(10)
death10_1803.head()

In [None]:
# Exemplo de dados sobre covid-19 no Brasil
import plotly.express as px
#
fig = px.bar(death10_1803, 
             x=death10_1803['Country'], 
             y=death10_1803['Cumulative_deaths'],
             hover_data=['New_deaths', 'Cumulative_deaths'], 
             color='Cumulative_deaths',
             labels={'Name':'COVID-19 - Países da America'}, #height=400
            )
fig.update_layout(title_text='Mortos - Covid-19 na América ao 18/03/2021',title_font_color='red')
fig.update_xaxes(tickangle=-45) 
fig.show()

>### Plotly - externo (html)

In [17]:
# exemplo de grafico simples externo
import plotly.graph_objects as go
fig = go.Figure(data=go.Bar(y=[2, 3,10,2,7, 1]))
fig.write_html('grafico_externo.html', auto_open=True)    # pagina html externa
#

> ### Plotly - mapas interativos

In [None]:
# plot de regiao geografica em forma discreta
import plotly.express as px
#
map_df = px.data.gapminder().query("year == 2007")
print(map_df.head())
#
# datasets de varios items: https://www.gapminder.org/data/
#
fig = px.scatter_geo(map_df,                             # dataset
                     locations="iso_alpha",
                     color="continent",              # which column to use to set the color of markers
                     hover_name="country",           # column added to hover information
                     size="pop",                     # size of markers
                     projection="natural earth")     # ptojection
fig.show()

> ### Plotly + Choropleth Mapas 
> - É um mapa de uma região com diferentes divisões coloridas para indicar o
valor de um recurso específico nessa divisão.

In [None]:
# dados de acesso a internet (dados ate 2017)
internet_df = pd.read_csv('data/data_internet.txt')
internet_df.head()

In [None]:
# Subconjuntos de dados especificos para uma data
uso_2015 = internet_df.query('Year == 2015')   # ano = 2015
uso_2015

In [None]:
# uso de cloropleth
import plotly.express as px
fig = px.choropleth(uso_2015,               # dataset-subdateset a usar
                    locations = 'Code',      # coluna dos codigos ISO 3166 de cada país
                    color = 'Individuals using the Internet (% of population)',   # cores
                    hover_name = 'Country', # coluna dos nomes dos países
                    color_continuous_scale = px.colors.sequential.Plasma   # cores definidos por plotly
                   )
fig.show()    # visualiza o grafico

> ### América do Sul

In [None]:
# Subconjuntos de dados especificos para uma data
la_int = internet_df[internet_df.Year == 2017]   # Brasil
la_int.head()

In [None]:
# uso de cloropleth
import plotly.express as px
fig = px.choropleth(la_int,               # dataset-subdateset a usar
                    locations = 'Code',      # coluna dos codigos ISO 3166 de cada país
                    color = 'Individuals using the Internet (% of population)',   # cores
                    hover_name = 'Country', # coluna dos nomes dos países
                    color_continuous_scale = px.colors.sequential.Plasma   # cores definidos por plotly
                   )
# titile
fig.update_layout(
# add a title text for the plot
    title_text = 'Internet usage across the world (% population) - América do Sul',
    geo_scope = 'south america'                          # modificar
)
#
fig.show()    # visualiza o grafico

> ### Brasil

In [None]:
# Subconjuntos de dados especificos para uma data
br_int = internet_df[internet_df.Country == 'Brazil']   # Brasil
br_int.head()

In [None]:
# uso de cloropleth
import plotly.express as px
fig = px.choropleth(br_int,                 # dataset-subdateset a usar
                    locations = 'Code',      # coluna dos codigos ISO 3166 de cada país
                    #color = 'Individuals using the Internet (% of population)',   # cores
                    color = 'Year',
                    hover_name = 'Year', # coluna dos nomes dos países
                    color_continuous_scale = px.colors.sequential.Plasma   # cores definidos por plotly
                   )
# titile
fig.update_layout(
# add a title text for the plot
    title_text = 'Internet usage across the world (% population) - Brazil',
    geo_scope = 'south america'                 # partir em regioes
)
#
fig.show()    # visualiza o grafico

> ### Cidades do Brasil

In [None]:
# dados do Brasil
br_cities_df = pd.read_csv('data/br-cities.csv')
br_cities_df.head(10)

In [None]:
# uso de cloropleth
import plotly.express as px
fig = px.choropleth(br_cities_df,                 # dataset-subdateset a usar
                    locations = 'iso2',      # coluna dos codigos ISO 3166 de cada país
                    #color = 'Individuals using the Internet (% of population)',   # cores
                    color = 'city',
                    hover_name = 'admin_name', # coluna dos nomes dos países
                    color_continuous_scale = px.colors.sequential.Plasma   # cores definidos por plotly
                   )
# titile
fig.update_layout(
# add a title text for the plot
    title_text = 'Cidades do Brasil',
    geo_scope = 'south america'                 # partir em regioes
)
#
fig.show()    # visualiza o grafico

> ### Plotly + Density_mapbox

In [None]:
# mapa do brasil
import plotly.express as px
fig = px.density_mapbox(br_cities_df, 
                        lat='lat', 
                        lon='lon', 
                        #z='population', 
                        #radius=10,
                        center=dict(lat=-15, lon=-60), 
                        zoom=3,
                        #hover_name='city',
                        hover_data=["city", "population"],
                        height=600,
                        mapbox_style="stamen-terrain"
                       )
#fig.update_layout(mapbox_style="open-street-map")
#fig.update_layout(margin={"r":0,"t":0,"l":0,"b":0})
fig.update_layout(
    title_text = 'Cidades do Brasil',
    #geo_scope = 'south america'                 # partir em regioes
)
fig.show()

> ### Folium Map
> Instalar: ```conda install -c conda-forge folium```

In [None]:
import folium as fol
#
rio_map = fol.Map(location=(-22.9083, -43.1964))
rio_map

In [None]:
# Exemplo Mapbox Bright
#import folium as fol
#
rio0_map = fol.Map(location =[-22.9083, -43.1964],
                    zoom_start = 10, 
                    #tiles ='Mapbox Bright'  # default
                    )
# display map
rio0_map
# save file
#rio_map.save("rio0.html")

### Folium - Marker

In [None]:
# Marker
#import folium as fol
#
# define o mapa
#rio1_map = fol.Map() 
#
rio1_map = fol.Map(location =(-22.9083, -43.1964),
                    zoom_start = 9, 
                    #tiles="Stamen Terrain"
                    )
# add marker
tooltip = "Aqui!"   # label para todos os pontos
#Nova iguaçu
fol.Marker([-22.74,-43.47], 
           popup="<i>Nova Iguaçu</i>", 
           #tooltip=tooltip,   # usa um label para tdos
           tooltip='Nova Iguaçu',
           icon=fol.Icon(color="green"),
).add_to(rio1_map)
#Petropolis
fol.Marker([-22.505,-43.1789], 
           popup="<b>Petrópolis</b>", 
           tooltip='Petrópolis',
           icon=fol.Icon(icon="cloud"),
).add_to(rio1_map)
#Araruama
fol.Marker([-22.8763, -42.3393], 
           popup="<b>Araruama</b>", 
           tooltip='Araruama',
           icon=fol.Icon(color="red", icon="info-sign"),
).add_to(rio1_map)
#
# display map
rio1_map
# save file
#rio_map.save("rio0.html")

> ### Folium + JSON

In [58]:
# leitura do arquivo json
import json
#
br_estados = 'data/br_states.json'        # arquivo json
geo_json_data = json.load(open(br_estados))
#geo_json_data

In [None]:
#import folium as fol
#
br_states_map = fol.Map(
        width=800, 
        height=500,
        location =(-15.77972, -47.92972),
        zoom_start = 4, 
        #tiles="Stamen Terrain"
    )

fol.GeoJson(geo_json_data).add_to(br_states_map)
#
br_states_map

A função com os recursos de estilização em forma de lambda pode ser utilizada para preencher o mapa com cor, assim como alterar a cor e espessura das linhas, etc.

In [None]:
map_brasil = fol.Map(width=800,height=500,
            location=(-15.77972, -47.92972), 
            zoom_start=4
            )
#
fol.GeoJson(geo_json_data,
            style_function=lambda feature: {
                            'fillColor': 'green',
                            'color': 'red',
                            'weight': 0.5,
            }
).add_to(map_brasil)
#
map_brasil

### Folium + JSON + Data

In [None]:
#br_states_df = pd.read_csv('data/br_state_uf.csv',encoding='utf-8',delimiter=';')
br_states_df = pd.read_csv('data/br_state_uf.csv',encoding="latin-1",sep=';')
br_states_df.head()

In [None]:
#import folium as fol
#from branca.colormap import linear
# barra de cores
#colormap = linear.YlOrRd_09.scale(6,20)
#colormap 
#
br_states_map = fol.Map(
    width=800, 
    height=500,
    location =(-15.77972, -47.92972),
    zoom_start = 4, 
    #tiles="Stamen Terrain"     # cores do mapa
)

#fol.GeoJson(geo_json_data).add_to(br_states_map)
# 
fol.Choropleth(
    geo_data = geo_json_data,   # ados do arquivo json
    name="População do Brasil",
    data=br_states_df,          # uso de dataset
    columns=["uf", "population_2020"],
    key_on="feature.id",
    fill_color="YlOrRd",
    fill_opacity=0.7,
    line_opacity=0.2,
    legend_name="Polulação estimada até 2020",
).add_to(br_states_map)
#
fol.LayerControl().add_to(br_states_map)
#
br_states_map

>### Geopandas
>> **Instalação**: 
>>
>> **Manual**:
>> 1. descates: ```conda install -c conda-forge descartes```
>> 2. shapely: ```conda install -c conda-forge shapely```
>> 3. pyproj: ```conda install -c conda-forge pyproj```
>> 4. fiona: ```conda install -c conda-forge fiona```
>> 5. gdal: ```conda install -c conda-forge gdal```
>> 6. geopandas: ```conda install -c conda-forge geopandas```
>>
>> **Anaconda**:```conda install geopandas``` ou ```conda install --channel conda-forge geopandas```
>
> Maiores informações: [Geopandas](https://geopandas.org/en/stable/getting_started/install.html)

In [None]:
# tabelas - estados - usando arquivos shp
import geopandas as gpd   # geopandas
#
br_estados_df = gpd.read_file('data/shp/gadm36_BRA_1.shp')
# plot
br_estados_df.plot(cmap='YlOrRd');
br_estados_df.head()

In [None]:
# criando novo dataframe
estados_df = br_estados_df[['NAME_1','geometry']]
estados_df.head()

In [None]:
# mudar o nome de coluna 
estados_df = estados_df.rename({'NAME_1': 'Uf'}, axis = 1)
estados_df.head()

In [None]:
# dados do Brasil
br_estados_df = pd.read_csv('data/brasil_estados.csv',delimiter=';')
br_estados_df.head()

In [None]:
pop_est_df = br_estados_df[['Uf','Capital','População']]
pop_est_df.head()

In [None]:
# merge (df1,df2)
uf_geo_pop = estados_df.merge(pop_est_df, on='Uf',how='left')
uf_geo_pop.head()

In [None]:
# dados do Brasil
br_df = pd.read_csv('data/brasil.csv',delimiter=',')
print(len(br_df))
br_df.head()

In [None]:
uf_geo_pop.head()

In [None]:
%matplotlib inline
#
uf_geo_pop.plot(column='População',
                cmap = 'Reds',
                figsize = (16,10),
                legend = True,
                edgecolor = 'black'
               );

Leitura de arquivos JSON

In [None]:
import json
from urllib.request import urlopen

with urlopen('https://raw.githubusercontent.com/codeforamerica/click_that_hood/master/public/data/brazil-states.geojson') as response:
    BR = json.load(response) # Javascrip object notation 
#
BR

In [88]:
state_id_map = {}
for feature in BR ['features']:
    feature['id'] = feature['properties']['name']
    state_id_map[feature['properties']['sigla']] = feature['id']

In [None]:
# produção de soja - SIDRA-IBGE
import pandas as pd
soybean = pd.read_csv('https://raw.githubusercontent.com/nayanemaia/Dataset_Soja/main/soja%20sidra.csv')
soybean.head()

In [None]:
import plotly.express as px
#
fig = px.choropleth(
     soybean, #soybean database
     locations = 'Estado', #define the limits on the map/geography
     geojson = BR, #shape information
     color = "Produção", #defining the color of the scale through the database
     hover_name = 'Estado', #the information in the box
     hover_data =["Produção","Longitude","Latitude"],
     title = "Produtivida da soja (Toneladas)", #title of the map
     animation_frame = 'ano' #creating the application based on the year
)
fig.update_geos(fitbounds = "locations", visible = False)
fig.show()

In [None]:
uf_geo_pop.head()

In [None]:
#import plotly.express as px
#
fig = px.choropleth(
     uf_geo_pop,
     locations = 'Uf', #define the limits on the map/geography
     geojson = BR, #shape information
     color = "População", #defining the color of the scale through the database
     hover_name = 'Capital', #the information in the box
     hover_data =["População"],
     title = "População x Estado", #title of the map
     #animation_frame = 'População' #creating the application based on the year
)
fig.update_geos(fitbounds = "locations", visible = False)
fig.show()

> ### Plotly + Geopandas

In [None]:
# exemplo plotly + geopandas geopandas
import plotly.express as px
import geopandas as gpd

#geo_df = gpd.read_file(gpd.datasets.get_path('naturalearth_cities'))
geo_df = gpd.read_file(gpd.datasets.get_path('naturalearth_cities'))
print(geo_df)                                                          # visualizar valores
#print('lat:',geo_df.geometry.y)                                        # visualiza latitude
#print('lon:',geo_df.geometry.x)                                        # visualiza longitude
#px.set_mapbox_access_token(open(".mapbox_token").read())
fig = px.scatter_geo(geo_df, lat=geo_df.geometry.y, lon=geo_df.geometry.x, hover_name="name")
fig.show()

In [94]:
# Exemplo de Brasilia
Brasilia = geo_df[geo_df['name']=='Brasilia']
#Brasilia

In [None]:
br = px.scatter_geo(Brasilia, lat=Brasilia.geometry.y, lon=Brasilia.geometry.x, hover_name="name")
br.show()

In [None]:
# leitura dos dados do dataset total
world_df = gpd.read_file(gpd.datasets.get_path('naturalearth_lowres'))
world_df

> ### GeoDataFrame

In [None]:
# construindo um geoDataFrame
w_df = gpd.GeoDataFrame(world_df)
w_df.head()

In [None]:
# sul america
sa_df = w_df[w_df.continent == 'South America']
sa_df.head()

In [None]:
# sul amrerica
fig, ax = plt.subplots(1, 1)
ax.legend('Sul America')
sa_df.plot(column='pop_est', ax=ax, legend=True);

In [None]:
#  geometria multipoligonos
paises = sa_df[['name','geometry']]
paises.head()

In [None]:
# transformar multipoligono em pontos
pontos = paises.copy()
pontos.head()
# muda a geomtria (usar: to_crs("EPSG:3395"))
pontos = pontos.to_crs("EPSG:3395")
pontos.geometry = pontos['geometry'].centroid
pontos.head()

In [None]:
# Paises sulamericanos
f, sx = plt.subplots(1, figsize=(5,8))
#sx.set_axis_on()
#f.suptitle('Sulamerica')
# Plot area
ax = sa_df.plot(ax=sx, facecolor='blue', alpha=1, linewidth=0, cmap='YlOrRd')
#
#sa = px.scatter_geo(sa_df, lat=pontos.geometry.y, lon=pontos.geometry.x, color="name")
#sa.show()

In [None]:
#sa = px.scatter_geo(sa_df, lat=sa_df.geometry.y, lon=sa_df.geometry.x, hover_name="name")
#sa.show()

> ### Brasil

In [None]:
# procurando dados do Brasil
br_df = world_df[(world_df.continent =='South America') & (world_df.name =='Brazil')]
br_df

In [None]:
# Brazil
#
fig, ax = plt.subplots(1, 1)
ax.legend('Brazil')
br_df.plot(column='pop_est', ax=ax, legend=True);

### Pandemia - COVID-19

In [None]:
# dataset covid-19 do 18-02-2021
cidades =  pd.read_csv('data/covid-19_casos_full.csv',delimiter=',')
cidades.head()

In [None]:
# 5 ultimos registros
cidades.tail()

In [None]:
# Estado do Rio
estado_rj = cidades[cidades['state'] == 'RJ']
print(estado_rj.head(10))
#print(estado_rj.tail())

In [None]:
# Estado do Rio de Janeiro
estado_rj.tail(10)

In [None]:
# a que periodo se refere os dados?
import datetime
#
print('Dados do estado de Rio de Janeiro:')
print('> Data atual:',datetime.datetime.now())
today = datetime.datetime.now().strftime('%d/%m/%Y')
# datas dos dados
print('> Data inicial:',min(estado_rj['date']))
print('> Data final:',max(estado_rj['date']))

> **Pergunta**: Qual a incidência diária de casos confirmados e mortes no período?

In [None]:
# Síntese diária
agrupados = estado_rj.groupby(['date'])[['new_confirmed','new_deaths']].agg('sum')
agrupados.head()

In [99]:
# grafico
import plotly.graph_objects as go
from plotly.subplots import make_subplots
from plotly.graph_objs import *
#
layout = Layout(
    paper_bgcolor='rgba(0,0,0,0)',
    plot_bgcolor='rgba(0,0,0,0)',
    title="Visualização Conjunta de Casos Confirmados e Óbitos até ")

In [None]:
fig = go.Figure(data=[
    go.Bar(name='Confirmados', x=agrupados.index, y=agrupados['new_confirmed']),
    go.Bar(name='Óbitos', x=agrupados.index, y=agrupados['new_deaths'])])
#
fig.update_xaxes(title_text='Data')
fig.update_yaxes(title_text='Quantidade')
fig.update_layout(barmode='stack')
fig['layout'].update(layout)
#
fig.show()

In [None]:
# leitura do arquivo json
import json
#
rj_mun = 'data/geojs-33-mun.json'        # arquivo json municipios de RJ
mun_rj_json_data = json.load(open(rj_mun))
#mun_rj_json_data
muni = mun_rj_json_data['features'][0]
m = muni['properties']
print(m['name'])

In [None]:
import folium as fol
#from branca.colormap import linear
# barra de cores
#colormap = linear.YlOrRd_09.scale(6,20)
#colormap 
#
br_states_map = fol.Map(
    width=800, 
    height=600,
    location =[-22.9083, -43.1964],
    zoom_start = 7, 
    tiles="Stamen Terrain"     # cores do mapa
)

#fol.GeoJson(geo_json_data).add_to(br_states_map)
# 
fol.Choropleth(
    geo_data = mun_rj_json_data,   # ados do arquivo json
    name = "Covid19",
    #data = estado_rj,  # uso de dataset
    data = agrupados,
    columns=["new_confirmed", "new_deaths"],
    key_on="feature.properties.name",
    #key_on="feature.name",
    fill_color="YlOrRd",
    fill_opacity=0.7,
    line_opacity=0.2,
    legend_name="Casos confirmados",
).add_to(br_states_map)
#
fol.LayerControl().add_to(br_states_map)
#
br_states_map

## Geoplotlib

> ## Instalação:
> **Anaconda**:
>> pyglet: ```conda install -c conda-forge pyglet```
>>
>> geoplotlib: ```conda install -c conda-forge geoplotlib```
>>
> **pip**:
>> pyglet: ```pip install Pyglet```
>>
>> geoplotlib: ```pip install geoplotlib```
>
>- Busca dados de *Latitude* e *Longitude* - https://www.latlong.net/
>- Buscar dataset com dados geoespaciais: - https://simplemaps.com/data/world-cities

In [None]:
# Exemplo
import geoplotlib as geo
#
br_cities = pd.read_csv('data/br-cities.csv',delimiter=',')
br_cities.head()

In [None]:
geo.dot(br_cities,point_size=3)
geo.show()

In [None]:
rio = br_cities[br_cities['admin_name']=='Rio de Janeiro']
rio.head(10)

In [None]:
geo.dot(rio,point_size=5)
geo.show()

---
#### Fudamentos para Ciência Dados &copy; Copyright 2021, 2022, 2024 - Sergio Serra & Jorge Zavaleta