![](images/ds_rural.png)

# Módulo 3

## Pandas e gráficos avanzados

**Casos reais**

In [None]:
# exemplo
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

In [None]:
# dataset por cidade
cidades =  pd.read_csv('data/brazil_covid19_cities.csv',delimiter=',')
cidades.head()

In [None]:
# 5 ultimos registros
cidades.tail()

In [None]:
# Estado do Rio
estado_rj = cidades[cidades['state'] == 'RJ']
estado_rj.head(10)

In [None]:
# Estado do Rio de Janeiro
estado_rj.tail(10)

**Exemplo** sobre COVID19 áte 28-06-2020

In [None]:
# Covid no Brasil ate 28-06-202
brasil_28_06 =  pd.read_csv('data/brazil_covid19.csv',delimiter=',')
brasil_28_06.head()

In [None]:
# cidades do Rio de Janeiro - tail
brasil_28_06.tail()

In [None]:
# a que periodo se refere os dados?
import datetime
print('Data atual:',datetime.datetime.now())
today = datetime.datetime.now().strftime('%d/%m/%Y')
# datas dos dados
print('Data inicial:',min(brasil_28_06['date']))
print('Data final:',max(brasil_28_06['date']))

**Pergunta**: Qual a incidência diária de casos suspeitos, confirmados e mortes no período?

In [None]:
## Síntese diária
agrupados = brasil_28_06.groupby(['date'])['cases','deaths'].agg('sum')
agrupados.head()

In [None]:
#!pip install ploty # conda install -c plotly plotly

In [None]:
# grafico
import plotly.graph_objects as go
from plotly.subplots import make_subplots
from plotly.graph_objs import *
#
layout = Layout(
    paper_bgcolor='rgba(0,0,0,0)',
    plot_bgcolor='rgba(0,0,0,0)',
    title="Visualização Conjunta de Casos e Óbitos até " + today,)

In [None]:
fig = go.Figure(data=[
    go.Bar(name='Confirmados', x=agrupados.index, y=agrupados['cases']),
    go.Bar(name='Óbitos', x=agrupados.index, y=agrupados['deaths'])])
fig.update_xaxes(title_text='Data')
fig.update_yaxes(title_text='Quantidade')
fig.update_layout(barmode='stack')
fig['layout'].update(layout)
#
fig.show()

### Graficando dados discretos

In [None]:
# graficando valores discretos
x = np.linspace(-1,4,50)
y = 3*(np.power(x,4)) - 16*(np.power(x,3))+18*(np.power(x,2))
#
plt.plot(x, y, 'o', color='red');

In [None]:
# usando scatter
plt.scatter(x, y,marker='o',color='red');

In [None]:
# usando scatter
rng = np.random.RandomState(0)
x1 = rng.randn(100)
y1 = rng.randn(100)
colors = rng.rand(100)
sizes = 1000 * rng.rand(100)
plt.scatter(x1, y1, c=colors, s=sizes, alpha=0.5,cmap='viridis')
plt.colorbar(); 

In [None]:
# Barras de erros
dy = 15.0
y2 = y + dy * np.random.randn(50)
#
plt.errorbar(x,y2,yerr=dy,fmt='.r')
plt.grid();
plt.xlabel('Barras de Errores')

In [None]:
# definicao de funcoes
def f1(x):
    return 3*(np.power(x,4)) - 16*(np.power(x,3))+18*(np.power(x,2))
#
def f(x,y):
    return f1(x)*10+f1(10+y*x)

In [None]:
# graficos tri-dimensionais
X, Y = np.meshgrid(x, y)
Z = f(X,Y)
plt.contour(X, Y, Z, colors='blue');

In [None]:
def f2(x, y):
    return np.sin(x) ** 10 + np.cos(10 + y * x) * np.cos(x)

In [None]:
# contornos
x2 = np.linspace(0, 5, 50)
y2 = np.linspace(0, 5, 40)
X1, Y1 = np.meshgrid(x2, y2)
Z1 = f2(X1, Y1)
plt.contour(X1, Y1, Z1, colors='red');

## Histogramas

In [None]:
#plt.hist(agrupados);

In [None]:
# usando agrupados
#xt =agrupados.index
#yt =agrupados['cases']
#plt.hist(yt);

In [None]:
# histograma
#plt.style.use('seaborn-white')
data = np.random.randn(1000)
plt.hist(data);

In [None]:
# varios histogramas
x3 = np.random.normal(0, 0.8, 1000)
x4 = np.random.normal(-2, 1, 1000)
x5 = np.random.normal(3, 2, 1000)
kwargs = dict(histtype='stepfilled', alpha=0.5, density=True, bins=30)
plt.hist(x3, **kwargs)
plt.hist(x4, **kwargs)
plt.hist(x5, **kwargs);

In [None]:
# outra funcao
y1 = 3*(np.power(x,2)) - 16*(np.power(x,3))+18*(np.power(x,3))

In [None]:
# melhorara a apresentacao: sem borde
# constrained_layout=True
fig, To = plt.subplots(nrows=1, figsize=(8 , 4))
To.plot(x,y,'r',linewidth =1.5, label ='f1')
To.plot(x,y1,'g',linewidth =1.5,label ='f2')
To.set_ylabel ('eixo y')
To.set_xlabel ('Valores do eixo x')
To.set_title ('$f(x)$')
To.legend ()
To.grid()
# Turn off top/ right axes
for ax in (To,):
    ax.spines['top'].set_visible( False )
    ax.spines['right'].set_visible( False )
    ax.get_xaxis().tick_bottom ()
    ax.get_yaxis().tick_left ()
#
plt.tight_layout()

## Visualização com Seaborn

In [None]:
# Criando os dados
rng = np.random.RandomState(0)
xx = np.linspace(0, 10, 500)
yy = np.cumsum(rng.randn(500, 6), 0)

In [None]:
# grafico com borde e legenda com borde
plt.plot(xx, yy)
#plt.legend('ABCDEF', ncol=2, loc='upper left');
#plt.legend('ABCDEF', ncol=2, loc='lower right');
plt.legend('ABCDEF', ncol=2, loc='lower left');

In [None]:
# usando seaborn
import seaborn as sns
sns.set()
plt.plot(xx, yy)
plt.legend('ABCDEF', ncol=2, loc='upper left');

## Seaborn Histogramas, KDE e densidades

In [None]:
#
data = np.random.multivariate_normal([0, 0], [[5, 2], [2, 2]], size=2000)
data = pd.DataFrame(data, columns=['x', 'y'])
for col in 'xy':
    plt.hist(data[col], density=True, alpha=0.5)

In [None]:
brasil_28_06.head()

In [None]:
#
for col in 'xy':
    sns.kdeplot(data[col], shade=True)

In [None]:
agrupados = pd.DataFrame(brasil_28_06)
agrupados

In [None]:
colunas1 = brasil_28_06.columns
colunas1

In [None]:
casos_conf = brasil_28_06.groupby('date').agg({'cases':np.sum})
casos_conf

In [None]:
# histograma
plt.hist(casos_conf['cases'],bins=30);

In [None]:
casos_mortos = brasil_28_06.groupby('date').agg({'deaths':np.sum})
casos_mortos

In [None]:
# histograma
plt.hist(casos_mortos['deaths'],bins=30);

In [None]:
casos_mortosx = casos_conf.merge(casos_mortos, left_index=True, right_index=True)
casos_mortosx

In [None]:
# agrupados
agrupados = brasil_28_06.groupby(['cases','deaths'])
sa = agrupados.sum()
#sa.head()

In [None]:
# limpando
brasil_28_06['date'] = pd.to_datetime(brasil_28_06['date'])
brasil_28_06.head()

In [None]:
# valores inconsistentes
brasil_28_06.isna().sum()

In [None]:
#vivos = casos — deaths
brasil_28_06['vivos'] = brasil_28_06['cases']-brasil_28_06['deaths']
brasil_28_06

In [None]:
# agrupados
full_agrupados = brasil_28_06.groupby(['date', 'region','state'])['cases', 'deaths', 'vivos'].sum().reset_index()
full_agrupados

In [None]:
# usando seaborn
sns.distplot(data['x'])
sns.distplot(data['y']);

In [None]:
with sns.axes_style('white'):
    sns.jointplot("x", "y", data, kind='kde');

In [None]:
# seaborn
with sns.axes_style('white'):
    sns.jointplot("date", "cases", full_agrupados, kind='kde');

In [None]:
# modificando  tipo
with sns.axes_style('white'):
     sns.jointplot("cases", "deaths", full_agrupados, kind='hex');

In [None]:
# exemplo
with sns.axes_style('white'):
    sns.jointplot("x", "y", data, kind='hex')

In [None]:
# plot covid19 por estado
sns.pairplot(full_agrupados, hue='state', height=2.5);

In [None]:
# plot do covid19 por regiao
sns.pairplot(full_agrupados, hue='region', height=2.5);

In [None]:
# visualizar dados
full_agrupados

In [None]:
# order=range(2001, 2015)
#factorplot
with sns.axes_style('white'):
    g = sns.catplot("state", data=full_agrupados, aspect=4.0, 
                       kind='count', hue='region')
    g.set_ylabels('Regions com Covid19')

In [None]:
# seaborn
g = sns.PairGrid(full_agrupados, vars=['date', 'cases', 'deaths', 'vivos'],
                 hue='region', palette='RdBu_r')
g.map(plt.scatter, alpha=0.8)
g.add_legend();

Exercícios:
1. Apresentar os graficos do dataset brasil_28_06 por estados com total de casos confirmados e mortos.

---
Python pada Dada Science - Profs. [Jorge Zavaleta](zavaleta@pet-si.ufrrj.br) - Sergio Serra - Macário Costa.