In [3]:
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
%run param.ipynb
%matplotlib inline
def load_data(endereco,formato='.csv',separador=';'):
    #https://covid.saude.gov.br/
    endereco = endereco+formato
    data = pd.read_csv(endereco,sep=';')
    data = data.sort_values('data')
    data = data.fillna(0)
    data = casesNdeaths_mi(data)
    return data
def get_states(data):
    estado = data.loc[data['estado']!=0,'estado'].value_counts().index
    return estado
def get_city(data,estado):
    cidades = data.loc[(data['estado']==estado) & (data['municipio']!=0),'municipio'].value_counts().index
    return cidades
def cases_city(data,estado,target,n=20,plot=True):
    cidades = get_city(data,estado)
    local = []
    numero = []
    for city in cidades:
        local.append(city)
        numero.append(float(data.loc[data['municipio']==city,target].tail(1)))
    data = pd.DataFrame()
    data['local'] = local
    data[target] = numero
    print(len(data), 'cidades registradas em', estado)
    data = data.sort_values(by=target, ascending=False).reset_index(drop=True)
    if plot is True:
        horizontal_barplot(data,estado,target,n)
    return data
def cases_states(data,target,n=20,plot=True):
    estados = get_states(data)
    local = []
    numero = []
    for state in estados:
        local.append(state)
        numero.append(float(data.loc[(data['estado']==state) & (data['municipio']==0) & (data['codmun']==0),target].tail(1)))
    data = pd.DataFrame()
    data['local'] = local
    data[target] = numero
    print(len(data), 'estados registrados no Brasil')
    data = data.sort_values(by=target, ascending=False).reset_index(drop=True)
    if plot is True:
        estado = None
        horizontal_barplot(data,estado,target,n)
    return data
def casesNdeaths_mi(data):
    data['casos_mi'] = data['casosAcumulado']/(data['populacaoTCU2019']/mi)
    data['obitos_mi'] = data['obitosAcumulado']/(data['populacaoTCU2019']/mi)
    data['taxaContaminação'] = (data['casosAcumulado']/data['populacaoTCU2019'])*100
    data['taxaMortalidade'] = (data['obitos_mi']/data['casos_mi'])*100
    return data
def horizontal_barplot(data,estado,target,n=20,pasta='cidades',save=True):
    if estado is None:
        label = 'top '+str(n)+' estados do Brasil'
        pasta = 'brasil'
    else:
        label = 'top '+str(n)+' cidades do estado de '+str(estado)
    plt.figure(figsize=(l,h))
    plt.grid(color='grey', linestyle='-', linewidth=1)
    if max(data[target])>2:
        if max(data[target])<20:
            k=1
        elif max(data[target])<1000:
            k=10
        elif max(data[target])<4000:
            k=50
        elif max(data[target])<15000:
            k=250
        elif max(data[target])<30000:
            k=500
        else:
            k=1000
        plt.xticks(np.arange(min(data[target]), max(data[target])+1, k),rotation=70)
    sns.barplot(x=target, y='local', data=data.head(n))
    if save is True:
        plt.savefig('graficos/'+str(pasta)+'/'+label+'_'+str(target)+'.png')
def data_barplot(data,target,estado=0,municipio=0,pasta='estados',save=True,ticks=None,label=None):
    plt.figure(figsize=(l,h))
    plt.grid(color='grey', linestyle='-', linewidth=1)
    if label is None:
        if estado == 0:
            label = str(target)+'_Brasil'
            pasta = 'brasil'
        else:
            label = str(target)+'_'+str(estado)+'_'+str(municipio)
    plt.title(label)
    plt.xlabel('data')
    plt.ylabel(target)
    plt.xticks(rotation=70)
    if ticks is not None:
        plt.yticks(np.arange(min(data[target]), max(data[target]), ticks))
    sns.barplot(x='data', y=target, data=data.loc[(data['estado']==estado) & (data['municipio']==municipio)])
    if save is True:
        plt.savefig('graficos/'+str(pasta)+'/'+label+'.png')
def data_lineplot(data,target,estado=0,municipio=0,pasta='estados',save=True,label=None):
    plt.figure(figsize=(l,h))
    plt.grid(color='grey', linestyle='-', linewidth=1)
    if label is None:
        if estado == 0:
            label = 'Brasil_'+str(target)
            pasta = 'brasil'
        else:
            label = str(estado)+'_'+str(municipio)+'_'+str(target)
    plt.title(label)
    plt.xlabel('data')
    plt.ylabel(target)
    plt.xticks(rotation=70)
    for view in target:
        sns.lineplot(x='data', y=view, data=data.loc[(data['estado']==estado) & (data['municipio']==municipio)])
    if save is True:
        plt.savefig('graficos/'+str(pasta)+'/'+label+'.png')
def data_lineplot_v2(data,target,estado1,estado2,pasta='estados',save=True,label=None):
    if label is None:
        label = str(estado1)+'_X_'+str(estado2)+'_'+str(target)
    data = data.loc[((data['estado']==estado1) & (data['municipio']==0) & (data['codmun']==0)) | ((data['estado']==estado2) & (data['municipio']==0) & (data['codmun']==0))]
    plt.figure(figsize=(l,h))
    plt.grid(color='grey', linestyle='-', linewidth=1)
    plt.title(label)
    plt.xlabel('data')
    plt.ylabel(target)
    plt.xticks(rotation=70)
    sns.lineplot(x='data', y=target, hue='estado', data=data)
    if save is True:
        plt.savefig('graficos/'+str(pasta)+'/'+label+'.png')


In [3]:
print('**********************************************All functions are loaded!\n')

All functions are loaded!

