![Funcional Health Tech](logo.png "Logo")

**COVID19 - Análise do Surto Brasileiro**

# Análise Exploratória de Dados: Execuções Parametrizadas Diversas

Neste *notebook* centralizamos a execução e parametrização das outras análises exploratórias de dados fornecidas neste projeto. Isso feito através da biblioteca [papermill](https://papermill.readthedocs.io/en/latest/index.html), que permite a execução parametrizada de *notebooks* Jupyter.

**ADVERTÊNCIA:** os modelos e números aqui apresentados não são afirmações formais sobre o progresso da doença, mas apenas exercícios que demonstram técnicas de modelagem e cenários de aplicação.

## Preliminares
Bibliotecas, configurações e parâmetros.

In [1]:
import os
import math
import hyperopt
import papermill as pm
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['figure.figsize'] = [16, 8]
import seaborn as sns
sns.set()

from pandas.plotting import register_matplotlib_converters
register_matplotlib_converters()

In [2]:
plt.style.use('fivethirtyeight')

In [3]:
os.getcwd()

'/root/covid19-analytics/notebooks'

## Parâmetros

Onde queremos armazenar resultados do modelo para posterior.

In [15]:
results_folder = '../results/notebooks/'

## Funções Auxiliares

In [24]:
def run(input_name, parameters, output_suffix='.out', kernel_name='python3', results_folder=results_folder):
    pm.execute_notebook(
       f'./{input_name}.ipynb',
       f'{results_folder}{input_name}{output_suffix}.ipynb',
       parameters=parameters,
       kernel_name=kernel_name,
       nest_asyncio=True
    )

## Análise 0: Execução padrão

Executa o *notebook* sem nenhuma customização.

In [33]:
run('eda_international', 
    parameters={}, 
    output_suffix='.regular')

HBox(children=(FloatProgress(value=0.0, description='Executing', max=95.0, style=ProgressStyle(description_wid…




## Análise 1: Ordenação por casos totais

Uma análise focando apenas em casos totais reportados oficialmente, mas aqui vamos olhar um valor maior deles.

In [36]:
run('eda_international', 
    parameters=dict(order_by='total_cases', min_cases=1000, max_locations_to_show=10, results_suffix='.custom-1'), 
    output_suffix='.total_cases')

HBox(children=(FloatProgress(value=0.0, description='Executing', max=96.0, style=ProgressStyle(description_wid…




## Análise 2: Ordenação por casos totais *per capita*

Uma análise focando em casos *per capita* pode nos permitir ver padrões diferentes, posto que leva em conta o tamanho do país em questão.

In [37]:
run('eda_international', 
    parameters=dict(order_by='total_cases_per_capita', min_cases=1000, max_locations_to_show=10, results_suffix='.custom-2'), 
    output_suffix='.total_cases_per_capita')

HBox(children=(FloatProgress(value=0.0, description='Executing', max=96.0, style=ProgressStyle(description_wid…


