In [1]:
import numpy as np
import pandas as pd
import sys, os, json, csv

https://covid.saude.gov.br/

https://github.com/leogermani/estados-e-municipios-ibge/blob/master/estados.csv



In [2]:
data = '../data'
df = pd.read_csv(f'{data}/brasil.csv', sep=';', encoding='utf-8')
df.columns = ['região'] + df.columns.tolist()[1:]
df.head()

Unnamed: 0,região,estado,data,casosNovos,casosAcumulados,obitosNovos,obitosAcumulados
0,Norte,RO,2020-01-30,0,0,0,0
1,Norte,RO,2020-01-31,0,0,0,0
2,Norte,RO,2020-02-01,0,0,0,0
3,Norte,RO,2020-02-02,0,0,0,0
4,Norte,RO,2020-02-03,0,0,0,0


In [5]:
estados = pd.read_csv(f'{data}/estados.csv')
estados.loc[0]['COD'], estados.loc[0]['NOME'], estados.loc[0]['SIGLA']

(35, 'São Paulo', ' SP')

padding

In [6]:
def remove_padding(row):
    row['SIGLA'] = row['SIGLA'][1:]
    return row

estados = estados.apply(remove_padding, axis=1)
estados = estados.set_index('SIGLA')
estados.head()

Unnamed: 0_level_0,COD,NOME
SIGLA,Unnamed: 1_level_1,Unnamed: 2_level_1
SP,35,São Paulo
PR,41,Paraná
SC,42,Santa Catarina
RS,43,Rio Grande do Sul
MS,50,Mato Grosso do Sul


In [7]:
estados.loc['RO']

COD           11
NOME    Rondônia
Name: RO, dtype: object

In [11]:
def completa_info(row, estados_df):
    estado = estados_df.loc[row['estado']]
    row['estado_nome'] = estado['NOME']
    row['cod_estado'] = estado['COD']
    row['data'] = '-'.join(row['data'].split('/')[::-1])
    return row

df = df.apply(completa_info, estados_df=estados, axis=1)
df.head()

Unnamed: 0,região,estado,data,casosNovos,casosAcumulados,obitosNovos,obitosAcumulados,estado_nome,cod_estado
0,Norte,RO,2020-01-30,0,0,0,0,Rondônia,11
1,Norte,RO,2020-01-31,0,0,0,0,Rondônia,11
2,Norte,RO,2020-02-01,0,0,0,0,Rondônia,11
3,Norte,RO,2020-02-02,0,0,0,0,Rondônia,11
4,Norte,RO,2020-02-03,0,0,0,0,Rondônia,11


Casos de recuperação

In [None]:
df.sort_values(['data'], inplace=True)

falar do range de datas

In [11]:
df.loc[0]['data'], df.loc[len(df) - 1]['data']

('2020-01-30', '2020-04-10')

gerar json

In [12]:
states = df['estado_nome'].unique()
days_before = [0] * 8
dates_before = ['2020-01-{}'.format(n) for n in range(22, 30)]
print(dates_before)

['2020-01-22', '2020-01-23', '2020-01-24', '2020-01-25', '2020-01-26', '2020-01-27', '2020-01-28', '2020-01-29']


In [15]:
covid_jsons = []
for state in states:
    ts_segment = df[df['estado_nome'] == state].copy().reset_index(drop=True)
    
    covid_json = {
        'estado': state,
        'cod_estado': int(ts_segment.loc[0]['cod_estado']),
        'dates': dates_before + ts_segment['data'].tolist(),
        'confirmed': days_before + ts_segment['casosAcumulados'].tolist(),
        'deaths': days_before + ts_segment['obitosAcumulados'].tolist(),
        'recovered': [0] * (8 + len(ts_segment)),
        'newConfirmed': days_before + ts_segment['casosNovos'].tolist(),
        'newDeaths': days_before + ts_segment['obitosNovos'].tolist(),
        'newRecovered': [0] * (8 + len(ts_segment))
    }
    covid_jsons.append(covid_json)

In [16]:
with open(f'{data}/brasil_covid.json', 'w', encoding='utf-8') as f:
    json.dump(covid_jsons, f, ensure_ascii=False)

In [18]:
chart_json = {}

for state in states:
    segment = df[df['estado_nome'] == state].copy().reset_index()

    daily = []
    for index, row in segment.iterrows():
        daily.append({
            'date': row['data'],
            'confirmed': row['casosAcumulados'],
            'deaths': row['obitosAcumulados'],
            'recovered': 0,
            'newConfirmed': row['casosNovos'],
            'newDeaths': row['obitosNovos'],
            'newRecovered': 0
        })
    
    chart_json[state] = {
        'country': state,
        'data': daily
    }

In [19]:
chart_json

{'Rondônia': {'country': 'Rondônia',
  'data': [{'date': '2020-01-30',
    'confirmed': 0,
    'deaths': 0,
    'recovered': 0,
    'newConfirmed': 0,
    'newDeaths': 0,
    'newRecovered': 0},
   {'date': '2020-01-31',
    'confirmed': 0,
    'deaths': 0,
    'recovered': 0,
    'newConfirmed': 0,
    'newDeaths': 0,
    'newRecovered': 0},
   {'date': '2020-02-01',
    'confirmed': 0,
    'deaths': 0,
    'recovered': 0,
    'newConfirmed': 0,
    'newDeaths': 0,
    'newRecovered': 0},
   {'date': '2020-02-02',
    'confirmed': 0,
    'deaths': 0,
    'recovered': 0,
    'newConfirmed': 0,
    'newDeaths': 0,
    'newRecovered': 0},
   {'date': '2020-02-03',
    'confirmed': 0,
    'deaths': 0,
    'recovered': 0,
    'newConfirmed': 0,
    'newDeaths': 0,
    'newRecovered': 0},
   {'date': '2020-02-04',
    'confirmed': 0,
    'deaths': 0,
    'recovered': 0,
    'newConfirmed': 0,
    'newDeaths': 0,
    'newRecovered': 0},
   {'date': '2020-02-05',
    'confirmed': 0,
    'deat