# "Letalidade dos casos de SRAG no Brasil"
> "Dados dos casos de hospitalizações por SRAG do opendatasus"

- toc: true
- branch: master
- badges: true
- comments: false
- categories: [srag, letalidade]
- image: images/some_folder/your_image.png
- hide: false
- search_exclude: true
- metadata_key1: metadata_value1
- metadata_key2: metadata_value2

## Informações sobre os dados utilizados

### Localização
- Páginas com informações completas sobre os conjuntos de dados: [2019](https://opendatasus.saude.gov.br/dataset/bd-srag-2019), [2020](https://opendatasus.saude.gov.br/dataset/bd-srag-2020), [2021](https://opendatasus.saude.gov.br/dataset/bd-srag-2021)

### Origem e contexto

Desde 2009, com a pandemia de Influenza A(H1N1)pdm09, a Secretaria de Vigilância em Saúde (SVS), vinculada ao Ministério da Saúde, desenvolve a vigilância da Síndrome Respiratória Aguda Grave (SRAG) no Brasil. Em 2020 a vigilância da COVID-19 foi incorporada na rede de vigilância da Influenza e outros vírus respiratórios.

Atualmente, o sistema oficial para o registro dos casos e óbitos de SRAG no Brasil é o Sistema de Informação da Vigilância Epidemiológica da Gripe (SIVEP-Gripe).

Todos os bancos de dados epidemiológicos de SRAG, desde 2009 até os dias atuais (2021), são disponibilizados no portal https://opendatasus.saude.gov.br. 

### Informações adicionais

- No Guia de Vigilância Epidemiológica Emergência de Saúde Pública de Importância Nacional pela Doença pelo Coronavírus 2019 estão disponíveis informações sobre definições de casos, critérios de confirmação e encerramento dos casos, dentre outros. [link](https://portalarquivos.saude.gov.br/images/af_gvs_coronavirus_6ago20_ajustes-finais-2.pdf)

- Os dados da vigilância de SRAG no Brasil disponibilizados estão sujeitos a alterações decorrentes da investigação pelas equipes de vigilância epidemiológica que desenvolvem o serviço nas três esferas de gestão.

- Os dados são disponibilizados semanalmente, às quartas-feiras, podendo, excepcionalmente, a atualização ocorrer em outro dia.

- Dicionários de dados: [2019](https://opendatasus.saude.gov.br/dataset/e99cfd21-3d8c-4ff9-bd9c-04b8b2518739/resource/457727e2-0401-4d5e-af7b-2f3bb2a7c652/download/dicionario_de_dados_srag_hospitalizado_atual-sivepgripe-2019.pdf), [2020](https://opendatasus.saude.gov.br/dataset/ae90fa8f-3e94-467e-a33f-94adbb66edf8/resource/8f571374-c555-4ec0-8e44-00b1e8b11c25/download/dicionario-de-dados-srag-hospitalizado-27.07.2020-final.pdf), [2021](https://opendatasus.saude.gov.br/dataset/9f76e80f-a2f1-4662-9e37-71084eae23e3/resource/b3321e55-24e9-49ab-8651-29cf5c8f3179/download/dicionario-de-dados-srag-hospitalizado-27.07.2020-final.pdf)

In [2]:
# %run update_srag_database.py


Reading OpenDataSus from local file <data/opendatasus/INFLUD2019.csv>. If you prefer to download last version, set "update=True".


Reading OpenDataSus from local file <data/opendatasus/INFLUD2020.csv>. If you prefer to download last version, set "update=True".


Reading OpenDataSus from local file <data/opendatasus/INFLUD2021.csv>. If you prefer to download last version, set "update=True".

df_srag.shape: (1717137, 32)
data base saved as srag.db


In [3]:
#hide

import sqlite3 as sql
import pandas as pd
from srag_functions import *

db_name = 'srag'
db_path = f'data/opendatasus/{db_name}.db'
conn = sql.connect(db_path)
df_srag = pd.read_sql(f'SELECT * FROM {db_name} WHERE ano >= 2020', conn)

In [4]:
#hide

assert df_srag.shape[1]==32

### Dimensões dos dados: número de casos e características avaliadas

In [5]:
#hide

# # outra opção de consultas...
# columns = [x_col,cat_col] + sel_cols
# columns = ','.join(columns)

# df = pd.read_sql(f'SELECT {columns} FROM srag WHERE ano >= 2020', conn)
# df.shape

In [6]:
#hide_input
#collapse_output

print('> Dimensões:\n')
print(f'\t{df_srag.shape[0]} linhas\n\t{df_srag.shape[1]} colunas')
print('\n> Colunas:')
for col,col_type in df_srag.dtypes.sort_index().items():
    print('\t{:<15}\t{:<}'.format(col,str(col_type)))

> Dimensões:

	1668609 linhas
	32 colunas

> Colunas:
	CLASSI_FIN     	object
	CLASSI_OUT     	object
	CO_MUN_NOT     	object
	CO_MUN_RES     	object
	CO_MU_INTE     	object
	CS_ESCOL_N     	object
	CS_RACA        	object
	CS_SEXO        	object
	DT_ENTUTI      	object
	DT_EVOLUCA     	object
	DT_NASC        	object
	DT_SIN_PRI     	object
	EVOLUCAO       	object
	FATOR_RISC     	object
	MUN_INTE       	object
	MUN_NOT        	object
	MUN_RES        	object
	NU_IDADE_N     	int64
	REGIAO_INTE    	object
	REGIAO_NOT     	object
	REGIAO_RES     	object
	SATURACAO      	object
	SEM_PRI        	int64
	SEM_PRI_ABS    	int64
	SUPORT_VEN     	object
	UF_INTE        	object
	UF_NOT         	object
	UF_RES         	object
	UTI            	object
	ano            	int64
	faixa_etaria   	object
	idade_anos     	float64


## Faixa Etária

In [7]:
#hide_input

x_col = 'faixa_etaria'
cat_col = ''
sel_cols=[]
selection_dict = {}
# selection_dict['UF_RES'] = ' != "nd"'
dataFrame2Chart(df_srag,x_col,cat_col,sel_cols,selection_dict,total=[1],mark_type='bar',stack='',rates=1)

Seleção :
	-----
	Número de casos selecionados: 1668609 (100.00% do total de casos disponíveis.)

	Dimensões dos dados do gráfico: (6, 9)


### Faixa Etária e Uso de Suporte Ventilatório

In [8]:
#hide_input

x_col = 'faixa_etaria'
cat_col = 'SUPORT_VEN'
# sel_cols = ['SUPORT_VEN']
# sel_cols=[]
selection_dict = {}
# selection_dict['UF_RES'] = ' != "nd"'
dataFrame2Chart(df_srag,x_col,cat_col,sel_cols,selection_dict,total=[0],mark_type='bar',stack='',rates=1)

Seleção :
	-----
	Número de casos selecionados: 1668609 (100.00% do total de casos disponíveis.)

	Dimensões dos dados do gráfico: (30, 10)


### Faixa Etária e Semana dos Primeiros Sintomas

In [9]:
#hide_input
    
x_col = 'SEM_PRI_ABS'
cat_col = 'faixa_etaria'
sel_cols = []
sliders = {'min':['SEM_PRI_ABS',10],
           'max':['SEM_PRI_ABS',61]}
# sliders = {'max':['SEM_PRI_ABS',30]}
selection_dict = {}
# selection_dict['SEM_PRI_ABS'] = ' >= 40'

dataFrame2Chart(df_srag,x_col,cat_col,sel_cols,selection_dict,sliders=sliders,total=True)

Seleção :
	-----
	Número de casos selecionados: 1668609 (100.00% do total de casos disponíveis.)

	Dimensões dos dados do gráfico: (469, 10)


## Escolaridade

In [10]:
#hide_input
#collapse_output

x_col = 'CS_ESCOL_N'
cat_col = None
sel_cols = ['UF_RES']
selection_dict = {}
selection_dict['UF_RES'] = ' != "nd"'
dataFrame2Chart(df_srag,x_col,cat_col,sel_cols,selection_dict,total=True,mark_type='bar')


Seleção :
	UF_RES  != "nd"
	-----
	Número de casos selecionados: 1668609 (100.00% do total de casos disponíveis.)

	Dimensões dos dados do gráfico: (232, 10)


## Escolaridade e Faixa Etária

In [11]:
#hide_input
#collapse_output

x_col = 'faixa_etaria'
cat_col = 'CS_ESCOL_N'
sel_cols = ['UF_RES']
# index_cols = [cat2,cat3]
selection_dict = {}
selection_dict['CS_ESCOL_N'] = "!= ['ignorado','nd','nao_se_aplica']"
# selection_dict['UF_RES'] = ' != "nd"'
# selection_dict['idade_anos'] = ' >20'  
# selection_dict['UTI'] = ' == "sim"'
dataFrame2Chart(df_srag,x_col,cat_col,sel_cols,selection_dict,total=[0,1])

Seleção :
	CS_ESCOL_N != ['ignorado','nd','nao_se_aplica']
	-----
	Número de casos selecionados: 563471 (33.77% do total de casos disponíveis.)

	Dimensões dos dados do gráfico: (856, 11)


## Raça/Cor

In [12]:
#hide_input
#collapse_output

x_col = 'CS_RACA'
cat_col = None
sel_cols = ['UF_RES']
selection_dict = {}
dataFrame2Chart(df_srag,x_col,cat_col,sel_cols,selection_dict,total=True,mark_type='bar',sort_values=True)

Seleção :
	-----
	Número de casos selecionados: 1668609 (100.00% do total de casos disponíveis.)

	Dimensões dos dados do gráfico: (203, 10)


## Raça/Cor e Faixa Etária

In [13]:
#hide_input
#collapse_output

x_col = 'faixa_etaria'
cat_col = 'CS_RACA'
sel_cols = ['UF_RES']
selection_dict = {}
selection_dict['CS_RACA'] = "!= ['ignorado','nd']"
# selection_dict['UF_RES'] = ' != "nd"'
# selection_dict['UTI'] = ' == "sim"'
dataFrame2Chart(df_srag,x_col,cat_col,sel_cols,selection_dict,total=[0,1])

Seleção :
	CS_RACA != ['ignorado','nd']
	-----
	Número de casos selecionados: 1329366 (79.67% do total de casos disponíveis.)

	Dimensões dos dados do gráfico: (848, 11)


## Sexo

### Sexo e Faixa Etária

In [14]:
#hide_input
#collapse_output

x_col = 'faixa_etaria'
cat_col = 'CS_SEXO'
sel_cols = []
# index_cols = [cat2,cat3]
selection_dict = {}
# selection_dict['UF_RES'] = ' != "nd"'
# selection_dict['idade_anos'] = ' > 40'  
# selection_dict['UTI'] = ' == "sim"'
dataFrame2Chart(df_srag,x_col,cat_col,sel_cols,selection_dict,total=False)

Seleção :
	-----
	Número de casos selecionados: 1668609 (100.00% do total de casos disponíveis.)

	Dimensões dos dados do gráfico: (18, 10)


## UF de Residência

In [33]:
def get_altair_chart(df,x_col,y_cols='ALL',cat_col=None,sel_cols=None, sliders=None, ns_opacity=1.0,chart_title='',scheme = 'lightmulti',mark_type='line',sort_values=False,y_index = -1,stack=None):

#     if mark_type == 'line':
    chart = alt.Chart(df).mark_line(point=True,strokeWidth=2) 
    if mark_type == 'area':
        chart = alt.Chart(df).mark_area() 
    
    sort_axis = 'x'
    x_col_ed = x_col
    if not cat_col:
        if mark_type == 'bar':
            chart = alt.Chart(df).mark_bar()    
        if sort_values:
#             sort_axis= 'y'
            x_col_ed=alt.X(f'{x_col}:N', sort='y')

#     brush = alt.selection(type='interval', encodings=['x']) TODO: adicionar filtro de range




#     year_slider = alt.binding_range(min=1969, max=2018, step=1)
#     slider_selection = alt.selection_single(bind=year_slider, fields=['Release_Year'], name="Release Year_")

    
    
    chart = chart.encode(
        x=x_col_ed,
#         x=alt.X(x_col,
#                 scale=alt.Scale(domain=(0, slider[x_col][0])),
#                 sort=sort_axis
#                ),
#         x = alt.X(f'{x_col}:N', scale=alt.Scale(domain=brush)), TODO: adicionar filtro de range
        tooltip=list(df.columns),
    ).properties(
        width=600,
        height=400
    )#.interactive()
    

    if sliders:
        for key,value in sliders.items():
#             print(key,value)
#             if key in ['min','max']:
            if key == 'min':
                comparisson = '>='
            elif key == 'max':
                comparisson = '<='
            else:
                print(f"Atenção: a chave '{key}' não é válida para a variável sliders. Usar apenas 'min' ou 'max'")
                
                continue
            if type(value) is list:
                slider_col = value[0]
                if len(value) > 1:
                    init_value = value[1]
                else:
                    init_value = eval(f'{key}(df[slider_col])')
            else:   
                slider_col = value
                init_value = eval(f'{key}(df[slider_col])')

#             print(key,slider_col,init_value,comparisson)
            if slider_col in df.columns:
                slider = alt.binding_range(min=min(df[slider_col]), max=max(df[slider_col]), step=1)
                slider_selector = alt.selection_single(bind=slider,name=key, fields=[slider_col],
                                                       init={slider_col: init_value}
                                                      )
#                 print(f'datum.{slider_col} {comparisson} {key}.{slider_col}[0]')
                chart = chart.add_selection(slider_selector).transform_filter(f'datum.{slider_col} {comparisson} {key}.{slider_col}[0]')

#                 slider_selector = alt.selection_single(bind=slider,name="min",fields=[slider_col],init={slider_col: 10})

#                 chart = chart.add_selection(
#                     slider_selector
#                 ).transform_filter( f'datum.{slider_col} >= min.{slider_col}[0]')


                
                

    
    if y_cols =='ALL':
        index = 1
        if cat_col:
            index += 1
        if sel_cols:
            index += len(sel_cols)
            
        y_cols = df.columns[index:].to_list()
        
    if len(y_cols) > 1:
        columns = y_cols
        y_col_name = 'Y_col'
        select_box = alt.binding_select(options=columns, name=y_col_name)
        sel = alt.selection_single(fields=[y_col_name], bind=select_box, init={y_col_name: y_cols[y_index]})
        
        chart = chart.transform_fold(
            columns,
            as_=[y_col_name, 'Valor']
        ).transform_filter(
            sel  
        )
        if stack == 'normalize':
            chart = chart.encode(
                y=alt.Y("Valor:Q", stack="normalize"),
            )
        elif stack == 'sum':
            chart = chart.encode(
                y='sum(Valor):Q',
            )
        else:
            chart = chart.encode(
                y='Valor:Q',
             )
        chart = chart.add_selection(sel)
    else:
        y_col = y_cols[0]
        chart = chart.encode(
            y=y_col
        )        

#     TODO: adicionar filtro de range
#     lower = chart.properties(
#         height=60
#     ).add_selection(brush)

#     chart = chart & lower





    if cat_col:
        base_cat = cat_col        
        chart = chart.encode(
            color=alt.Color(base_cat, scale=alt.Scale(scheme=scheme)), #,legend=None),
        )
    
        sel_base = alt.selection_multi(empty='all', fields=[base_cat], bind='legend')
    
        chart = chart.add_selection(
            sel_base
        ).encode(
            opacity=alt.condition(sel_base, alt.value(1.0), alt.value(ns_opacity))
        )

        bar = alt.Chart(df).mark_bar().encode(
            y=alt.Y(f'{base_cat}:O',title=None), # axis=alt.Axis(orient='right'  f'{base_cat}:N',
            x='total',
#             tooltip='total',
            color=alt.condition(sel_base, alt.Color(f'{base_cat}:N', scale=alt.Scale(scheme=scheme)), alt.ColorValue("lightgrey"),legend=None)
        ).add_selection(sel_base).properties(
            width=100,
            height=400
        )

        chart = alt.concat(
                chart,
                bar
        )

#         chart = chart & lower  TODO: adicionar fltro de range

    select_cols = sel_cols
    if select_cols:

        options_lists = [df[cat].dropna().astype(str).sort_values().unique().tolist() for cat in select_cols]

        selection = alt.selection_single(
                name='Selecione',
                fields=select_cols,
                init={cat: options_lists[i][0] for i,cat in enumerate(select_cols)},
                bind={cat: alt.binding_select(options=options_lists[i]) for i,cat in enumerate(select_cols)}
            )

        chart = chart.add_selection(
                selection
            ).transform_filter(
                selection
            )
    
    return chart

In [32]:
#hide_input
#collapse_output

x_col = 'UF_RES'
cat_col = 'REGIAO_RES'
sel_cols = ['faixa_etaria']
selection_dict = {}
selection_dict['UF_RES'] = ' != "nan_nd"'
dataFrame2Chart(df_srag,x_col,cat_col,sel_cols,selection_dict,total=[0,0],mark_type='bar',sort_values=True)

Seleção :
	UF_RES  != "nan_nd"
	-----
	Número de casos selecionados: 1668434 (99.99% do total de casos disponíveis.)

	Dimensões dos dados do gráfico: (162, 11)


### UF de Residência e Faixa Etária

In [21]:
#hide_input
#collapse_output

x_col = 'faixa_etaria'
cat_col = 'UF_RES'
sel_cols = []
# index_cols = [cat2,cat3]
selection_dict = {}
selection_dict['UF_RES'] = ' != "nan_nd"'
# selection_dict['idade_anos'] = ' > 40'  
# selection_dict['UTI'] = ' == "sim"'
dataFrame2Chart(df_srag,x_col,cat_col,sel_cols,selection_dict,total=False)

Seleção :
	UF_RES  != "nan_nd"
	-----
	Número de casos selecionados: 1668434 (99.99% do total de casos disponíveis.)

	Dimensões dos dados do gráfico: (162, 10)


### UF de Residência e Semana dos Primeiros Sintomas

In [27]:
#hide_input
#collapse_output

x_col = 'SEM_PRI_ABS'
cat_col = 'REGIAO_RES'
sel_cols = ['UF_RES']
# index_cols = [cat2,cat3]
selection_dict = {}
selection_dict['UF_RES'] = ' != "nan_nd"'
sliders = {'min':['SEM_PRI_ABS',10],
           'max':['SEM_PRI_ABS',61]}
# selection_dict['idade_anos'] = ' > 40'  
# selection_dict['UTI'] = ' == "sim"'
dataFrame2Chart(df_srag,x_col,cat_col,sel_cols,selection_dict,sliders=sliders,ns_opacity=0.03,total=[0,1])

Seleção :
	UF_RES  != "nan_nd"
	-----
	Número de casos selecionados: 1668434 (99.99% do total de casos disponíveis.)

	Dimensões dos dados do gráfico: (2114, 11)


## Outras análises

### Total de casos vs Semana Primeiros Sintomas por Faixa Etária

In [18]:
#hide_input
#collapse_output

x_col = 'SEM_PRI_ABS'
cat_col = 'faixa_etaria'
sel_cols = []
sliders = {'min':['SEM_PRI_ABS',10],
           'max':['SEM_PRI_ABS',62]}
# sliders = {'max':['SEM_PRI_ABS',30]}
selection_dict = {}
# selection_dict['SEM_PRI_ABS'] = ' >= 40'

dataFrame2Chart(df_srag,x_col,cat_col,sel_cols,selection_dict,sliders=sliders,total=False,rates=False,mark_type='area',stack='normalize')

Seleção :
	-----
	Número de casos selecionados: 1668609 (100.00% do total de casos disponíveis.)

	Dimensões dos dados do gráfico: (402, 8)


### Taxa de Letalidade por Faixa etária e Semana Primeiros Sintomas

In [19]:
#hide_input
#collapse_output

x_col = 'faixa_etaria'
cat_col = 'SEM_PRI_ABS'
sel_cols = ['UF_RES']
# sel_cols = []
# index_cols = [cat2,cat3]
selection_dict = {}
# selection_dict['UF_RES'] = ' != "nd"'
selection_dict['SEM_PRI_ABS'] = ' > 40'  
# selection_dict['SEM_PRI_ABS '] = '< 61' 

sliders = {'min':['SEM_PRI_ABS',50],
           'max':['SEM_PRI_ABS',61]}

# selection_dict['UTI'] = ' == "sim"'
dataFrame2Chart(df_srag,x_col,cat_col,sel_cols,selection_dict,sliders=sliders,total=[False,True])

Seleção :
	SEM_PRI_ABS  > 40
	-----
	Número de casos selecionados: 818720 (49.07% do total de casos disponíveis.)

	Dimensões dos dados do gráfico: (4417, 11)


## Em desenvolvimento...

### Taxa de óbito e Total de casos por UF residência

In [20]:
df_srag.REGIAO_RES

0           3_Sudeste
1           3_Sudeste
2               4_Sul
3           3_Sudeste
4               4_Sul
              ...    
1668604    2_Nordeste
1668605    2_Nordeste
1668606     3_Sudeste
1668607     3_Sudeste
1668608     3_Sudeste
Name: REGIAO_RES, Length: 1668609, dtype: object

In [None]:
# #hide_input
# #collapse_output

# cat1 = 'SEM_PRI_ABS'
# cat2 = 'UF_RES'
# index_cols = [cat1,cat2]
# y_cols = ('tx_obito_andamento','total')
# selection_dict = {'SEM_PRI_ABS':' >= 0',
#                   'SEM_PRI_ABS ':'<= 65',
#                  }
# selection_dict[cat2] = " != ['nd']"
# upper  = dataFrame2Chart(df_srag,index_cols,selection_dict,y_cols=y_cols,chart_title='Todos os casos',naxis=2)

# # selection_dict['EVOLUCAO']= "== ['cura','obito']"
# lower = dataFrame2Chart(df_srag,index_cols,selection_dict,y_cols=y_cols,chart_title='Casos concluídos (óbito ou cura)',naxis=2)
# alt.vconcat(upper, lower)