# Bibioltecas

In [None]:
from elasticsearch import Elasticsearch
from elasticsearch_dsl import Search
import pandas as pd
from datetime import datetime
import subprocess
import numpy as np
import plotly.express as px
import chart_studio.plotly as py

In [None]:
pd.set_option('display.max_columns', None)

# Sindrome Gripal - Dados

In [None]:
# Baixar dados atualizados de Sindrome Gripal em https://opendatasus.saude.gov.br/dataset/casos-nacionais
# Par isto, utilizar a opção da API da Elasticsearch

In [None]:
# criando conexão com ES
client = Elasticsearch(hosts='https://user-public-notificacoes:Za4qNXdyQNSa9YaA@elasticsearch-saps.saude.gov.br')

In [None]:
# configurando a consulta para dados apenas do Paraná e do município de Colombo
s = Search(using=client, index='desc-notificacoes-esusve-pr').query("match", municipio="Colombo")

In [None]:
# usando método scan para capturar todos os registros do index
df_sg = pd.concat([pd.DataFrame(hit.to_dict(), index=[i]) for i, hit in enumerate(s.scan())])

In [None]:
# Salvar cópia em CSV
data_hoje = datetime.now().strftime('%Y-%m-%d')
df_sg.to_csv(f"./dados/sindrome_gripal/sg_{data_hoje}.csv", index=False)

In [None]:
df_filtrado = df_sg[['dataNotificacao','tipoTeste','resultadoTeste']]

In [None]:
df_filtrado

In [None]:
# Função para transformar em numeros tal qual coluna PRC_RESULT (67), do SRAG => conforme dicionario de dados https://opendatasus.saude.gov.br/dataset/9f76e80f-a2f1-4662-9e37-71084eae23e3/resource/b3321e55-24e9-49ab-8651-29cf5c8f3179/download/dicionario_de_dados_srag_hospitalizado_23.03.2021.pdf
# 1- Detectável 2-Não Detectável 3-Inconclusivo 4-Não Realizado 5-Aguardando Resultado 9-Ignorad
def to_number (row):
   if row['tipoTeste'] == None:
      return '4'
   if row['tipoTeste'] == 'TESTE RÁPIDO - ANTÍGENO' :
      return '4'
   if row['tipoTeste'] == 'TESTE RÁPIDO - ANTICORPO' :
      return '4'
   if row['tipoTeste'] == 'Enzimaimunoensaio - ELISA IgM' :
      return '4'
   if row['tipoTeste'] == 'Imunoensaio por Eletroquimioluminescência - ECLIA IgG' :
      return '4'
   if row['tipoTeste'] == 'RT-PCR' and row['resultadoTeste'] == 'Positivo' :
      return '1'    
   if row['tipoTeste'] == 'RT-PCR' and row['resultadoTeste'] == 'Negativo' :
      return '2'
   if row['tipoTeste'] == 'RT-PCR' and row['resultadoTeste'] == 'Inconclusivo ou Indeterminado' :
      return '3' 
   if row['tipoTeste'] == 'RT-PCR' and row['resultadoTeste'] == None :
      return '3' 

In [None]:
df_filtrado["PCR_RESUL"] = df_filtrado.apply (lambda row: to_number(row), axis=1)

In [None]:
# Formatando data
df_filtrado['dataNotificacao'] = df_filtrado.dataNotificacao.str.slice(start=0,stop=10)
df_filtrado['dataNotificacao'] = pd.to_datetime(df_filtrado.dataNotificacao)

In [None]:
# Deixando apenas colunas de interesse
df_filtrado = df_filtrado[['dataNotificacao','PCR_RESUL']]

In [None]:
# Transformando dados string para numéricos na coluna do resultadoTeste
df_filtrado["PCR_RESUL"] = pd.to_numeric(df_filtrado["PCR_RESUL"])

In [None]:
# Renomear nome da colina 'dataNotificacao' deixando no mesmo padrao do banco de dados de SRAG
df_filtrado.rename(columns={'dataNotificacao': 'DT_NOTIFIC'}, inplace = True)


In [None]:
sg = df_filtrado

In [None]:
sg

In [None]:
# Salvando em CSV
today = datetime.today()
d = today.strftime("%Y%m%d")
data_atual = str(d)
sg.to_csv(f'./dados/csv/sg-{data_atual}', sep=';', index=False)

# Sindrome Respiratória Aguda Grave- Dados

In [None]:
# Dados de 2020
#https://s3-sa-east-1.amazonaws.com/ckan.saude.gov.br/SRAG/2020/INFLUD-28-06-2021.csv
# Dados de 2021
#https://s3.sa-east-1.amazonaws.com/ckan.saude.gov.br/SRAG/2021/INFLUD21-28-06-2021.csv

In [None]:
# Executar script para baixar dados

subprocess.call(['sh', './baixar-dados.sh'])

# Sindrome Respiratoria Aguda Grave- 2020

In [None]:
# Carregando CSV referente ao ano de 2020
srag2020 = pd.read_csv('./dados/sindrome_respiratoria_aguda_grave/dados-2020.csv', sep=";")  

In [None]:
srag2020

In [None]:
# Deixando apenas os dados dos resisdentes em Colombo, mesmo que o teste tenha sido realizaod em outra cidade
srag2020_colombo = srag2020[srag2020['ID_MN_RESI']=="COLOMBO"]

In [None]:
# Deixando apenas campos de interess
srag2020_colombo = srag2020_colombo[['DT_NOTIFIC','PCR_RESUL']]

In [None]:
# Retirando NaN de 'PCR_RESUL'
srag2020_colombo = srag2020_colombo.dropna(subset=['PCR_RESUL'])

In [None]:
# Transformar o padrão de datas
srag2020_colombo['DT_NOTIFIC'] = srag2020_colombo.DT_NOTIFIC.str.slice(start=6,stop=10) + '-' + srag2020_colombo.DT_NOTIFIC.str.slice(start=3,stop=5) + '-' + srag2020_colombo.DT_NOTIFIC.str.slice(start=0,stop=2)
srag2020_colombo['DT_NOTIFIC'] = pd.to_datetime(srag2020_colombo['DT_NOTIFIC'])

In [None]:
# Transformando a coluna PCR_RESUL para int64
srag2020_colombo['PCR_RESUL'] = srag2020_colombo['PCR_RESUL'].astype('int64')

In [None]:
srag2020_colombo

# Sindrome Respiratoria Aguda Grave- 2021

In [None]:
# Carregando CSV referente ao ano de 2021 mais recente
today = datetime.today()
d = today.strftime("%Y%m%d")
data_atual = str(d)

srag2021 = pd.read_csv(f'./dados/sindrome_respiratoria_aguda_grave/dados-{data_atual}.csv', sep=";")  

In [None]:
srag2021

In [None]:
# Deixando apenas os dados dos resisdentes em Colombo, mesmo que o teste tenha sido realizaod em outra cidade
srag2021_colombo = srag2021[srag2021['ID_MN_RESI']=="COLOMBO"]

In [None]:
# Deixando apenas campos de interessw
srag2021_colombo = srag2021_colombo[['DT_NOTIFIC','PCR_RESUL']]

In [None]:
# Retirando NaN de 'PCR_RESUL'
srag2021_colombo = srag2021_colombo.dropna(subset=['PCR_RESUL'])

In [None]:
# Transformar o padrão de datas
srag2021_colombo['DT_NOTIFIC'] = srag2021_colombo.DT_NOTIFIC.str.slice(start=6,stop=10) + '-' + srag2021_colombo.DT_NOTIFIC.str.slice(start=3,stop=5) + '-' + srag2021_colombo.DT_NOTIFIC.str.slice(start=0,stop=2)
srag2021_colombo['DT_NOTIFIC'] = pd.to_datetime(srag2021_colombo['DT_NOTIFIC'])

In [None]:
# Transformando a coluna PCR_RESUL para int64
srag2021_colombo['PCR_RESUL'] = srag2021_colombo['PCR_RESUL'].astype('int64')

In [None]:
srag2021_colombo

# MESCLAR DATASETS (SG, SRAG-2020 e SRAG-2021)

In [None]:
# Juntar datasetsframes = [sg, srag2020_colombo, srag2021_colombo]
frames = [sg, srag2021_colombo, srag2020_colombo]
fator2 = pd.concat(frames)
cobertura = pd.concat(frames)

In [None]:
# Ordernar por data
fator2 = fator2.sort_values('DT_NOTIFIC')

In [None]:
fator2.to_csv(f'./dados/csv/fator2-{data_atual}', sep=';', index=False)

In [None]:
fator2

# FATOR 2 - PORCENTAGEM

In [None]:
# Deixando apenas os casos em que o teste foi realizado (para verificar porcentagem de testes positivos - e nao a abrangencia)
fator2 = fator2[fator2.PCR_RESUL != 4]

In [None]:
fator2['PCR_RESUL'].unique()

In [None]:
fator2

In [None]:
# Criar dataframe com todas as datas do último ano
ano = pd.Series(pd.date_range(end=data_atual, periods=365, freq='D', name="DT_NOTIFIC"))
porcentagem = ano.to_frame()
porcentagem['POSITIVOS'] = 0
porcentagem['NEGATIVOS'] = 0

In [None]:
porcentagem.set_index('DT_NOTIFIC', inplace = True)

In [None]:
porcentagem

In [None]:
# Casos positivos
filtrados = fator2['PCR_RESUL']==1
positivos = fator2[filtrados]
positivos = positivos.groupby('DT_NOTIFIC').sum()
positivos.rename(columns={'PCR_RESUL': 'POSITIVOS'}, inplace = True)
positivos

In [None]:
# Casos negativos
filtrados = fator2['PCR_RESUL']!=1
negativos = fator2[filtrados]

In [None]:
# Transofando negativos em 1 para somar depois
negativos['PCR_RESUL'] = negativos['PCR_RESUL'].map({2:1,3:1,5:1})

In [None]:
# Agrupando por data e somando casos negativos
negativos = negativos.groupby('DT_NOTIFIC').sum()
negativos.rename(columns={'PCR_RESUL': 'NEGATIVOS'}, inplace = True)
negativos

In [None]:
# Juntando positivos e negativos
dados = pd.concat([porcentagem, positivos, negativos])

In [None]:
# Agrupando por data
fator2 = dados.groupby('DT_NOTIFIC').sum()

In [None]:
fator2

In [None]:
# Acumulativo dos últimos 7 dias
rolling = fator2.rolling(window=7).sum()

In [None]:
# Porcentagem média movel 7 dias
rolling['PORCENTAGEM MEDIA MOVEL 7 DIAS'] = rolling['POSITIVOS']*100/(rolling['POSITIVOS'] + rolling['NEGATIVOS'])

In [None]:
rolling

In [None]:
rolling.to_csv(f'./dados/csv/fator2-preprocessado-{data_atual}', sep=';')

In [None]:
fator2 = pd.read_csv(f'./dados/csv/fator2-preprocessado-{data_atual}', sep=';')

In [None]:
fator2 = fator2[['DT_NOTIFIC','PORCENTAGEM MEDIA MOVEL 7 DIAS']]

In [None]:
fator2
fator2= fator2.tail(365).reset_index(drop=True)


In [None]:
fator2

In [None]:
# Retirar avalores NaN e colocar o campo "PORCENTAGEM MEDIA MOVEL 7 DIAS" como inteiro
fator2 = fator2.dropna()
fator2["PORCENTAGEM MEDIA MOVEL 7 DIAS"] = fator2["PORCENTAGEM MEDIA MOVEL 7 DIAS"].astype(int)
fator2 = fator2.rename(columns={'DT_NOTIFIC': 'Data','PORCENTAGEM MEDIA MOVEL 7 DIAS':'Porcentagem'})

In [None]:
hoje = today.strftime("%d-%m-%Y")

fig = px.line(fator2, x="Data", y="Porcentagem", title=f'Porcentagem de testes positivos RT-PCR (média móvel de 7 dias) - Atualizado em {hoje}', labels=dict(Porcentagem="Porcentagem",Data="" ))

fig.add_hrect(y0=0, y1=5, line_width=0, fillcolor="green", opacity=0.2)
fig.add_hrect(y0=5, y1=8, line_width=0, fillcolor="yellow", opacity=0.2)
fig.add_hrect(y0=8, y1=100, line_width=0, fillcolor="red", opacity=0.2)



fig.update_yaxes(range=[0,100], fixedrange= True) # linear range
fig.update_xaxes(fixedrange= True)

fig.show()
fig.write_html("indicador-2.html")


py.sign_in(usuario, senha)
plot_url = py.plot(fig)