# **Utilizando o R para obter dados do SUS**
Autor: Ivan Zimmermann (ivanzricardo@gmail.com)

**O pacote microdatasus**

Idealizado e implementado por Saldanha et al (2019), o microdatasus é um pacote estatístico na linguagem R para download e pré-processamento de microdados do Departamento de Informática do SUS (DATASUS). Sua aplicação torna muito prática a atividade de obtenção dos dados e tradução dos códigos disponíveis nas tabelas do DATASUS

O pacote lida com alguns bancos de dados dos principais sistemas do DATASUS, como o SIM, SINASC e SIH-RD.

Referência

Artigo: https://doi.org/10.1590/0102-311X00032419

Github: https://github.com/rfsaldanha/microdatasus

**Instalando o pacote**

Os códigos abaixo permitem a instalação e ativação da versão mais recente do pacote disponível na plataforma GitHub

In [None]:
#Instalar o pacote microdatasus para download e leitura dos arquivos
install.packages("remotes")
remotes::install_github("rfsaldanha/microdatasus")

In [None]:
#Ativar o pacote
#Insira sua resposta aqui#

**Obtendo os arquivos de dados**

Aobtenção de dados é implementada coma  função "fetch_datasus()" e seus argumentos. Em nosso exemplo, vamos trabalhar com o banco consolidado de AIH (SIH-RD), solicitando o download e leitura dos dados de internações processados no ano de 2018 no Distrito Federal e armazenando no objeto "dados":

In [None]:
#Opção 1: Solicitar e ler os arquivos de dados necessários
dados <- fetch_datasus(
  year_start = ????, 
  year_end = ????,
  month_start = ??,
  month_end = ??,
  uf = ??, 
  information_system = ????)

In [None]:
#Visualize os primeiros registros
#Insira sua resposta aqui#

In [None]:
#Opção 2: Solicitar e ler os arquivos de dados a partir de um repositório

#1) Primeiro, criamos um arquivo temporário
temp <- tempfile()

#2)Depois fazemos o download do arquivo comprimido dentro desse arquivo temporário
download.file("https://github.com/ivanzricardo/bds/raw/main/aih_df_2018.zip",temp) 

#3)Os arquivos estão comprimidos em formato zip, assim precisamos usar a função 
#unz() dentro do read.csv: read.csv(unz('nomedoarquivo.zip','nomedoarquivo.csv'), header = T)
dados <- read.csv(unz(temp,'aih_df_2018.csv'), header = T)

#4)Excluímos o arquivo temporário
unlink(temp)

In [None]:
#Visualize os primeiros registros
#Insira sua resposta aqui#

In [None]:
#Opção 3: Solicitar e ler os arquivos de dados a partir de um arquivo dbc
#Primeiro, instale e ative o pacote read.dbc
install.packages("read.dbc")
library(read.dbc)

In [None]:
#1) Com o read.dbc ativo, siga os mesmos passos de antes, criando um aqruivo temporário
temp <- tempfile()

#2)Depois fazemos o download do arquivo comprimido dentro desse arquivo temporário
download.file("https://github.com/ivanzricardo/bds/raw/main/aih_df_2018.dbc",temp) 

#3)Os arquivos estão comprimidos em formato zip, assim precisamos usar a função 
#unz() dentro do read.csv: read.csv(unz('nomedoarquivo.zip','nomedoarquivo.csv'), header = T)
dados <- read.dbc(temp)

#4)Excluímos o arquivo temporário
unlink(temp)

In [None]:
#Visualize os primeiros registros
#Insira sua resposta aqui#

**Processamento dos dados**

Além do download, o pacote *microdatasus* permite traduzir a maioria dos códigos disponíveis nos arquivos de dados da AIH **por** meio da função "process_sih". Para isso, basta aplicar a função sobre o objeto "dados" recém criado:

In [None]:
#Processar os dados (traduzir os códigos do banco). Dica: Use uma das opções da 
#função process do pacote microdatasus
#Insira sua resposta aqui#

In [None]:
#Visualize os primeiros registros. O que foi alterado?
#Insira sua resposta aqui#

**Atividade 1:** Selecione as internações relacionadas à doença de Crohn

Para selecionar os dados, vamos usar o pacote "sqldf" que permite utilizar a sintaxe do SQL dentro da linguagem R. Lembrando que os códigos da CID-10 são armazenados no campo "DIAG_PRINC". DE acordo com a CID-10, a doença de Crohn pode ser identificada com os códigos:

*   K50   	Doença de Crohn (enterite regional)
*   K500   	Doença de Crohn do intestino delgado
*   K501   	Doença de Crohn do intestino grosso
*   K508   	Outra forma de doença de Crohn
*   K509   	Doença de Crohn de localização não especificada


**DICA:** Que tal usar o operador IN (valor1, valor2...) na sua seleção?

In [None]:
#Instale o pacote sqldf
#Insira sua resposta aqui#

In [None]:
#Ativar o pacote sqldf
#Insira sua resposta aqui#

In [None]:
#Aplique o filtro usando o sqldf
crohn <- data.frame(sqldf('SELECT ??? 
                            FROM ???
                            WHERE ??? '))
                          

In [None]:
#Visualize os primeiros registros. O que foi alterado?
#Insira sua resposta aqui#

**Atividade 2:** Quantas internações por doença de Crohn foram processadas no DF em 2018?

Para tanto, lembre-se que a chave primária do banco de RD é o campo N_AIH.

**DICA:** Resgate o uso da função COUNT() 

In [None]:
#Aplicar a contagem usando o sqldf
sqldf('SELECT ??? 
        FROM ???')

**Atividade 3:** Quais os números de internações por doença de Crohn no DF de acordo com o município de residência?

Saiba que, após o processamento do microdatasus, o nome do município de residência pode ser obtido na variável "munResNome" 

**DICA:** Resgate o uso do comando GROUP BY

In [None]:
#Aplicar o agrupamento usando o sqldf
sqldf('SELECT ???
        FROM ???
        GROUP BY ???')


**Salvando os dados obtidos**

Vamos armazenar os ados dasinternações por doença de Crohn em um arquivo CSV. Para tanto, usamos a função "write.csv"

In [None]:
#Salvando os registros de doença de Crohn
write.csv(crohn, "AIH_CROHN_DF_2018.csv")

**FIM**