## Dados do Sistema de Informações Hospitalar (SIH) do SUS

## Pacotes

In [49]:
library(readr)

# https://rfsaldanha.github.io/rpcdas/index.html
library(rpcdas)

## Credenciais de acesso

In [3]:
# pcdas_token = NULL

Verifica quais tabelas o usuário tem acesso. Para este notebook, é necessário ter acesso ao índice `datasus-sih`.

In [3]:
list_pcdas_tables()

 [1] "datasus-sim"                  "datasus-sinasc"              
 [3] "cadastro_inclusao"            "stilingue_tabaco"            
 [5] "datasus-sih"                  "datasus-sim-el"              
 [7] "oobr-sindrome-gripal-semanal" "datasus-pop"                 
 [9] "datasus-cnes"                 "datasus-cnes-lt-2008-2017"   
[11] "datasus-cnes-eq-2008-2017"    "datasus-cnes-pf-2008-2017"   
[13] "datasus-cnes-sr-2008-2017"    "datasus-sim-dofet"           
[15] "pcdas-polis"                  "datasus-cnes-pf_inova"       

## Query para acesso aos dados

Objetivo: obter a contagem de internações ocorridas em cada município do estado de Minas Gerais (código 33), agregada pelo capítulo da causa básica (CID-10), ano e mês da internação.

In [38]:
# sql_query <- "SELECT N_AIH, DT_INTER, PROC_REA FROM \"datasus-sih\" LIMIT 100"

sql_query <- "SELECT res_CODIGO_UF AS uf, res_codigo_adotado AS code_muni, ano_internacao, mes_internacao, def_diag_princ_cap AS cid_cap, COUNT(N_AIH) AS freq 
  FROM \"datasus-sih\" 
  WHERE ano_internacao >= 2008 AND uf = '33' 
  GROUP BY uf, code_muni, ano_internacao, mes_internacao, cid_cap"

res <- generic_pcdas_query(sql_query = sql_query)

res

[38;5;246m# A tibble: 306,988 × 6[39m
   uf    code_muni ano_internacao mes_internacao cid_cap                          freq 
   [3m[38;5;246m<chr>[39m[23m [3m[38;5;246m<chr>[39m[23m     [3m[38;5;246m<chr>[39m[23m          [3m[38;5;246m<chr>[39m[23m          [3m[38;5;246m<chr>[39m[23m                            [3m[38;5;246m<chr>[39m[23m
[38;5;250m 1[39m 33    330010    2008           1              I. Algumas doenças infecciosas … 30   
[38;5;250m 2[39m 33    330010    2008           1              II. Neoplasias (tumores)         28   
[38;5;250m 3[39m 33    330010    2008           1              III. Doenças sangue órgãos hema… 8    
[38;5;250m 4[39m 33    330010    2008           1              IV. Doenças endócrinas nutricio… 10   
[38;5;250m 5[39m 33    330010    2008           1              IX. Doenças do aparelho circula… 43   
[38;5;250m 6[39m 33    330010    2008           1              V. Transtornos mentais e compor… 261  
[38;5;250

## Algumas estatísticas

In [46]:
# Quantidade de linhas e colunas no resultado
dim(res)

[1] 306988      6

In [41]:
# Quantidade de UFs no resultado
length(unique(res$uf))

[1] 1

In [42]:
# Quantidade de municípios no resultado
length(unique(res$code_muni))

[1] 92

In [43]:
# Quantidade de anos no resultado
length(unique(res$ano_internacao))

[1] 17

In [44]:
# Quantidade de meses no resultado
length(unique(res$mes_internacao))

[1] 12

In [45]:
# Quantidade de capítulos CID no resultado
length(unique(res$cid_cap))

[1] 22

In [48]:
# Quantidade total de internaçoes no resultado
res$freq <- as.numeric(res$freq)
sum(res$freq)

[1] 12382274

## Exporta resultado para arquivo CSV

In [52]:
write_csv2(x = res, file = "res_sih.csv")
zip(zipfile = "res_sih.csv.zip", files = "res_sih.csv")
unlink(x = "res_sih.csv")

updating: res_sih.csv (deflated 93%)


## Informações da seção

In [53]:
sessionInfo()

R version 4.4.2 (2024-10-31)
Platform: aarch64-apple-darwin20
Running under: macOS Sequoia 15.3

Matrix products: default
BLAS:   /System/Library/Frameworks/Accelerate.framework/Versions/A/Frameworks/vecLib.framework/Versions/A/libBLAS.dylib 
LAPACK: /Library/Frameworks/R.framework/Versions/4.4-arm64/Resources/lib/libRlapack.dylib;  LAPACK version 3.12.0

locale:
[1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8

time zone: America/Sao_Paulo
tzcode source: internal

attached base packages:
[1] stats     graphics  grDevices utils     datasets 
[6] methods   base     

other attached packages:
 [1] rpcdas_0.4.1    lubridate_1.9.4 forcats_1.0.0  
 [4] stringr_1.5.1   dplyr_1.1.4     purrr_1.0.4    
 [7] readr_2.1.5     tidyr_1.3.1     tibble_3.2.1   
[10] ggplot2_3.5.1   tidyverse_2.0.0

loaded via a namespace (and not attached):
 [1] bit_4.5.0.1       jsonlite_1.9.0    gtable_0.3.6     
 [4] crayon_1.5.3      compiler_4.4.2    tidyselect_1.2.1 
 [7] parallel_4.4.2    scal