# SIA FTP Database
## Sistema de Informações Ambulatoriais

In [1]:
from pysus.ftp.databases.sia import SIA

sia = SIA().load() # Load all data from SIA DataSus

In [2]:
sia

SIA - Sistema de Informações Ambulatoriais

In [3]:
sia.metadata

{'long_name': 'Sistema de Informações Ambulatoriais',
 'source': 'http://sia.datasus.gov.br/principal/index.php',
 'description': 'O Sistema de Informação Ambulatorial (SIA) foi instituído pela Portaria GM/MS n.º 896 de 29 de junho de 1990. Originalmente, o SIA foi concebido a partir do projeto SICAPS (Sistema de Informação e Controle Ambulatorial da Previdência Social), em que os conceitos, os objetivos e as diretrizes criados para o desenvolvimento do SICAPS foram extremamente importantes e amplamente utilizados para o desenvolvimento do SIA, tais como: (i) o acompanhamento das programações físicas e orçamentárias; (ii) o acompanhamento das ações de saúde produzidas; (iii) a agilização do pagamento e controle orçamentário e financeiro; e (iv) a formação de banco de dados para contribuir com a construção do SUS.'}

In [4]:
sia.groups

{'AB': 'APAC de Cirurgia Bariátrica',
 'ABO': 'APAC de Acompanhamento Pós Cirurgia Bariátrica',
 'ACF': 'APAC de Confecção de Fístula',
 'AD': 'APAC de Laudos Diversos',
 'AM': 'APAC de Medicamentos',
 'AMP': 'APAC de Acompanhamento Multiprofissional',
 'AN': 'APAC de Nefrologia',
 'AQ': 'APAC de Quimioterapia',
 'AR': 'APAC de Radioterapia',
 'ATD': 'APAC de Tratamento Dialítico',
 'BI': 'Boletim de Produção Ambulatorial individualizado',
 'IMPBO': '',
 'PA': 'Produção Ambulatorial',
 'PAM': '',
 'PAR': '',
 'PAS': '',
 'PS': 'RAAS Psicossocial',
 'SAD': 'RAAS de Atenção Domiciliar'}

## Coletando os arquivos especificos

In [22]:
print(str(len(sia.get_files(["PA", "BI"]))) + " files")

15063 files


In [23]:
sia.get_files("PA", uf="RS", year=2000)

[PARS0002.dbc,
 pars0001.dbc,
 pars0003.dbc,
 pars0004.dbc,
 pars0005.dbc,
 pars0006.dbc,
 pars0007.dbc,
 pars0008.dbc,
 pars0009.dbc,
 pars0010.dbc,
 pars0011.dbc,
 pars0012.dbc]

In [24]:
files = sia.get_files("PA", uf="RS", year=2000, month=[1])
files

[pars0001.dbc]

## Describing files inside DATASUS server

In [25]:
sia.describe(files[0])

{'name': 'pars0001.dbc',
 'group': 'Produção Ambulatorial',
 'uf': 'Rio Grande do Sul',
 'month': 'Janeiro',
 'year': 2000,
 'size': '2.2 MB',
 'last_update': '2013-10-24 04:15PM'}

## Downloading files

In [24]:
# sia.download(files) # or specify a directory with `local_dir=`
sia.download(files, local_dir="data")

pasp0007.dbc:   2%|▏         | 186k/8.26M [03:06<2:14:34, 1.00kB/s]
PASP0001.parquet: 100%|██████████| 421k/421k [00:29<00:00, 14.2kB/s]


data/PASP0001.parquet

## Reading files

In [30]:
parquet = sia.download(files, local_dir="data")

100%|██████████| 7.22M/7.22M [00:00<00:00, 1.47GB/s]


In [33]:
parquet.to_dataframe()

Unnamed: 0,PA_CONDIC,PA_GESTAO,PA_CODUNI,PA_DATREF,PA_CODPRO,PA_DOCORIG,PA_CODESP,PA_TIPPRO,PA_TIPATE,PA_FXETAR,...,PA_DATPR,PA_VALPRO,PA_VALAPR,PA_UFMUN,PA_MUNAT,PA_NUMAPA,PA_CODOCO,PA_CIDPRI,PA_CIDSEC,PA_MORFOL
0,EC,359999,014215,200001,1101109,A,35,00,00,,...,200001,1.85,1.85,355030,355030,00011747835,S01,I120,N188,
1,EC,359999,014215,200001,1101109,A,35,00,00,,...,200001,1.85,1.85,355030,355030,00011747846,S01,I120,N188,
2,EC,359999,014215,200001,1101109,A,35,00,00,,...,200001,1.85,1.85,355030,355030,00011747857,S01,M311,N188,
3,EC,359999,014215,200001,1101109,A,35,00,00,,...,200001,1.85,1.85,355030,355030,00011747868,S01,M311,N188,
4,EC,359999,014215,200001,1101109,A,35,00,00,,...,200001,1.85,1.85,355030,355030,00011747879,S01,I120,N188,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
725999,PB,351990,000731,200001,0201204,B,15,03,04,,...,200001,69.36,69.36,351990,351990,00000000000,S01,,,
726000,PB,351990,000731,200001,0201204,B,15,03,04,,...,200001,79.56,79.56,351990,351990,00000000000,S01,,,
726001,PB,351990,000731,200001,0201204,B,15,03,04,,...,200001,193.80,193.80,351990,351990,00000000000,S01,,,
726002,PB,351990,000731,200001,0201204,B,15,03,05,,...,200001,4.08,4.08,351990,351990,00000000000,S01,,,
