In [2]:
%%capture
!pip install pysus==0.7.0

In [1]:
%%capture
!pip install pysus

In [2]:
# Importando funcionalidades do pacote pysus relacionadas ao Sistema de Informações Ambulatoriais do SUS (SIA).
from pysus.online_data.SIA import download, show_datatypes

# Método para converter dados no formato Parquet em um DataFrame do Pandas.
from pysus.online_data import parquets_to_dataframe

In [16]:
from datetime import datetime
import pandas as pd
import numpy as np

pd.set_option('display.max_columns', 100)

In [4]:
# Todos os tipos de dados disponíveis relacionados ao SIA
show_datatypes()

{'AB': ('APAC de Cirurgia Bariátrica', 1, 2008),
 'ACF': ('APAC de Confecção de Fístula', 1, 2008),
 'AD': ('APAC de Laudos Diversos', 1, 2008),
 'AM': ('APAC de Medicamentos', 1, 2008),
 'AMP': ('APAC de Acompanhamento Multiprofissional', 1, 2008),
 'AN': ('APAC de Nefrologia', 1, 2008),
 'AQ': ('APAC de Quimioterapia', 1, 2008),
 'AR': ('APAC de Radioterapia', 1, 2008),
 'ATD': ('APAC de Tratamento Dialítico', 1, 2008),
 'BI': ('Boletim de Produção Ambulatorial individualizado', 1, 2008),
 'PA': ('Produção Ambulatorial', 7, 1994),
 'PS': ('RAAS Psicossocial', 1, 2008),
 'SAD': ('RAAS de Atenção Domiciliar', 1, 2008)}


In [18]:
selected_columns = {'PA_UFMUN': 'Unidade da Federação + município de localização',
  'PA_CMP'    : 'Data da Realização do Procedimento / Competência (AAAAMM)',
  'PA_PROC_ID': 'Código do Procedimento Ambulatorial',
  'PA_NIVCPL' : 'Complexidade do Procedimento',
  'PA_CBOCOD' : 'Código de Ocupação Brasileira do Profissional de saúde executante',
  'PA_OBITO'  : 'Indicador de óbito (1 para sim 0 para não)',
  'PA_ENCERR' : 'Indicador de Encerramento (APAC)',
  'PA_PERMAN' : 'Indicador de Permanência (APAC)',
  'PA_ALTA'   : 'Indicador de Alta (APAC)',
  'PA_TRANSF' : 'Indicador de transferência (1 para sim 0 para não)',
  'PA_QTDAPR' : 'Quantidade Aprovada do procedimento',
  'PA_VALAPR' : 'Valor aprovado',
  'PA_UFDIF'  : '''Indica se a UF de residência do paciente é diferente da UF de
                   localização do estabelecimento: 0 = mesma UF 1 = UF diferente''',
  'PA_MNDIF'  : '''Indica se o município de residência do paciente é diferente
                   do município de localização do estabelecimento:
                   0 = mesmo município 1 = município diferente'''
                   }

columns_finally = ['PA_UFMUN', 'PA_CMP', 'PA_PROC_ID', 'PA_G_PROC_ID', 'PA_SG_PROC_ID',
                   'PA_NIVCPL', 'PA_CBOCOD', 'PA_OBITO', 'PA_ENCERR',
                   'PA_PERMAN', 'PA_ALTA', 'PA_TRANSF', 'PA_QTDAPR', 'PA_VALAPR',
                   'PA_UFDIF', 'PA_MNDIF', ]

In [20]:
years  = (2021, 2022, 2023)
months = (1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12)

path   = '/content/drive/MyDrive/SIA'

In [22]:
%%time
for year in years:
  for month in months:
    print(f'[START] SIA: {str(month).zfill(2)}/{year}')
    # Baixando os dados
    parquet_data = download(states = 'PE', years = year, months = month, group='PA')
    if parquet_data:
      # Convertendo arquivo parquet em DataFrame
      df = parquets_to_dataframe(parquet_data)
      # Obtendo somente colunas selecionadas para análise
      df = df[list(selected_columns.keys())]

      # Convertendo data YYYYMM em DD/MM/YYYY
      df['PA_CMP'] = df['PA_CMP'].apply(lambda x: datetime.strptime(x, '%Y%m'))

      # Obtendo grupo do procedimento realizado
      df['PA_G_PROC_ID'] = df['PA_PROC_ID'].apply(lambda x: x[:2])
      # Obtendo subgrupo do procedimento realizado
      df['PA_SG_PROC_ID'] = df['PA_PROC_ID'].apply(lambda x: x[:4])

      # Convertendo valores contábeis em numéricos
      df['PA_QTDAPR'] = df['PA_QTDAPR'].apply(lambda x: int(x))
      df['PA_VALAPR'] = df['PA_VALAPR'].apply(lambda x: float(x))

      df[columns_finally].to_csv(f'{path}/SIA_{year}_{str(month).zfill(2)}.csv', index = False, sep = ';')

    print(f'[ END ] SIA: {str(month).zfill(2)}/{year}')

[START] SIA: 01/2021
[ END ] SIA: 01/2021
[START] SIA: 02/2021
[ END ] SIA: 02/2021
[START] SIA: 03/2021
[ END ] SIA: 03/2021
[START] SIA: 04/2021
[ END ] SIA: 04/2021
[START] SIA: 05/2021
[ END ] SIA: 05/2021
[START] SIA: 06/2021
[ END ] SIA: 06/2021
[START] SIA: 07/2021
[ END ] SIA: 07/2021
[START] SIA: 08/2021
[ END ] SIA: 08/2021
[START] SIA: 09/2021
[ END ] SIA: 09/2021
[START] SIA: 10/2021
[ END ] SIA: 10/2021
[START] SIA: 11/2021
[ END ] SIA: 11/2021
[START] SIA: 12/2021
[ END ] SIA: 12/2021
[START] SIA: 01/2022
[ END ] SIA: 01/2022
[START] SIA: 02/2022
[ END ] SIA: 02/2022
[START] SIA: 03/2022
[ END ] SIA: 03/2022
[START] SIA: 04/2022
[ END ] SIA: 04/2022
[START] SIA: 05/2022
[ END ] SIA: 05/2022
[START] SIA: 06/2022
[ END ] SIA: 06/2022
[START] SIA: 07/2022
[ END ] SIA: 07/2022
[START] SIA: 08/2022
[ END ] SIA: 08/2022
[START] SIA: 09/2022
[ END ] SIA: 09/2022
[START] SIA: 10/2022
[ END ] SIA: 10/2022
[START] SIA: 11/2022
[ END ] SIA: 11/2022
[START] SIA: 12/2022
[ END ] SIA: 