In [1]:
# Configurações globais
cod_orgao_pm = 50300 # Código órgão do Poder Executivo no TCE/RS disponível em http://dados.tce.rs.gov.br/dados/auxiliar/orgaos_auditados_rs.html
cod_orgao_cm = 50301 # Código órgão do Poder Legislativo no TCE/RS disponível em http://dados.tce.rs.gov.br/dados/auxiliar/orgaos_auditados_rs.html
template_url_balrec = r'http://dados.tce.rs.gov.br/dados/municipal/balancete-receita/<ano>/<codigo-do-orgao>.csv' # URL do BAL_REC
template_url_baldesp = r'http://dados.tce.rs.gov.br/dados/municipal/balancete-despesa/<ano>/<codigo-do-orgao>.csv' # URL do BAL_DESP
intervalo_anos = (2013, 2022) # Ano inicial e ano final para buscar os dados
cod_recurso_rpps = (50,) # Códigos de recursos vinculados do RPPS

In [2]:
import pandas as pd

In [3]:
# Busca os arquivos de dados do portal de dados abertos do TCE/RS.
for ano in range(intervalo_anos[0], intervalo_anos[1]+1):
    # BAL_REC
    url_balrec = template_url_balrec.replace('<ano>', str(ano)).replace('<codigo-do-orgao>', str(cod_orgao_pm))
    df = pd.read_csv(url_balrec)
    df.to_excel(f'dados/balrec_{ano}.xlsx')
    # BAL_DESP da PM
    url_baldesp = template_url_baldesp.replace('<ano>', str(ano)).replace('<codigo-do-orgao>', str(cod_orgao_pm))
    dfpm = pd.read_csv(url_baldesp)
    # BAL_DESP da CM
    url_baldesp = template_url_baldesp.replace('<ano>', str(ano)).replace('<codigo-do-orgao>', str(cod_orgao_cm))
    dfcm = pd.read_csv(url_baldesp)
    # Mesclando BAL_DESP da PM e CM e salvando
    df = pd.concat([dfpm, dfcm], ignore_index=True)
    df.to_excel(f'dados/baldesp_{ano}.xlsx')

In [4]:
# Carregando os dados obtidos

balrec = {}
baldesp = {}
for ano in range(intervalo_anos[0], intervalo_anos[1]+1):
    # BAL_REC
    balrec_file = f'dados/balrec_{ano}.xlsx'
    balrec[ano] = pd.read_excel(balrec_file, sheet_name='Sheet1')
    # BAL_DESP
    baldesp_file = f'dados/baldesp_{ano}.xlsx'
    baldesp[ano] = pd.read_excel(baldesp_file, sheet_name='Sheet1')

In [5]:
# Trocando vírgula por ponto nas colunas de valores
for ano in range(intervalo_anos[0], intervalo_anos[1]+1):
    balrec[ano]['VL_ORCADO'] = balrec[ano]['VL_ORCADO'].replace(',', '.')
    balrec[ano]['VL_ARRECADADO'] = balrec[ano]['VL_ARRECADADO'].replace(',', '.')
    baldesp[ano]['VL_DOTACAO_INICIAL'] = baldesp[ano]['VL_DOTACAO_INICIAL'].replace(',', '.')
    baldesp[ano]['VL_ATUALIZACAO_MONETARIA'] = baldesp[ano]['VL_ATUALIZACAO_MONETARIA'].replace(',', '.')
    baldesp[ano]['VL_CREDITOS_SUPLEMENTARES'] = baldesp[ano]['VL_CREDITOS_SUPLEMENTARES'].replace(',', '.')
    baldesp[ano]['VL_CREDITOS_ESPECIAIS'] = baldesp[ano]['VL_CREDITOS_ESPECIAIS'].replace(',', '.')
    baldesp[ano]['VL_CREDITOS_EXTRAORDINARIOS'] = baldesp[ano]['VL_CREDITOS_EXTRAORDINARIOS'].replace(',', '.')
    baldesp[ano]['VL_REDUCAO_DOTACAO'] = baldesp[ano]['VL_REDUCAO_DOTACAO'].replace(',', '.')
    baldesp[ano]['VL_SUPLEMENTACAO_RECURSO'] = baldesp[ano]['VL_SUPLEMENTACAO_RECURSO'].replace(',', '.')
    baldesp[ano]['VL_REDUCAO_RECURSO'] = baldesp[ano]['VL_REDUCAO_RECURSO'].replace(',', '.')
    baldesp[ano]['VL_EMPENHADO'] = baldesp[ano]['VL_EMPENHADO'].replace(',', '.')
    baldesp[ano]['VL_LIQUIDADO'] = baldesp[ano]['VL_LIQUIDADO'].replace(',', '.')
    baldesp[ano]['VL_PAGO'] = baldesp[ano]['VL_PAGO'].replace(',', '.')
    baldesp[ano]['VL_LIMITADO'] = baldesp[ano]['VL_LIMITADO'].replace(',', '.')
    baldesp[ano]['VL_RECOMPOSICAO'] = baldesp[ano]['VL_RECOMPOSICAO'].replace(',', '.')
    baldesp[ano]['VL_PREVISAO_EXECUCAO'] = baldesp[ano]['VL_PREVISAO_EXECUCAO'].replace(',', '.')
    
    

In [6]:
# Definindo o tipo de dados dos campos
for ano in range(intervalo_anos[0], intervalo_anos[1]+1):
    # BAL_REC
    balrec[ano].astype({
        'ANO': int,
        'COD_MUNICIPIO': int,
        'NOME_MUNICIPIO': str,
        'CD_ORGAO': int,
        'NOME_ORGAO': str,
        'CD_RECEBIMENTO': int,
        'CD_ORGAO_ORCAMENTARIO': int,
        'NOME_ORGAO_ORCAMENTARIO': str,
        'CD_UNIDADE_ORCAMENTARIA': int,
        'NOME_UNIDADE': str,
        'TP_UNIDADE': str,
        'CD_CONTA_SG': str,
        'DS_CONTA_SG': str,
        'NIVEL': str,
        'NR_NIVEL': int,
        'CD_RECURSO': int,
        'NM_RECURSO': str,
        'CAR_PECULIAR': int,
        'DS_CAR_PECULIAR': str,
        'VL_ORCADO': float,
        'VL_ARRECADADO': float
    }, errors='ignore')
    # BAL_DESP
    baldesp[ano].astype({
        'ANO': int,
        'COD_MUNICIPIO': int,
        'NOME_MUNICIPIO': str,
        'CD_ORGAO': int,
        'NOME_ORGAO': str,
        'CD_RECEBIMENTO': int,
        'CD_ORGAO_ORCAMENTARIO': int,
        'NOME_ORGAO_ORCAMENTARIO': str,
        'CD_UNIDADE_ORCAMENTARIA': int,
        'NOME_UNIDADE': str,
        'TP_UNIDADE': str,
        'CD_FUNCAO': int,
        'DS_FUNCAO': str,
        'CD_SUBFUNCAO': int,
        'DS_SUBFUNCAO': str,
        'CD_PROGRAMA': int,
        'DS_PROGRAMA': str,
        'CD_PROJETO': int,
        'NM_PROJETO': str,
        'CD_ELEMENTO': str,
        'CD_RECURSO': int,
        'NM_RECURSO': str,
        'VL_DOTACAO_INICIAL': float,
        'VL_ATUALIZACAO_MONETARIA': float,
        'VL_CREDITOS_SUPLEMENTARES': float,
        'VL_CREDITOS_ESPECIAIS': float,
        'VL_CREDITOS_EXTRAORDINARIOS': float,
        'VL_REDUCAO_DOTACAO': float,
        'VL_SUPLEMENTACAO_RECURSO': float,
        'VL_REDUCAO_RECURSO': float,
        'VL_EMPENHADO': float,
        'VL_LIQUIDADO': float,
        'VL_PAGO': float,
        'VL_LIMITADO': float,
        'VL_RECOMPOSICAO': float,
        'VL_PREVISAO_EXECUCAO': float
    }, errors='ignore')

In [7]:
# Filtrando so dados para manter apenas a remessa do mês 12/bimestre 6
for ano in range(intervalo_anos[0], intervalo_anos[1]+1):
    # BAL_REC
    if 'BIMESTRE' in balrec[ano].columns:
        balrec[ano] = balrec[ano][balrec[ano]['BIMESTRE']==6]
    elif 'MES' in balrec[ano].columns:
        balrec[ano] = balrec[ano][balrec[ano]['MES']==12]
    else:
        print(f'Falha ao filtrar o BAL_REC para o ano {ano}!')
    # BAL_DESP
    if 'BIMESTRE' in baldesp[ano].columns:
        baldesp[ano] = baldesp[ano][baldesp[ano]['BIMESTRE']==6]
    elif 'MES' in baldesp[ano].columns:
        baldesp[ano] = baldesp[ano][baldesp[ano]['MES']==12]
    else:
        print(f'Falha ao filtrar o BAL_DESP para o ano {ano}!')

In [8]:
# Filtrando os dados da receita para manter apenas a prefeitura e as contas analíticas
for ano in range(intervalo_anos[0], intervalo_anos[1]+1):
    balrec[ano] = balrec[ano][balrec[ano]['NIVEL']=='A']
    balrec[ano] = balrec[ano][~balrec[ano]['CD_RECURSO'].isin(cod_recurso_rpps)]

In [9]:
# Filtrando os dados da despesa para manter apenas a prefeitura e a câmara
for ano in range(intervalo_anos[0], intervalo_anos[1]+1):
    baldesp[ano] = baldesp[ano][~baldesp[ano]['CD_RECURSO'].isin(cod_recurso_rpps)]

In [10]:
# Remove coluna BIMESTRE/MES
for ano in range(intervalo_anos[0], intervalo_anos[1]+1):
    # BAL_REC
    if 'BIMESTRE' in balrec[ano].columns:
        balrec[ano] = balrec[ano].drop('BIMESTRE', axis=1)
    elif 'MES' in balrec[ano].columns:
        balrec[ano] = balrec[ano].drop('MES', axis=1)
    else:
        print(f'Falha ao excluir campo BIMESTRE/MES do BAL_REC para o ano {ano}!')
    # BAL_DESP
    if 'BIMESTRE' in baldesp[ano].columns:
        baldesp[ano] = baldesp[ano].drop('BIMESTRE', axis=1)
    elif 'MES' in baldesp[ano].columns:
        baldesp[ano] = baldesp[ano].drop('MES', axis=1)
    else:
        print(f'Falha ao excluir campo BIMESTRE/MES do BAL_DESP para o ano {ano}!')

In [11]:
# Mesclando os dados num único arquivo

dfrec = None
dfdesp = None
for ano in range(intervalo_anos[0], intervalo_anos[1]+1):
    if dfrec is None:
        dfrec = balrec[ano]
    else:
        dfrec = pd.concat([dfrec, balrec[ano]], ignore_index=True)
    if dfdesp is None:
        dfdesp = baldesp[ano]
    else:
        dfdesp = pd.concat([dfdesp, baldesp[ano]], ignore_index=True)

In [12]:
# Salvando os dados finais em um arquivo, para auditoria
with pd.ExcelWriter('dados/dados.xlsx') as writer:
    dfrec.to_excel(writer, sheet_name='BAL_REC')
    dfdesp.to_excel(writer, sheet_name='BAL_DESP')