In [1]:
import pandas as pd
import matplotlib
import matplotlib.pyplot as plt
import seaborn as sns

pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)
pd.options.display.float_format = '{:,.2f}'.format

dataset_path = '../datasets/preprocessed/'
dataset_name = 'OrcamentoDespesa_2022-10-25 11:33:20.633541.csv'

df = pd.read_csv(f"{dataset_path}{dataset_name}", sep=';')

df.sample(5)

Unnamed: 0,exercicio,nome_orgao_superior,nome_orgao_subordinado,nome_unidade_orcamentaria,nome_funcao,nome_subfuncao,nome_programa_orcamentario,nome_acao,nome_categoria_economica,nome_grupo_despesa,nome_elemento_despesa,orcamento_inicial,orcamento_atualizado,orcamento_empenhado,orcamento_realizado
117382,2018,Ministério da Educação,Instituto Federal Fluminense,"INST.FED.DE EDUC.,CIENC.E TEC.FLUMINENSE",Previdência social,Previdência do regime estatutário,PREVIDENCIA DE INATIVOS E PENSIONISTAS DA UNIAO,APOSENTADORIAS E PENSOES CIVIS DA UNIAO,DESPESAS CORRENTES,Pessoal e Encargos Sociais,Não informado,-12941996.0,0.0,0.0,0.0
59557,2016,Ministério da Economia,"Instituto Nacional de Metrologia, Qualidade e ...",INSTIT.NAC. DE METROL. QUALID. E TECNOLOGIA,Previdência social,Previdência do regime estatutário,PREVIDENCIA DE INATIVOS E PENSIONISTAS DA UNIAO,APOSENTADORIAS E PENSOES - SERVIDORES CIVIS,DESPESAS CORRENTES,Pessoal e Encargos Sociais,"Aposentadorias do RPPS, Reserva Remunerada e R...",56246476.89,56246476.89,56246476.89,56246476.89
140886,2019,Ministério da Educação,Instituto Federal do Acre,"INST.FED.DE EDUC.,CIENC.E TEC.DO ACRE",Educação,Proteção e benefícios ao trabalhador,PROGRAMA DE GESTAO E MANUTENCAO DO MINISTERIO ...,"BENEFICIOS OBRIGATORIOS AOS SERVIDORES CIVIS, ...",DESPESAS CORRENTES,Outras Despesas Correntes,Não informado,-187457.96,141699.04,0.0,0.0
14725,2014,Ministério da Educação,Universidade Federal de Goiás,UNIVERSIDADE FEDERAL DE GOIAS,Educação,Formação de recursos humanos,PROGRAMA DE GESTAO E MANUTENCAO DO MINISTERIO ...,CAPACITACAO DE SERVIDORES PUBLICOS FEDERAIS EM...,DESPESA CORRENTE,Outras Despesas Correntes,Auxílio Financeiro a Estudantes,499243.93,499243.93,499243.93,499243.93
171445,2020,Ministério da Educação,Fundação Universidade Federal do ABC,REC. SOB. SUPERV. FUND. UNIV. FED. ABC,Educação,Atenção básica,PROGRAMA DE GESTAO E MANUTENCAO DO PODER EXECU...,ASSISTENCIA MEDICA E ODONTOLOGICA AOS SERVIDOR...,DESPESAS CORRENTES,Outras Despesas Correntes,Não informado,712581.0,0.0,0.0,0.0


In [2]:
# Calcula diferença entre orçamentos inicial e realizado
orcamento_diff = df.apply(lambda row: row['orcamento_realizado'] - row['orcamento_inicial'], axis=1)
df['dif_orcamento_realizado_inicial'] = orcamento_diff

df.describe()

Unnamed: 0,exercicio,orcamento_inicial,orcamento_atualizado,orcamento_empenhado,orcamento_realizado,dif_orcamento_realizado_inicial
count,214908.0,214908.0,214908.0,214908.0,214908.0,214908.0
mean,2017.44,119194524.84,125164324.44,100159849.12,95226784.18,-23967740.66
std,2.3,6669963694.36,6388024172.59,5038037035.27,5087666799.46,2676058895.07
min,2014.0,-481026132218.0,-7933774178.0,-201664633.0,-1559690000.0,-541585094367.8
25%,2015.0,17233.75,14000.0,0.0,0.0,-658004.45
50%,2017.0,250000.02,203421.57,33716.32,10990.91,-40421.7
75%,2019.0,2315899.98,1850000.0,855316.51,459944.64,0.0
max,2021.0,1399235985553.0,1399235985553.0,1130593676561.26,1248816572989.47,481026132218.0


In [None]:
"""
TODO: Lidar valores negativos de orcamento
"""

# print(df.shape)
# df.query('orcamento_inicial < 0').orcamento_inicial.count()

In [3]:
# Exibe 5 orgãos mais comuns do orçamento
most_common_organs = df['nome_orgao_superior'].value_counts() / df.shape[0] * 100
most_common_organs[:5]

# Gráfico não está sendo exibido
# sns.histplot(df.orcamento_inicial, alpha=0.4, kde=True, kde_kws={"cut": 3})

Ministério da Educação                   41.55
Ministério da Defesa                      7.17
Ministério da Saúde                       5.69
Ministério da Economia                    5.55
Ministério do Desenvolvimento Regional    5.01
Name: nome_orgao_superior, dtype: float64

In [4]:
# Orçamento inicial total para cada orgão superior
initial_budget_per_organ = df.groupby('nome_orgao_superior')['orcamento_realizado'].agg([len, sum])

# Valor médio dos orçamentos por orgão superior
avg_budget = initial_budget_per_organ.apply(lambda row: row['sum'] / row['len'], axis=1)
initial_budget_per_organ['avg_budget'] = avg_budget
initial_budget_per_organ.sort_values('avg_budget', ascending=False)

Unnamed: 0_level_0,len,sum,avg_budget
nome_orgao_superior,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Ministério do Trabalho,3785,4847976284803.11,1280839176.96
Ministério da Economia,11923,11437645374069.33,959292575.2
Ministério da Cidadania,3271,578244480565.69,176779113.59
Ministério da Saúde,12237,957929576019.97,78281406.88
Ministério do Trabalho e Emprego,287,20760696253.4,72336920.74
Advocacia-Geral da União,471,26732037804.51,56755918.91
Ministério das Cidades,974,45592468490.78,46809515.9
Ministério da Defesa,15417,680954898957.73,44169092.49
Ministério de Minas e Energia,7143,273154846195.7,38240913.65
Banco Central do Brasil - Orçamento Fiscal e Seguridade Social,931,26292189854.69,28240805.43


In [5]:
df.groupby('nome_orgao_superior')['orcamento_realizado'].agg([len, sum]).sort_values('sum', ascending=False)

Unnamed: 0_level_0,len,sum
nome_orgao_superior,Unnamed: 1_level_1,Unnamed: 2_level_1
Ministério da Economia,11923,11437645374069.33
Ministério do Trabalho,3785,4847976284803.11
Ministério da Saúde,12237,957929576019.97
Ministério da Educação,89300,930313162665.34
Ministério da Defesa,15417,680954898957.73
Ministério da Cidadania,3271,578244480565.69
Ministério de Minas e Energia,7143,273154846195.7
Ministério do Desenvolvimento Regional,10765,135603595619.08
"Ministério da Agricultura, Pecuária e Abastecimento",7140,113880676639.4
Ministério da Infraestrutura,10046,105950698572.35
