# Dados Utilizados

In [178]:
import pandas as pd

### Gastos diretos do Governo Federal do Brasil (2014-2019)
**Descrição:** Todo gasto que o governo faz com o dinheiro arrecado por meio de impostos ou outras fontes é categorizado. Há despesas em habitação, educação, saúde, segurança, etc. Há despesas que aumentam o patrimônio público e outras que pagam por manutenção. Essa estruturação ajuda a compreender os diferentes aspectos e a acompanhar como o governo utiliza o dinheiro público.

Para atender a diferentes objetos, existem diferentes formas de categorizar a despesa ou gasto público. As diferentes categorizações permitem a você saber, por exemplo, quem gastou o dinheiro, em qual área, o que foi contratado ou comprado e a classificação financeira do gasto.

O Portal da Transparência possibilita que você consulte as despesas executadas a partir de três diferentes visões: área de atuação do governo (função), ações e programas (estrutura programática) e a visão econômica (natureza da despesa).

**Fonte:** [Gastos Diretos do Governo Federal](https://www.kaggle.com/datasets/luizph21/oramento-governo-federal-do-brasil/data)

In [179]:
# Carrega o dataset
gastos_diretos = pd.read_csv('../databases/gastosdiretos.csv', encoding='latin1')
gastos_diretos.head()

Unnamed: 0,EXERCÃCIO,CÃDIGO ÃRGÃO SUPERIOR,NOME ÃRGÃO SUPERIOR,CÃDIGO ÃRGÃO SUBORDINADO,NOME ÃRGÃO SUBORDINADO,CÃDIGO UNIDADE ORÃAMENTÃRIA,NOME UNIDADE ORÃAMENTÃRIA,CÃDIGO FUNÃÃO,NOME FUNÃÃO,CÃDIGO SUBFUNÃÃO,...,CÃDIGO CATEGORIA ECONÃMICA,NOME CATEGORIA ECONÃMICA,CÃDIGO GRUPO DE DESPESA,NOME GRUPO DE DESPESA,CÃDIGO ELEMENTO DE DESPESA,NOME ELEMENTO DE DESPESA,ORÃAMENTO INICIAL (R$),ORÃAMENTO ATUALIZADO (R$),ORÃAMENTO REALIZADO (R$),Year
0,2014,20000,PresidÃªncia da RepÃºblica,20101,PresidÃªncia da RepÃºblica,20101,PRESIDENCIA DA REPUBLICA,4,AdministraÃ§Ã£o,122,...,3,DESPESA CORRENTE,3,Outras Despesas Correntes,14,DiÃ¡rias - Civil,37165556,37165556,33097148,2014
1,2014,20000,PresidÃªncia da RepÃºblica,20101,PresidÃªncia da RepÃºblica,20101,PRESIDENCIA DA REPUBLICA,4,AdministraÃ§Ã£o,122,...,3,DESPESA CORRENTE,3,Outras Despesas Correntes,41,ContribuiÃ§Ãµes,165252500,165252500,153311271,2014
2,2014,20000,PresidÃªncia da RepÃºblica,20101,PresidÃªncia da RepÃºblica,20101,PRESIDENCIA DA REPUBLICA,4,AdministraÃ§Ã£o,122,...,3,DESPESA CORRENTE,3,Outras Despesas Correntes,39,Outros ServiÃ§os de Terceiros - Pessoa JurÃ­dica,12392373,12392373,12219375,2014
3,2014,20000,PresidÃªncia da RepÃºblica,20101,PresidÃªncia da RepÃºblica,20101,PRESIDENCIA DA REPUBLICA,4,AdministraÃ§Ã£o,122,...,3,DESPESA CORRENTE,3,Outras Despesas Correntes,33,Passagens e Despesas com LocomoÃ§Ã£o,129465808,129465808,118575289,2014
4,2014,20000,PresidÃªncia da RepÃºblica,20101,PresidÃªncia da RepÃºblica,20101,PRESIDENCIA DA REPUBLICA,4,AdministraÃ§Ã£o,122,...,3,DESPESA CORRENTE,3,Outras Despesas Correntes,37,LocaÃ§Ã£o de MÃ£o-de-Obra,1242483,1242483,948542,2014


# Modificação das colunas

O conjunto de dados possui algumas colunas com problemas em relação a acentuação, com isso foi feita uma alteração nas nomenclaturas das colunas

In [180]:
# Renomeia as colunas
gastos_diretos.columns = [
    'EXERCICIO', 'CODIGO_ORGAO_SUPERIOR', 'NOME_ORGAO_SUPERIOR',
    'CODIGO_ORGAO_SUBORDINADO', 'NOME_ORGAO_SUBORDINADO',
    'CODIGO_UNIDADE_ORCAMENTARIA', 'NOME_UNIDADE_ORCAMENTARIA',
    'CODIGO_FUNCAO', 'NOME_FUNCAO', 'CODIGO_SUBFUNCAO',
    'NOME_SUBFUNCAO', 'CODIGO_PROGRAMA_ORCAMENTARIO',
    'NOME_PROGRAMA_ORCAMENTARIO', 'CODIGO_ACAO', 'NOME_ACAO',
    'CODIGO_CATEGORIA_ECONOMICA', 'NOME_CATEGORIA_ECONOMICA',
    'CODIGO_GRUPO_DE_DESPESA', 'NOME_GRUPO_DE_DESPESA',
    'CODIGO_ELEMENTO_DE_DESPESA', 'NOME_ELEMENTO_DE_DESPESA',
    'ORCAMENTO_INICIAL_R$', 'ORCAMENTO_ATUALIZADO_R$',
    'ORCAMENTO_REALIZADO_R$', 'ANO'
]

# Valores de orçamento
As colunas de orçamento possuem valores tipo object que futuramente ocasionariam problemas para manipulação, com isso foi feita uma modificação de tipo

In [181]:
# Converte algumas colunas, que possuiam valores não númericos
columns = ['ORCAMENTO_INICIAL_R$', 'ORCAMENTO_ATUALIZADO_R$', 'ORCAMENTO_REALIZADO_R$']

def convert_column(df, col):
    df[col] = df[col].astype(str)
    
    df[col] = df[col].str.replace('.', '', regex=False)
    df[col] = df[col].str.replace(',', '.', regex=False)
    
    df[col] = pd.to_numeric(df[col], errors='coerce')

for column in columns:
    convert_column(gastos_diretos, column)

## Nomenclatura das funções

A coluna 'NOME_FUNCAO' possuia problemas na nomenclatura que dificultavam muito o entendimento

In [182]:
# Renomeia a coluna de funções
rename_functions = {
    'AdministraÃ§Ã£o': 'Administracao',
    'ComunicaÃ§Ãµes': 'Comunicacoes',
    'Direitos da cidadania': 'Direitos da cidadania',
    'SeguranÃ§a pÃºblica': 'Seguranca publica',
    'ComÃ©rcio e serviÃ§os': 'Comercio e servicos',
    'Transporte': 'Transporte',
    'Reserva de contingÃªncia': 'Reserva de contingencia',
    'Encargos especiais': 'Encargos especiais',
    'PrevidÃªncia social': 'Previdencia social',
    'Agricultura': 'Agricultura',
    'OrganizaÃ§Ã£o agrÃ¡ria': 'Organizacao agraria',
    'GestÃ£o ambiental': 'Gestao ambiental',
    'CiÃªncia e Tecnologia': 'Ciencia e Tecnologia',
    'IndÃºstria': 'Industria',
    'Trabalho': 'Trabalho',
    'AssistÃªncia social': 'Assistencia social',
    'Energia': 'Energia',
    'EducaÃ§Ã£o': 'Educacao',
    'Essencial Ã  justiÃ§a': 'Essencial a justiça',
    'RelaÃ§Ãµes exteriores': 'Relacoes exteriores',
    'SaÃºde': 'Saude',
    'Urbanismo': 'Urbanismo',
    'Cultura': 'Cultura',
    'Desporto e lazer': 'Desporto e lazer',
    'Defesa nacional': 'Defesa nacional',
    'HabitaÃ§Ã£o': 'Habitacao',
    'Saneamento': 'Saneamento',
    'JudiciÃ¡ria': 'Judiciaria',
    'Legislativa': 'Legislativa'
}

gastos_diretos['NOME_FUNCAO'] = gastos_diretos['NOME_FUNCAO'].replace(rename_functions)

In [183]:
# Renomeia a coluna de orgãos
rename_orgaos = {
    'PresidÃªncia da RepÃºblica': 'Presidencia da Republica',
    'MinistÃ©rio do Planejamento, Desenvolvimento e GestÃ£o': 'Ministerio do Planejamento, Desenvolvimento e Gestao',
    'MinistÃ©rio da Agricultura, PecuÃ¡ria e Abastecimento': 'Ministerio da Agricultura, Pecuaria e Abastecimento',
    'MinistÃ©rio da CiÃªncia, Tecnologia, InovaÃ§Ãµes e ComunicaÃ§Ãµes': 'Ministerio da Ciencia, Tecnologia, Inovacoes e Comunicacoes',
    'MinistÃ©rio da Fazenda': 'Ministerio da Fazenda',
    'MinistÃ©rio da EducaÃ§Ã£o': 'Ministerio da Educacao',
    'MinistÃ©rio da IndÃºstria, ComÃ©rcio Exterior e ServiÃ§os': 'Ministerio da Industria, Comercio Exterior e Servicos',
    'MinistÃ©rio da JustiÃ§a e SeguranÃ§a PÃºblica': 'Ministerio da Justica e Seguranca Publica',
    'MinistÃ©rio de Minas e Energia': 'Ministerio de Minas e Energia',
    'MinistÃ©rio da PrevidÃªncia Social': 'Ministerio da Previdencia Social',
    'MinistÃ©rio das RelaÃ§Ãµes Exteriores': 'Ministerio das Relacoes Exteriores',
    'MinistÃ©rio da SaÃºde': 'Ministerio da Saude',
    'MinistÃ©rio da TransparÃªncia e Controladoria-Geral da UniÃ£o': 'Ministerio da Transparencia e Controladoria-Geral da Uniao',
    'MinistÃ©rio do Trabalho e Emprego': 'Ministerio do Trabalho e Emprego',
    'MinistÃ©rio dos Transportes, Portos e AviaÃ§Ã£o Civil': 'Ministerio dos Transportes, Portos e Aviacao Civil',
    'MinistÃ©rio das ComunicaÃ§Ãµes': 'Ministerio das Comunicacoes',
    'MinistÃ©rio da Cultura': 'Ministerio da Cultura',
    'MinistÃ©rio do Meio Ambiente': 'Ministerio do Meio Ambiente',
    'MinistÃ©rio do Desenvolvimento AgrÃ¡rio': 'Ministerio do Desenvolvimento Agrario',
    'MinistÃ©rio do Esporte': 'Ministerio do Esporte',
    'MinistÃ©rio da Defesa': 'Ministerio da Defesa',
    'MinistÃ©rio da IntegraÃ§Ã£o Nacional': 'Ministerio da Integracao Nacional',
    'MinistÃ©rio do Turismo': 'Ministerio do Turismo',
    'MinistÃ©rio do Desenvolvimento Social': 'Ministerio do Desenvolvimento Social',
    'MinistÃ©rio das Cidades': 'Ministerio das Cidades',
    'MinistÃ©rio das Mulheres, Igualdade Racial, da Juventude e dos Direitos Humanos': 'Ministerio das Mulheres, Igualdade Racial, da Juventude e dos Direitos Humanos',
    'MinistÃ©rio da Pesca e Aquicultura': 'Ministerio da Pesca e Aquicultura',
    'Advocacia-Geral da UniÃ£o': 'Advocacia-Geral da Uniao',
    'MinistÃ©rio dos Direitos Humanos': 'Ministerio dos Direitos Humanos',
    'JustiÃ§a Eleitoral': 'Justica Eleitoral',
    'MinistÃ©rio do Trabalho': 'Ministerio do Trabalho',
    'Tribunal de Contas da UniÃ£o': 'Tribunal de Contas da Uniao',
    'JustiÃ§a Federal': 'Justica Federal'
}

gastos_diretos['NOME_ORGAO_SUPERIOR'] = gastos_diretos['NOME_ORGAO_SUPERIOR'].replace(rename_orgaos)

In [184]:
# Renomeia a coluna de despesas
rename_despesas = {
    'DiÃ¡rias - Civil': 'Diarias - Civil',
    'ContribuiÃ§Ãµes': 'Contribuicoes',
    'Outros ServiÃ§os de Terceiros - Pessoa JurÃ\xaddica': 'Outros Servicos de Terceiros - Pessoa Juridica',
    'Passagens e Despesas com LocomoÃ§Ã£o': 'Passagens e Despesas com Locomocao',
    'LocaÃ§Ã£o de MÃ£o-de-Obra': 'Locacao de Mao-de-Obra',
    'Equipamentos e Material Permanente': 'Equipamentos e Material Permanente',
    'NÃ£o informado': 'Nao informado',
    'IndenizaÃ§Ãµes e RestituiÃ§Ãµes': 'Indenizacoes e Restituicoes',
    'Outros ServiÃ§os de Terceiros - Pessoa FÃ\xadsica': 'Outros Servicos de Terceiros - Pessoa Fisica',
    'Despesas de ExercÃ\xadcios Anteriores': 'Despesas de Exercicios Anteriores',
    'AuxÃ\xadlio-AlimentaÃ§Ã£o': 'Auxilio-Alimentacao',
    'ObrigaÃ§Ãµes Patronais': 'Obrigacoes Patronais',
    'Outros BenefÃ\xadcios Assistenciais do servidor e do militar': 'Outros Beneficios Assistenciais do servidor e do militar',
    'Vencimentos e Vantagens Fixas - Pessoal Civil': 'Vencimentos e Vantagens Fixas - Pessoal Civil',
    'ContribuiÃ§Ã£o a Entidades Fechadas de PrevidÃªncia': 'Contribuicao a Entidades Fechadas de Previdencia',
    'Material, Bem ou ServiÃ§o para DistribuiÃ§Ã£o Gratuita': 'Material, Bem ou Servico para Distribuicao Gratuita',
    'ObrigaÃ§Ãµes TributÃ¡rias e Contributivas': 'Obrigacoes Tributarias e Contributivas',
    'Material de Consumo': 'Material de Consumo',
    'Ressarcimento de Despesas de Pessoal Requisitado': 'Ressarcimento de Despesas de Pessoal Requisitado',
    'Outras Despesas VariÃ¡veis - Pessoal Civil': 'Outras Despesas Variaveis - Pessoal Civil',
    'AuxÃ\xadlio-Transporte': 'Auxilio-Transporte',
    'AuxÃ\xadlio Financeiro a Estudantes': 'Auxilio Financeiro a Estudantes',
    'ContrataÃ§Ã£o por Tempo Determinado': 'Contratacao por Tempo Determinado',
    'ServiÃ§os de Consultoria': 'Servicos de Consultoria',
    'DiÃ¡rias - Militar': 'Diarias - Militar',
    'SentenÃ§as Judiciais': 'Sentencas Judiciais',
    'Obras e InstalaÃ§Ãµes': 'Obras e Instalacoes',
    'Vencimentos e Vantagens Fixas - Pessoal Militar': 'Vencimentos e Vantagens Fixas - Pessoal Militar',
    'Outros Encargos sobre a DÃ\xadvida por Contrato': 'Outros Encargos sobre a Divida por Contrato',
    'Principal Corrigido da DÃ\xadvida Contratual Refinanciado': 'Principal Corrigido da Divida Contratual Refinanciado',
    'PremiaÃ§Ãµes Culturais, ArtÃ\xadsticas, CientÃ\xadficas, Desportivas e Outras': 'Premiacoes Culturais, Artisticos, Cientificos, Desportivos e Outras',
    'AuxÃ\xadlios': 'Auxilios',
    'AuxÃ\xadlio Financeiro a Pesquisadores': 'Auxilio Financeiro a Pesquisadores',
    'Aposentadorias do RPPS, Reserva Remunerada e Reformas dos Militares': 'Aposentadorias do RPPS, Reserva Remunerada e Reformas dos Militares',
    'PensÃµes do RPPS e do militar': 'Pensoes do RPPS e do militar',
    'IndenizaÃ§Ãµes e RestituiÃ§Ãµes Trabalhistas': 'Indenizacoes e Restituicoes Trabalhistas',
    'PensÃµes Especiais': 'Pensoes Especiais',
    'Outros AuxÃ\xadlios Financeiros a Pessoas FÃ\xadsicas': 'Outros Auxilios Financeiros a Pessoas Fisicas',
    'Outras Despesas de Pessoal decorrentes de Contratos de TerceirizaÃ§Ã£o': 'Outras Despesas de Pessoal decorrentes de Contratos de Terceirizacao',
    'ConstituiÃ§Ã£o ou Aumento de Capital de Empresas': 'Constituicao ou Aumento de Capital de Empresas',
    'Juros sobre a DÃ\xadvida por Contrato': 'Juros sobre a Divida por Contrato',
    'ConcessÃ£o de EmprÃ©stimos e Financiamentos': 'Concessao de Emprestimos e Financiamentos',
    'SubvenÃ§Ãµes econÃ´micas': 'Subvencoes economicas',
    'AquisiÃ§Ã£o de imÃ³veis': 'Aquisição de imoveis',
    'IndenizaÃ§Ã£o pela ExecuÃ§Ã£o de Trabalhos de Campo': 'Indenizacao pela Execucao de Trabalhos de Campo',
    'AquisiÃ§Ã£o de bens para revenda': 'Aquisição de bens para revenda',
    'Rateio pela ParticipaÃ§Ã£o em ConsÃ³rcio PÃºblico': 'Rateio pela Participacao em Consorcio Publico',
    'Outros BenefÃ\xadcios PrevidenciÃ¡rios do servidor ou do militar': 'Outros Beneficios Previdenciarios do servidor ou do militar',
    'Seguro Desemprego e Abono Salarial': 'Seguro Desemprego e Abono Salarial',
    'Principal da DÃ\xadvida Contratual Resgatado': 'Principal da Divida Contratual Resgatado',
    'DistribuiÃ§Ã£o Constitucional ou Legal de Receitas': 'Distribuicao Constitucional ou Legal de Receitas',
    'Principal da DÃ\xadvida MobiliÃ¡ria Resgatado': 'Principal da Divida Mobiliaria Resgatado',
    'Juros, DesÃ¡gios e Descontos da DÃ\xadvida MobiliÃ¡ria': 'Juros, Desagios e Descontos da Divida Mobiliaria',
    'AuxÃ\xadlio-Fardamento': 'Auxilio-Fardamento',
    'Principal Corrigido da DÃ\xadvida MobiliÃ¡ria Refinanciado': 'Principal Corrigido da Divida Mobiliaria Refinanciado',
    'CompensaÃ§Ãµes ao RGPS': 'Compensacoes ao RGPS',
    'Encargos pela Honra de Avais, Garantias, Seguros e Similares': 'Encargos pela Honra de Avais, Garantias, Seguros e Similares',
    'Outros Encargos sobre a DÃ\xadvida MobiliÃ¡ria': 'Outros Encargos sobre a Divida Mobiliaria',
    'A Classificar': 'A Classificar',
    'Outros BenefÃ\xadcios do RGPS - Ã\x81rea Urbana': 'Outros Beneficios do RGPS - Area Urbana',
    'DistribuiÃ§Ã£o de Resultado de Empresas Estatais Dependentes': 'Distribuicao de Resultado de Empresas Estatais Dependentes',
    'Aposentadorias do RGPS - Ã\x81rea Rural': 'Aposentadorias do RGPS - Area Rural',
    'PensÃµes do RGPS - Ã\x81rea Rural': 'Pensoes do RGPS - Area Rural',
    'Outros BenefÃ\xadcios do RGPS - Ã\x81rea Rural': 'Outros Beneficios do RGPS - Area Rural',
    'Aposentadorias do RGPS - Ã\x81rea Urbana': 'Aposentadorias do RGPS - Area Urbana',
    'PensÃµes do RGPS - Ã\x81rea Urbana': 'Pensoes do RGPS - Area Urbana',
    'DepÃ³sitos compulsÃ³rios': 'Depositos compulsorios',
    'SubvenÃ§Ãµes sociais': 'Subvencoes sociais',
    'Outras Despesas VariÃ¡veis - Pessoal Militar': 'Outras Despesas Variaveis - Pessoal Militar',
    'AquisiÃ§Ã£o de TÃ\xadtulos Representativos de Capital jÃ¡ Integralizado': 'Aquisição de Titulos Representativos de Capital ja Integralizado',
    'Arrendamento mercantil': 'Arrendamento mercantil',
    'BenefÃ\xadcio Mensal ao Deficiente e ao Idoso': 'Beneficio Mensal ao Deficiente e ao Idoso',
    'ParticipaÃ§Ã£o em Fundos, Organismos, ou Entidades Assemelhadas, Nacionais e Internacionais': 'Participacao em Fundos, Organismos, ou Entidades Assemelhadas, Nacionais e Internacionais',
    'ObrigaÃ§Ãµes decorrentes de PolÃ\xadtica MonetÃ¡ria': 'Obrigacoes decorrentes de Politica Monetaria',
    'ServiÃ§os de Tecnologia da InformaÃ§Ã£o e ComunicaÃ§Ã£o': 'Servicos de Tecnologia da Informacao e Comunicacao',
    'RemuneraÃ§Ã£o de Cotas de Fundos AutÃ¡rquicos': 'Remuneracao de Cotas de Fundos Autarquicos'
}

gastos_diretos['NOME_ELEMENTO_DE_DESPESA'] = gastos_diretos['NOME_ELEMENTO_DE_DESPESA'].replace(rename_despesas)

# Salvar dados limpos

In [185]:
gastos_diretos.to_csv('../databases/gastosdiretos_clean.csv', index=False)