In [None]:
import pandas as pd
from IPython.display import Markdown, display

In [None]:
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', 5)

# Análise do Tema Despesas no Portal da Transparência

**Fonte de Dados:**

https://portaldatransparencia.gov.br/download-de-dados

Link: https://portaldatransparencia.gov.br/download-de-dados/despesas



*Outras fontes possíveis:
Outras fontes para um segundo momento.
Link: https://portaldatransparencia.gov.br/download-de-dados/despesas-execucao*

In [None]:
# Especifique o caminho para o seu arquivo CSV
caminho_pasta = '../../../informações/despesas_publicas/'

# Datasets

São três datasets principais:

* Empenho
* Pagamento
* Liquidação


# Diferença entre Empenho, Liquidação e Pagamento na Contabilidade Pública Federal

Na contabilidade pública federal brasileira, os termos **empenho**, **liquidação** e **pagamento** se referem às fases do processo de execução da despesa pública. Essas fases são obrigatórias e seguem uma ordem para assegurar o controle do uso dos recursos públicos. Aqui está a diferença entre eles:

## 1. Empenho
O empenho é a **primeira fase** da execução da despesa. Consiste na reserva de parte do orçamento público para a realização de uma determinada despesa. Ele é formalizado por meio de um documento chamado Nota de Empenho, que garante que há disponibilidade orçamentária para cobrir a despesa. O empenho pode ser:
   - **Ordinário**: Para despesas cujo valor total é conhecido no momento do empenho.
   - **Estimativo**: Para despesas contínuas e variáveis, como serviços públicos (água, energia).
   - **Global**: Para despesas contratuais com execução ao longo do exercício financeiro.

O empenho **não representa o pagamento imediato**, mas apenas uma garantia de que o valor está reservado no orçamento.

## 2. Liquidação
A liquidação é a **segunda fase** do processo de execução da despesa. Ela ocorre quando o serviço ou bem contratado foi entregue ou prestado, e é necessário verificar se o que foi solicitado está de acordo com o contrato ou a ordem de serviço. A liquidação consiste na **verificação da origem da dívida**, ou seja, se o bem ou serviço foi efetivamente entregue ou realizado conforme o contratado.

Nesta fase, a Administração Pública comprova:
   - A existência do direito adquirido pelo credor;
   - O cumprimento das condições para o pagamento;
   - O valor a ser pago.

Ou seja, é o reconhecimento de que a despesa foi realizada e está apta para ser paga.

## 3. Pagamento
O pagamento é a **última fase** do processo de execução da despesa pública. Ele ocorre após a liquidação, quando a Administração Pública efetivamente transfere os recursos financeiros para o credor (fornecedor, prestador de serviços, etc.). É o momento em que a despesa se concretiza, ou seja, quando o dinheiro sai dos cofres públicos para cumprir a obrigação financeira gerada pelo empenho e verificada pela liquidação.

## Resumo do processo:
1. **Empenho**: Reserva do orçamento (garantia de que a despesa será paga no futuro).
2. **Liquidação**: Verificação e comprovação de que o serviço ou bem foi entregue e está de acordo com o contrato.
3. **Pagamento**: Transferência dos recursos financeiros ao credor.

Essas etapas são fundamentais para garantir a legalidade, a transparência e o controle da execução da despesa pública, assegurando que os recursos sejam utilizados corretamente.


In [None]:


csv_empenho = caminho_pasta + '20240101_Despesas/20240101_Despesas_Empenho.csv'
csv_pagamento = caminho_pasta + '20240101_Despesas/20240101_Despesas_Pagamento.csv'
csv_liquidacao = caminho_pasta + '20240101_Despesas/20240101_Despesas_Liquidacao.csv'

df_empenho = pd.read_csv(csv_empenho, delimiter=';', encoding='latin1')

df_pagamento = pd.read_csv(csv_pagamento, delimiter=';', encoding='latin1')

df_liquidacao = pd.read_csv(csv_liquidacao, delimiter=';', encoding='latin1')

In [None]:
display(Markdown("# Datasets de Despesas"))

display(Markdown("## Empenho"))
display (df_empenho.info())
display (df_empenho.sample(3))

display(Markdown("## Pagamento"))
display (df_empenho.info())
display (df_empenho.sample(3))

display(Markdown("## Liquidação"))
display (df_empenho.info())
display (df_empenho.sample(3))


# Análise das colunas dos Datasets

Podemos perceber que existem diversas colunas em comum.

Para facilitar nossa análise vamos mostrar as colunas em comum e depois apenas as colunas específicas de cada dataset.

In [None]:
def listar_colunas_comuns(lista_dataframes):
    # Obter as colunas do primeiro DataFrame
    colunas_comuns = set(lista_dataframes[0].columns)
    
    # Iterar sobre os demais DataFrames e fazer interseção de colunas
    for df in lista_dataframes[1:]:
        colunas_comuns &= set(df.columns)
    
    return (list(colunas_comuns))

colunas_comuns = listar_colunas_comuns([df_empenho, df_pagamento, df_liquidacao])

In [None]:
display(Markdown("## Colunas em comum entre Empenho, Pagamento e Liquidação"))
display(colunas_comuns)

# EXPLICITAR ANÁLISE --------------
Encontramos três(???) classes de colunas:

* Quanto a onde a despesa foi gerada:
    * 'Código Órgão Superior', 'Código Plano Orçamentário'
 'Código Favorecido
 'Gestã
* Sobre detalhes da despesa:
*  'Código Elemento de Despesa',  'Elemento de Despesa'
 'Categoria de Despesa 'Observação', ',ão',

In [None]:
def listar_colunas_nao_comuns(lista_dataframes, lista_colunas):
    # Inicializar um conjunto vazio para as colunas não comuns
    colunas_nao_comuns = set()
    
    # Iterar sobre os DataFrames
    for df in lista_dataframes:
        # Verificar colunas que estão no DataFrame, mas não na lista de colunas
        colunas_nao_comuns.update(set(df.columns) - set(lista_colunas))
    
    return list(colunas_nao_comuns)




In [None]:


display(Markdown("## Colunas específicas do dataset Empenho"))
display(listar_colunas_nao_comuns ([df_empenho], colunas_comuns))

display(Markdown("## Colunas específicas do dataset Liquidação"))
display(listar_colunas_nao_comuns ([df_liquidacao], colunas_comuns))

display(Markdown("## Colunas específicas do dataset Pagamento"))
display(listar_colunas_nao_comuns ([df_pagamento], colunas_comuns))


In [None]:
def gerar_totais_coluna(df, nome_coluna):

    valores_distintos = df.value_counts(nome_coluna)
    
    display(Markdown(f"## Valores para coluna: {nome_coluna}"))
    display(Markdown(f'Número de valores distintos: **{valores_distintos.nunique()}**'))
    display(valores_distintos)


def descrever_dados_df (df, nome_df, colunas):

    display(Markdown(f"# Análise de valores para a tabela: {nome_df}"))
    
    for coluna in colunas:
        gerar_totais_coluna (df, coluna)
        

In [None]:

# Colocar makdown: colunas comuns

descrever_dados_df(df_empenho, "Empenho", colunas_comuns)

descrever_dados_df(df_pagamento, "Pagamentos", colunas_comuns)

descrever_dados_df(df_liquidacao, "Liquidação", colunas_comuns)

In [None]:
descrever_dados_df(df_empenho, "Empenho", listar_colunas_nao_comuns ([df_empenho], colunas_comuns))

In [None]:
nome_arquivo = '20240101_Despesas/20240101_Despesas_Empenho.csv'
caminho_arquivo = caminho_pasta + nome_arquivo

df_empenho = pd.read_csv(caminho_arquivo, delimiter=';', encoding='latin1')

df_empenho_rfb = df_empenho[df_empenho['Unidade Gestora'].str.contains('rfb', case=False, na=False)]

#df_empenho_rfb_colunas = df_empenho_rfb[colunas_desejadas]

# Listar unidades únicas na coluna
elemento_despesa = df_empenho_rfb['Elemento de Despesa'].value_counts().reset_index()

# Exibir todas as linhas temporariamente
with pd.option_context('display.max_rows', None):
    display(elemento_despesa)

# Listar unidades únicas na coluna
valor_reais = df_empenho_rfb['Valor do Empenho Convertido pra R$'].value_counts().reset_index()

# Exibir todas as linhas temporariamente
with pd.option_context('display.max_rows', None):
    display(valor_reais)

display(df_empenho_rfb)

In [None]:
df_empenho['Unidade Gestora'].value_counts()

In [None]:
nome_arquivo = '20240101_Despesas/20240101_Despesas_Pagamento.csv'
caminho_arquivo = caminho_pasta + nome_arquivo

df_pagamento = pd.read_csv(caminho_arquivo, delimiter=';', encoding='latin1')

#df_pagamento_rfb = df_pagamento[df_pagamento['Unidade Gestora'].str.contains('rfb', case=False, na=False)]

#df_pagamento_rfb_colunas = df_pagamento_rfb[colunas_desejadas]

display(df_pagamento)

In [None]:
nome_arquivo = '20240102_Despesas/20240102_Despesas_Pagamento.csv'
caminho_arquivo = caminho_pasta + nome_arquivo

df_pagamento = pd.read_csv(caminho_arquivo, delimiter=';', encoding='latin1')

df_pagamento_rfb = df_pagamento[df_pagamento['Unidade Gestora'].str.contains('rfb', case=False, na=False)]

#df_pagamento_rfb_colunas = df_pagamento_rfb[colunas_desejadas]

# Listar unidades únicas na coluna
elemento_despesa = df_pagamento_rfb['Elemento de Despesa'].value_counts().reset_index()

# Exibir todas as linhas temporariamente
with pd.option_context('display.max_rows', None):
    display(elemento_despesa)

# Listar unidades únicas na coluna
valor_reais = df_pagamento_rfb['Valor do Pagamento Convertido pra R$'].value_counts().reset_index()

# Exibir todas as linhas temporariamente
with pd.option_context('display.max_rows', None):
    display(valor_reais)


display(df_pagamento_rfb)

In [None]:
nome_arquivo = '20240101_Despesas/20240101_Despesas_Liquidacao.csv'
caminho_arquivo = caminho_pasta + nome_arquivo

df_liquidacao = pd.read_csv(caminho_arquivo, delimiter=';', encoding='latin1')

df_liquidacao_rfb = df_liquidacao[df_liquidacao['Unidade Gestora'].str.contains('rfb', case=False, na=False)]

#df_liquidacao_rfb_colunas = df_liquidacao_rfb[colunas_desejadas]

# Listar unidades únicas na coluna
elemento_despesa = df_pagamento_rfb['Elemento de Despesa'].value_counts().reset_index()

# Exibir todas as linhas temporariamente
with pd.option_context('display.max_rows', None):
    display(elemento_despesa)

display(df_liquidacao_rfb)