In [1]:
# --- Célula 1: Configurações Iniciais e Importação do Módulo de Processamento ---

import os
import sys
import pandas as pd # Para visualização, se necessário

# --- 1. Determinar a Raiz do Projeto de Forma Robusta ---
# Esta lógica tenta encontrar o diretório raiz do seu projeto (Projeto_Saldo_Empenhos).
# Ela verifica o diretório de trabalho atual e sobe um nível se estiver em 'notebooks' ou 'src'.

current_working_directory = os.getcwd()
project_root = current_working_directory # Assume que o CWD já é a raiz

# Se o CWD for 'notebooks' ou 'src', subimos um nível para chegar na raiz do projeto.
# Isso cobre a maioria dos cenários de como o VS Code/Jupyter pode iniciar o kernel.
if os.path.basename(current_working_directory) in ['notebooks', 'src']:
    project_root = os.path.abspath(os.path.join(current_working_directory, os.pardir)) # os.pardir é '..'

# Verifica se a pasta 'data' existe na suposta raiz do projeto.
# Isso é uma validação extra para ter certeza que encontramos a raiz correta.
if not os.path.exists(os.path.join(project_root, 'data')):
    print(f"⚠️ Aviso: Pasta 'data' não encontrada em '{project_root}'. Verifique a lógica de detecção da raiz do projeto.")
    # Fallback: se a lógica acima falhar, podemos tentar subir mais um nível ou usar um caminho fixo
    # Por enquanto, vamos manter o project_root como está e observar o erro se persistir.

print(f"Raiz do Projeto Detectada: {project_root}")

# --- 2. Adicionar a Raiz do Projeto ao sys.path para Importar Módulos ---
# Isso permite que o Python encontre o módulo 'src.processing'.
if project_root not in sys.path:
    sys.path.append(project_root)
    print(f"Adicionado '{project_root}' ao sys.path para encontrar módulos locais.")

# --- 3. Importar o Módulo de Processamento ---
from src.processing import processar_dados_financeiros

print("Configurações iniciais carregadas e módulo 'processing' importado com sucesso.")

Raiz do Projeto Detectada: c:\Users\Pedro\Downloads\Projeto_PortalTransparencia\Projeto_Saldo_Empenhos
Adicionado 'c:\Users\Pedro\Downloads\Projeto_PortalTransparencia\Projeto_Saldo_Empenhos' ao sys.path para encontrar módulos locais.
Configurações iniciais carregadas e módulo 'processing' importado com sucesso.


In [8]:
# --- Célula 2: Processamento dos Dados de Pagamentos ---

print("\n--- Processando Pagamentos ---")
try:
    # Construa os caminhos de base completos usando a project_root
    data_input_base = os.path.join(project_root, 'data')
    data_output_base = os.path.join(project_root, 'data') # Ou outro caminho se quiser salvar fora da pasta 'data'

    df_pag_completo, df_pag_normais, df_pag_ajustes = processar_dados_financeiros(
        ano=2025,
        tipo_dado='pagamentos',
        input_base_path=data_input_base, # Passe o caminho completo aqui
        output_base_path=data_output_base # Passe o caminho completo aqui
    )
    if df_pag_completo is not None:
        print(f"✨ Pagamentos 2024 processados. Total de registros: {len(df_pag_completo)}")
except Exception as e:
    print(f"❌ Erro ao processar pagamentos 2024: {e}")

# Opcional: Visualizar algumas linhas do DataFrame processado
if df_pag_normais is not None:
    print("\nPrimeiras 5 linhas de Pagamentos Normais:")
    display(df_pag_normais.head())


--- Processando Pagamentos ---
🔍 Lendo arquivo: c:\Users\Pedro\Downloads\Projeto_PortalTransparencia\Projeto_Saldo_Empenhos\data\raw\2025\pagamentos_2025.csv
✅ 359 registros carregados de 'pagamentos_2025.csv'.
🧹 Limpeza de texto aplicada.
📅 Coluna 'data' convertida para datetime.
💲 Coluna 'valor' convertida para float.
📊 Colunas temporais (dia, mês, ano, mês_ano) criadas.
⚠️ Encontrados 18 registros duplicados com base em ['documento', 'valor'].
✅ Duplicatas removidas do DataFrame principal.
🔎 Ajustes negativos identificados.
📁 Registros normais de pagamentos: 350 | Ajustes negativos de pagamentos: 0
✅ Arquivos tratados de pagamentos salvos com sucesso em: c:\Users\Pedro\Downloads\Projeto_PortalTransparencia\Projeto_Saldo_Empenhos\data\trusted\2025\pagamentos
✨ Pagamentos 2024 processados. Total de registros: 350

Primeiras 5 linhas de Pagamentos Normais:


Unnamed: 0,data,documento,documentoResumido,observacao,funcao,subfuncao,programa,acao,subTitulo,localizadorGasto,...,numeroProcesso,planoOrcamentario,autor,favorecidoIntermediario,favorecidoListaFaturas,dia,mes,ano,mes_ano,eh_ajuste_negativo
0,2025-06-16,153115152362025DF803973,2025DF803973,RETENCAO DE IR DA NF.202400000000270 EMITIDA E...,10 - Saúde,302 - Assistência hospitalar e ambulatorial,5118 - ATENCAO ESPECIALIZADA A SAUDE,8585 - ATENCAO A SAUDE DA POPULACAO PARA PROCE...,85850033 - ATENCAO A SAUDE DA POPULACAO PARA P...,0033 - ATENCAO A SAUDE DA POPULACAO PARA PRO -...,...,23079220568202170,0000 - ATENCAO A SAUDE DA POPULACAO PARA PROCE...,0,False,False,16,6,2025,06-2025,False
1,2025-06-16,443033442072025DF810066,2025DF810066,"RECOLHIMENTO DE DARF (IMPOSTOS FEDERIAS), CONF...",18 - Gestão ambiental,541 - Preservação e conservação ambiental,6114 - PROTECAO E RECUPERACAO DA BIODIVERSIDAD...,"20WM - APOIO A CRIACAO, GESTAO E IMPLEMENTACAO...","20WM0001 - APOIO A CRIACAO, GESTAO E IMPLEMENT...","0001 - APOIO A CRIACAO, GESTAO E IMPLEMENTAC -...",...,2070003609202256,"0000 - APOIO A CRIACAO, GESTAO E IMPLEMENTACAO...",0,False,False,16,6,2025,06-2025,False
2,2025-06-16,443033442072025DF810202,2025DF810202,"RECOLHIMENTO DE DARF (IMPOSTOS FEDERIAS), CONF...",18 - Gestão ambiental,541 - Preservação e conservação ambiental,6114 - PROTECAO E RECUPERACAO DA BIODIVERSIDAD...,"20WM - APOIO A CRIACAO, GESTAO E IMPLEMENTACAO...","20WM0001 - APOIO A CRIACAO, GESTAO E IMPLEMENT...","0001 - APOIO A CRIACAO, GESTAO E IMPLEMENTAC -...",...,2070003609202256,"0000 - APOIO A CRIACAO, GESTAO E IMPLEMENTACAO...",0,False,False,16,6,2025,06-2025,False
3,2025-06-16,443033442072025DF809761,2025DF809761,RETENCAO PREVIDENCIARIA RECOLHIDA POR DARF NUM...,18 - Gestão ambiental,541 - Preservação e conservação ambiental,6114 - PROTECAO E RECUPERACAO DA BIODIVERSIDAD...,"20WM - APOIO A CRIACAO, GESTAO E IMPLEMENTACAO...","20WM0001 - APOIO A CRIACAO, GESTAO E IMPLEMENT...","0001 - APOIO A CRIACAO, GESTAO E IMPLEMENTAC -...",...,2070003609202256,"0000 - APOIO A CRIACAO, GESTAO E IMPLEMENTACAO...",0,False,False,16,6,2025,06-2025,False
4,2025-06-16,153115152362025DF804047,2025DF804047,RETENCAO DE IMPOSTOS DIVERSOS IN 1234/12 S/ NF...,12 - Educação,364 - Ensino superior,"5113 - EDUCACAO SUPERIOR: QUALIDADE, DEMOCRACI...","21GK - FUNCIONAMENTO, MANUTENCAO E CONSERVACAO...","21GK0033 - FUNCIONAMENTO, MANUTENCAO E CONSERV...","0033 - FUNCIONAMENTO, MANUTENCAO E CONSERVAC -...",...,23079248731202410,"0000 - FUNCIONAMENTO, MANUTENCAO E CONSERVACAO...",0,False,False,16,6,2025,06-2025,False


In [9]:
# Processamento dos Dados de Empenhos ---

print("\n--- Processando Empenhos ---")
try:
    df_emp_completo, df_emp_normais, df_emp_ajustes = processar_dados_financeiros(
        ano=2025, # Você mencionou 2025 para empenhos, ajustei aqui
        tipo_dado='empenhos',
        input_base_path=data_input_base, # Passe o caminho completo aqui
        output_base_path=data_output_base # Passe o caminho completo aqui
    )
    if df_emp_completo is not None:
        print(f"✨ Empenhos 2025 processados. Total de registros: {len(df_emp_completo)}")
except Exception as e:
    print(f"❌ Erro ao processar empenhos 2025: {e}")

# Opcional: Visualizar algumas linhas do DataFrame processado
if df_emp_normais is not None:
    print("\nPrimeiras 5 linhas de Empenhos Normais:")
    display(df_emp_normais.head())




--- Processando Empenhos ---
🔍 Lendo arquivo: c:\Users\Pedro\Downloads\Projeto_PortalTransparencia\Projeto_Saldo_Empenhos\data\raw\2025\empenhos_2025.csv
✅ 30 registros carregados de 'empenhos_2025.csv'.
🧹 Limpeza de texto aplicada.
📅 Coluna 'data' convertida para datetime.
💲 Coluna 'valor' convertida para float.
📊 Colunas temporais (dia, mês, ano, mês_ano) criadas.
✅ Nenhuma duplicata encontrada.
🔎 Ajustes negativos identificados.
📁 Registros normais de empenhos: 15 | Ajustes negativos de empenhos: 15
✅ Arquivos tratados de empenhos salvos com sucesso em: c:\Users\Pedro\Downloads\Projeto_PortalTransparencia\Projeto_Saldo_Empenhos\data\trusted\2025\empenhos
✨ Empenhos 2025 processados. Total de registros: 30

Primeiras 5 linhas de Empenhos Normais:


Unnamed: 0,data,documento,documentoResumido,observacao,funcao,subfuncao,programa,acao,subTitulo,localizadorGasto,...,numeroProcesso,planoOrcamentario,autor,favorecidoIntermediario,favorecidoListaFaturas,dia,mes,ano,mes_ano,eh_ajuste_negativo
2,2025-06-11,153150152362025NE000067,2025NE000067,IMPORTANCIA EMPENHADA PARA PRESTACAO DE SERVIC...,10 - Saúde,302 - Assistência hospitalar e ambulatorial,5118 - ATENCAO ESPECIALIZADA A SAUDE,8585 - ATENCAO A SAUDE DA POPULACAO PARA PROCE...,85850033 - ATENCAO A SAUDE DA POPULACAO PARA P...,0033 - ATENCAO A SAUDE DA POPULACAO PARA PRO -...,...,23079.212596/2024-66,0005 - FUNDO DE ACOES ESTRATEGICAS E COMPENSAC...,0,False,False,11,6,2025,06-2025,False
8,2025-06-09,157243264432025NE000734,2025NE000734,DLIH/SIF/UFAC/UMP - EMISSAO DE EMPENHO PARA PA...,10 - Saúde,302 - Assistência hospitalar e ambulatorial,5118 - ATENCAO ESPECIALIZADA A SAUDE,8585 - ATENCAO A SAUDE DA POPULACAO PARA PROCE...,85850001 - ATENCAO A SAUDE DA POPULACAO PARA P...,0001 - ATENCAO A SAUDE DA POPULACAO PARA PRO -...,...,23877.002254/2024-34,000I - CUSTEIO DE SERVICOS PRESTADOS PELOS HOS...,0,False,False,9,6,2025,06-2025,False
9,2025-06-09,153162152362025NE000006,2025NE000006,EMPENHO DA CONTRATACAO DE EMPRESA ESPECIALIZAD...,12 - Educação,364 - Ensino superior,"5113 - EDUCACAO SUPERIOR: QUALIDADE, DEMOCRACI...","21GK - FUNCIONAMENTO, MANUTENCAO E CONSERVACAO...","21GK0033 - FUNCIONAMENTO, MANUTENCAO E CONSERV...","0033 - FUNCIONAMENTO, MANUTENCAO E CONSERVAC -...",...,23079.248731/2024-10,"0000 - FUNCIONAMENTO, MANUTENCAO E CONSERVACAO...",0,False,False,9,6,2025,06-2025,False
13,2025-05-30,157243264432025NE000711,2025NE000711,DLIH/SIF/UFAC/UMP - EMISSAO DE EMPENHO PARA PA...,10 - Saúde,302 - Assistência hospitalar e ambulatorial,5118 - ATENCAO ESPECIALIZADA A SAUDE,8585 - ATENCAO A SAUDE DA POPULACAO PARA PROCE...,85850001 - ATENCAO A SAUDE DA POPULACAO PARA P...,0001 - ATENCAO A SAUDE DA POPULACAO PARA PRO -...,...,23877.002254/2024-34,000I - CUSTEIO DE SERVICOS PRESTADOS PELOS HOS...,0,False,False,30,5,2025,05-2025,False
14,2025-05-27,158422264062025NE000104,2025NE000104,EMPENHO PARA CUSTEAR DESPESA COM CONTRATACAO D...,12 - Educação,363 - Ensino profissional,5112 - EDUCACAO PROFISSIONAL E TECNOLOGICA QUE...,20RL - FUNCIONAMENTO DAS INSTITUICOES DA REDE ...,20RL0032 - FUNCIONAMENTO DAS INSTITUICOES DA R...,0032 - FUNCIONAMENTO DAS INSTITUICOES DA RED -...,...,23159.000092/2025-96,0000 - FUNCIONAMENTO DAS INSTITUICOES DA REDE ...,0,False,False,27,5,2025,05-2025,False


In [12]:
# Processamento dos Dados de Liquidações ---

print("\n--- Processando Liquidações ---")
try:
    df_liq_completo, df_liq_normais, df_liq_ajustes = processar_dados_financeiros(
        ano=2025,
        tipo_dado='liquidações',
        input_base_path=data_input_base, # Passe o caminho completo aqui
        output_base_path=data_output_base # Passe o caminho completo aqui
    )
    if df_liq_completo is not None:
        print(f"✨ Liquidações de 2025 processadas. Total de registros: {len(df_liq_completo)}")
except Exception as e:
    print(f"❌ Erro ao processar liquidações 2024: {e}")

#Visualizar algumas linhas do DataFrame processado
if df_liq_normais is not None:
    print("\nPrimeiras 5 linhas de Liquidações Normais:")
    display(df_liq_normais.head())


print("\n--- Todos os processos concluídos. ---")


--- Processando Liquidações ---
🔍 Lendo arquivo: c:\Users\Pedro\Downloads\Projeto_PortalTransparencia\Projeto_Saldo_Empenhos\data\raw\2025\liquidações_2025.csv
✅ 109 registros carregados de 'liquidações_2025.csv'.
🧹 Limpeza de texto aplicada.
📅 Coluna 'data' convertida para datetime.
💲 Coluna 'valor' convertida para float.
📊 Colunas temporais (dia, mês, ano, mês_ano) criadas.
✅ Nenhuma duplicata encontrada.
🔎 Ajustes negativos identificados.
📁 Registros normais de liquidações: 109 | Ajustes negativos de liquidações: 0
✅ Arquivos tratados de liquidações salvos com sucesso em: c:\Users\Pedro\Downloads\Projeto_PortalTransparencia\Projeto_Saldo_Empenhos\data\trusted\2025\liquidações
✨ Liquidações de 2025 processadas. Total de registros: 109

Primeiras 5 linhas de Liquidações Normais:


Unnamed: 0,data,documento,documentoResumido,observacao,funcao,subfuncao,programa,acao,subTitulo,localizadorGasto,...,numeroProcesso,planoOrcamentario,autor,favorecidoIntermediario,favorecidoListaFaturas,dia,mes,ano,mes_ano,eh_ajuste_negativo
0,2025-06-13,158428264062025NS000888,2025NS000888,PGTO DO(S) INSTR.(S) DE COBRANCA(S) NUM.(S): 1...,12 - Educação,363 - Ensino profissional,5112 - EDUCACAO PROFISSIONAL E TECNOLOGICA QUE...,20RL - FUNCIONAMENTO DAS INSTITUICOES DA REDE ...,20RL0032 - FUNCIONAMENTO DAS INSTITUICOES DA R...,0032 - FUNCIONAMENTO DAS INSTITUICOES DA RED -...,...,,0000 - FUNCIONAMENTO DAS INSTITUICOES DA REDE ...,0,False,False,13,6,2025,06-2025,False
1,2025-06-12,158421264062025NS000436,2025NS000436,PGTO DO(S) INSTR.(S) DE COBRANCA(S) NUM.(S): 2...,12 - Educação,363 - Ensino profissional,5112 - EDUCACAO PROFISSIONAL E TECNOLOGICA QUE...,20RL - FUNCIONAMENTO DAS INSTITUICOES DA REDE ...,20RL0032 - FUNCIONAMENTO DAS INSTITUICOES DA R...,0032 - FUNCIONAMENTO DAS INSTITUICOES DA RED -...,...,,0000 - FUNCIONAMENTO DAS INSTITUICOES DA REDE ...,0,False,False,12,6,2025,06-2025,False
2,2025-06-12,153010152442025NS009418,2025NS009418,PGTO DO(S) INSTR.(S) DE COBRANCA(S) NUM.(S): 2...,12 - Educação,363 - Ensino profissional,5112 - EDUCACAO PROFISSIONAL E TECNOLOGICA QUE...,20RL - FUNCIONAMENTO DAS INSTITUICOES DA REDE ...,20RL0033 - FUNCIONAMENTO DAS INSTITUICOES DA R...,0033 - FUNCIONAMENTO DAS INSTITUICOES DA RED -...,...,,0000 - FUNCIONAMENTO DAS INSTITUICOES DA REDE ...,0,False,False,12,6,2025,06-2025,False
3,2025-06-11,153150152362025NS000680,2025NS000680,PGTO DO(S) INSTR.(S) DE COBRANCA(S) NUM.(S): 2...,10 - Saúde,302 - Assistência hospitalar e ambulatorial,5118 - ATENCAO ESPECIALIZADA A SAUDE,8585 - ATENCAO A SAUDE DA POPULACAO PARA PROCE...,85850033 - ATENCAO A SAUDE DA POPULACAO PARA P...,0033 - ATENCAO A SAUDE DA POPULACAO PARA PRO -...,...,,0005 - FUNDO DE ACOES ESTRATEGICAS E COMPENSAC...,0,False,False,11,6,2025,06-2025,False
4,2025-06-11,158421264062025NS000428,2025NS000428,PGTO DO(S) INSTR.(S) DE COBRANCA(S) NUM.(S): 2...,12 - Educação,363 - Ensino profissional,5112 - EDUCACAO PROFISSIONAL E TECNOLOGICA QUE...,20RL - FUNCIONAMENTO DAS INSTITUICOES DA REDE ...,20RL0032 - FUNCIONAMENTO DAS INSTITUICOES DA R...,0032 - FUNCIONAMENTO DAS INSTITUICOES DA RED -...,...,,0000 - FUNCIONAMENTO DAS INSTITUICOES DA REDE ...,0,False,False,11,6,2025,06-2025,False



--- Todos os processos concluídos. ---
