# 31. Auditoria: Agente de An√°lise de Di√°rio Oficial (PDF)

Este notebook demonstra como criar um "Agente Auditor" que:
1.  L√™ um arquivo PDF de Di√°rio Oficial (upload do usu√°rio).
2.  Extrai estruturadamente todas as compras e contrata√ß√µes usando **Google Gemini** e **Pydantic**.
3.  Analisa os dados extra√≠dos em busca de anomalias ou pontos de aten√ß√£o.
4.  Gera um Relat√≥rio Executivo autom√°tico.

**Fluxo:** PDF -> Texto -> Extra√ß√£o Estruturada (LLM) -> An√°lise de Regras -> Relat√≥rio Final.

In [1]:
### INJECTION START ###
import os
from dotenv import load_dotenv
# Carregar vari√°veis de ambiente locais se existirem
load_dotenv()
### INJECTION END ###

# Instala√ß√£o das depend√™ncias
!pip install -qU langchain langchain-google-genai pypdf


[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m25.3[0m[39;49m -> [0m[32;49m26.0.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m


## 1. Carregando o Di√°rio Oficial (Upload)

Fa√ßa o upload do arquivo PDF do Di√°rio Oficial que deseja auditar.

In [2]:
import os
try:
    from google.colab import files
    print("Por favor, fa√ßa o upload do seu arquivo PDF de Di√°rio Oficial.")
    uploaded = files.upload()
    if uploaded:
        pdf_filename = next(iter(uploaded))
        print(f"Arquivo '{pdf_filename}' carregado com sucesso!")
    else:
        print("Nenhum arquivo enviado.")
        pdf_filename = None
except ImportError:
    print("Ambiente local detectado.")
    # For√ßar uso do arquivo espec√≠fico se solicitado ou listar pdfs
    target_pdf = "diario-oficial-ordinaria-5403-02-04-2026-19_18_50.pdf"
    
    if os.path.exists(target_pdf):
        pdf_filename = target_pdf
        print(f"Usando arquivo solicitado: {pdf_filename}")
    else:
        # Verifica se existe algum PDF na pasta
        pdfs = [f for f in os.listdir('.') if f.lower().endswith('.pdf')]
        if pdfs:
            print(f"PDFs encontrados na pasta: {pdfs}")
            pdf_filename = pdfs[0]
            print(f"Usando automaticamente o primeiro PDF encontrado: {pdf_filename}")
        else:
            pdf_filename = input("Digite o caminho/nome do arquivo PDF (ex: diario.pdf): ")
            if not os.path.exists(pdf_filename):
                 print("Arquivo n√£o encontrado. Certifique-se de que ele est√° na pasta.")


Ambiente local detectado.
Usando arquivo solicitado: diario-oficial-ordinaria-5403-02-04-2026-19_18_50.pdf


## 2. Carregando e Processando o PDF

Uso do `PyPDFLoader` para obter o texto bruto.

In [3]:
from langchain_community.document_loaders import PyPDFLoader

if pdf_filename:
    loader = PyPDFLoader(pdf_filename)
    pages = loader.load()
    full_text = "\n".join([p.page_content for p in pages])
    
    print(f"Texto carregado ({len(full_text)} caracteres).")
    # print(full_text) # Opcional: imprimir texto para conferir
else:
    print("ERRO: Nenhum arquivo PDF definido.")

Texto carregado (429648 caracteres).


## 3. Definindo o Schema de Extra√ß√£o (Pydantic)

Definimos exatamente quais dados queremos capturar de cada compra.

In [4]:
from typing import List, Optional
from pydantic import BaseModel, Field

class Compra(BaseModel):
    """Representa uma compra ou contrato extra√≠do do di√°rio oficial."""
    numero_contrato: Optional[str] = Field(None, description="N√∫mero do contrato ou processo")
    contratante: Optional[str] = Field(None, description="√ìrg√£o ou secretaria que est√° comprando")
    contratada: Optional[str] = Field(None, description="Nome da empresa ou pessoa contratada")
    objeto: Optional[str] = Field(None, description="Descri√ß√£o do bem ou servi√ßo adquirido")
    valor: Optional[float] = Field(None, description="Valor total da compra em Reais (converter para float)")
    modalidade: Optional[str] = Field(None, description="Modalidade (Licita√ß√£o, Dispensa, Preg√£o, etc)")

class DiarioOficial(BaseModel):
    """Lista de todas as compras encontradas no texto."""
    compras: List[Compra] = Field(description="Lista de compras e contratos identificados")

## 4. Agente de Extra√ß√£o (Gemini)

Usamos `with_structured_output` para obrigar o LLM a retornar JSON conforme nosso schema.

In [5]:
import os
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_core.prompts import ChatPromptTemplate

# Configura√ß√£o da API
if "GOOGLE_API_KEY" not in os.environ:
    os.environ["GOOGLE_API_KEY"] = "SUA_CHAVE_AQUI" # No Colab use userdata
    try:
        from google.colab import userdata
        os.environ["GOOGLE_API_KEY"] = userdata.get('GOOGLE_API_KEY')
    except:
        pass

llm = ChatGoogleGenerativeAI(model="gemini-2.0-flash", temperature=0)

structured_llm = llm.with_structured_output(DiarioOficial)

prompt = ChatPromptTemplate.from_template(
    """Voc√™ √© um assistente de IA especializado em ler Di√°rios Oficiais.
    Extraia TODAS as informa√ß√µes sobre compras, contratos e licita√ß√µes do texto abaixo.
    Se n√£o encontrar o valor exato, tente estimar ou extrair o n√∫mero dispon√≠vel.
    Ignore nomea√ß√µes de pessoal ou decretos que n√£o envolvam gastos com fornecedores.
    
    TEXTO DO DI√ÅRIO:
    {text}
    """
)

chain_extract = prompt | structured_llm

In [6]:
if pdf_filename:
    print("‚è≥ Extraindo dados com IA...")
    resultado = chain_extract.invoke({"text": full_text})
    
    print(f"‚úÖ Extra√ß√£o completa! Encontradas {len(resultado.compras)} compras.")
    for i, compra in enumerate(resultado.compras):
        valor_fmt = f"R$ {compra.valor:,.2f}" if compra.valor is not None else "N/A"
        contratada_fmt = compra.contratada if compra.contratada else "N/A"
        objeto_fmt = f"{compra.objeto[:50]}..." if compra.objeto else "N/A"
        print(f"{i+1}. {contratada_fmt} | {valor_fmt} | {objeto_fmt}")

‚è≥ Extraindo dados com IA...


‚úÖ Extra√ß√£o completa! Encontradas 99 compras.
1. 62.535.481 CAMILA ALVES DA CRUZ | R$ 8,025.00 | Aquisi√ß√£o de g√™neros aliment√≠cios n√£o perec√≠veis e...
2. AJR COM√âRCIO DE PRODUTOS PARA SA√öDE LTDA | R$ 125,000.00 | Aquisi√ß√£o de g√™neros aliment√≠cios n√£o perec√≠veis e...
3. AM COMERCIO DE ALIMENTOS LTDA | R$ 8,970.00 | Aquisi√ß√£o de g√™neros aliment√≠cios n√£o perec√≠veis e...
4. COMERCIAL BRAZ LTDA | R$ 58,200.00 | Aquisi√ß√£o de g√™neros aliment√≠cios n√£o perec√≠veis e...
5. ELLEV DISTRIBUIDORA LTDA | R$ 982,589.30 | Aquisi√ß√£o de g√™neros aliment√≠cios n√£o perec√≠veis e...
6. J L DALLAGNOL EMPREENDIMENTOS IMOBILIARIOS LTDA | R$ 5,648.37 | N/A
7. JG ARQUITETURA LTDA | R$ 3,911.27 | N/A
8. ROSA MARIA JERONYMO LIMA | R$ 14,239.37 | N/A
9. ANDRE DALLEASTE DOS SANTOS | R$ 15,976.08 | N/A
10. MODERNATIVA EMPREENDIMENTOS IMOBILI√ÅRIOS LTDA | R$ 3,548.28 | N/A
11. BEATRIZ APARECIDA DA SILVA MOSQUER | R$ 35,542.50 | N/A
12. ANB ENGENHARIA LTDA | R$ 4,818.70 | N/A
13. ANB ENGE

## 5. Agente de Auditoria (An√°lise)

Agora vamos criar uma fun√ß√£o que avalia as compras extra√≠das e busca "red flags" (bandeiras vermelhas).

In [7]:
def analisar_compras(dados: DiarioOficial) -> str:
    analise_prompt = ChatPromptTemplate.from_template(
        """Voc√™ √© um Auditor Geral. Analise a lista de compras extra√≠das do Di√°rio Oficial abaixo.
        Identifique poss√≠veis irregularidades, pre√ßos abusivos ou descri√ß√µes vagas. 
        D√™ aten√ß√£o especial a compras de alto valor ou itens de luxo/desnecess√°rios.
        
        DADOS DAS COMPRAS:
        {dados_json}
        
        Gere um RELAT√ìRIO EXECUTIVO em Markdown contendo:
        1. Resumo dos gastos (Total, Maior Compra).
        2. Pontos de Aten√ß√£o (Red Flags) - com justificativa.
        3. Recomenda√ß√µes de Fiscaliza√ß√£o.
        """
    )
    
    # Convertendo os dados Pydantic para JSON string para o prompt
    dados_json = dados.json()
    
    chain_analise = analise_prompt | llm
    response = chain_analise.invoke({"dados_json": dados_json})
    return response.content

if pdf_filename:
    print("üìä Gerando Relat√≥rio de Auditoria...")
    relatorio = analisar_compras(resultado)
    from IPython.display import Markdown
    display(Markdown(relatorio))

üìä Gerando Relat√≥rio de Auditoria...


/var/folders/kg/kfw4qstx31j1zmw50lzf4mn80000gn/T/ipykernel_91287/3599643814.py:18: PydanticDeprecatedSince20: The `json` method is deprecated; use `model_dump_json` instead. Deprecated in Pydantic V2.0 to be removed in V3.0. See Pydantic V2 Migration Guide at https://errors.pydantic.dev/2.10/migration/
  dados_json = dados.json()


## RELAT√ìRIO EXECUTIVO DE AUDITORIA - COMPRAS MUNIC√çPIO DE FOZ DO IGUA√áU - PR

**Data:** 2024-01-24

**Escopo:** An√°lise de lista de compras extra√≠das do Di√°rio Oficial do Munic√≠pio de Foz do Igua√ßu - PR.

### 1. Resumo dos Gastos

*   **Total de Gastos Identificados:** R$ 7.484.248,84
*   **Maior Compra:** R$ 2.247.397,48 - Presta√ß√£o de servi√ßo de forma cont√≠nua, dos servi√ßos de manuten√ß√£o preventiva e corretiva por Ve√≠culos Pesados, Caminh√£o, √înibus, Equipamentos Rodovi√°rios e Agr√≠cola, inclu√≠do mec√¢nica, el√©trica, lanternagem, pintura, higieniza√ß√£o completa, ret√≠fica de motores el√©tricos, combust√£o, equipamentos acoplados sendo; Placas Vibrat√≥rias, Sopradores, e Consertos de Ferramentas El√©tricas, servi√ßos de tape√ßaria, servi√ßos de guincho, servi√ßos de manuten√ß√£o tipo m√£o-de-obra, conserto com reposi√ß√£o, incluindo o fornecimento de pe√ßas, multim√≠dia e acess√≥rios de reposi√ß√£o genu√≠nas e/ou originais, para atender √†s necessidades da frota de ve√≠culos sendo: Secretaria Municipal de Obras, Secretaria Municipal de Meio Ambiente, Secretaria Municipal de Educa√ß√£o, Secretaria Municipal da Agricultura e Secretaria Municipal de Assist√™ncia Social. Contratada: RETIFICADORA DE MOTORES FOZ LTDA.

### 2. Pontos de Aten√ß√£o (Red Flags)

*   **Objeto Vago e Repetitivo:** Diversas compras da Secretaria Municipal de Educa√ß√£o (representando um volume financeiro significativo) possuem o mesmo objeto: "Aquisi√ß√£o de g√™neros aliment√≠cios n√£o perec√≠veis e insumos essenciais ao funcionamento e √† manuten√ß√£o das unidades escolares, bem como ao atendimento administrativo e institucional da Secretaria Municipal de Educa√ß√£o".
    *   **Justificativa:** A descri√ß√£o gen√©rica dificulta a identifica√ß√£o dos itens espec√≠ficos adquiridos, impedindo a an√°lise de pre√ßos unit√°rios e a compara√ß√£o com valores de mercado. A repeti√ß√£o do objeto sugere a possibilidade de fracionamento indevido de despesas para evitar modalidades de licita√ß√£o mais rigorosas.
*   **Valor Elevado em Manuten√ß√£o de Ve√≠culos:** O contrato de R$ 2.247.397,48 com a RETIFICADORA DE MOTORES FOZ LTDA para manuten√ß√£o de ve√≠culos pesados e equipamentos √© o maior valor identificado.
    *   **Justificativa:** O valor elevado exige uma an√°lise detalhada dos servi√ßos prestados, da necessidade real de manuten√ß√£o, da compatibilidade dos pre√ßos praticados com o mercado e da qualidade das pe√ßas e servi√ßos fornecidos. A abrang√™ncia do contrato (diversas secretarias) demanda um controle rigoroso da execu√ß√£o.
*   **Contrata√ß√£o de Artista com Data Futura:** A contrata√ß√£o da banda Falamansa para o Carnaval de 2026, com um valor de R$ 220.000,00, chama a aten√ß√£o pela data futura do evento.
    *   **Justificativa:** Embora a contrata√ß√£o de artistas seja comum, a antecipa√ß√£o de quase dois anos para o evento levanta questionamentos sobre a necessidade premente da contrata√ß√£o, a possibilidade de mudan√ßas nas condi√ß√µes do mercado e a garantia da efetiva realiza√ß√£o do evento.
*   **Inexigibilidade para Manuten√ß√£o de Equipamento Espec√≠fico:** A contrata√ß√£o por inexigibilidade da MEDICALBLU EQUIPAMENTOS M√âDICOS E HOSPITALARES LTDA para manuten√ß√£o de torre de v√≠deo Stryker (R$ 86.870,86).
    *   **Justificativa:** √â necess√°rio verificar se a inexigibilidade foi devidamente justificada, comprovando a exclusividade da empresa na presta√ß√£o do servi√ßo e a impossibilidade de competi√ß√£o. √â importante analisar se o pre√ßo cobrado √© compat√≠vel com o mercado, mesmo em situa√ß√£o de inexigibilidade.
*   **Aus√™ncia de Informa√ß√µes:** Um bloco de transa√ß√µes n√£o possui informa√ß√µes sobre o contratante, contratada, objeto e modalidade.
    *   **Justificativa:** A aus√™ncia de informa√ß√µes impede qualquer an√°lise e levanta s√©rias d√∫vidas sobre a legalidade e a transpar√™ncia dessas transa√ß√µes. √â imprescind√≠vel identificar a origem e a natureza desses gastos.

### 3. Recomenda√ß√µes de Fiscaliza√ß√£o

1.  **Auditoria Detalhada das Compras de G√™neros Aliment√≠cios:**
    *   Levantar os itens espec√≠ficos adquiridos em cada compra da Secretaria Municipal de Educa√ß√£o.
    *   Comparar os pre√ßos unit√°rios com os valores de mercado, buscando identificar poss√≠veis sobrepre√ßos.
    *   Analisar a necessidade e a adequa√ß√£o dos itens adquiridos para as unidades escolares.
    *   Verificar se houve fracionamento indevido de despesas.
2.  **Inspe√ß√£o da Execu√ß√£o do Contrato de Manuten√ß√£o de Ve√≠culos:**
    *   Analisar os relat√≥rios de manuten√ß√£o, verificando os servi√ßos prestados, as pe√ßas substitu√≠das e os custos envolvidos.
    *   Realizar inspe√ß√µes *in loco* nos ve√≠culos e equipamentos para verificar a qualidade da manuten√ß√£o.
    *   Comparar os pre√ßos praticados pela RETIFICADORA DE MOTORES FOZ LTDA com os valores de mercado.
    *   Verificar se a distribui√ß√£o dos servi√ßos entre as secretarias est√° sendo realizada de forma eficiente e transparente.
3.  **An√°lise da Legalidade da Contrata√ß√£o da Banda Falamansa:**
    *   Verificar a justificativa para a antecipa√ß√£o da contrata√ß√£o.
    *   Analisar a compatibilidade do pre√ßo contratado com os valores praticados no mercado.
    *   Garantir a exist√™ncia de cl√°usulas contratuais que protejam o munic√≠pio em caso de cancelamento do evento.
4.  **Verifica√ß√£o da Inexigibilidade na Manuten√ß√£o da Torre de V√≠deo:**
    *   Analisar a documenta√ß√£o que justifica a inexigibilidade, comprovando a exclusividade da MEDICALBLU EQUIPAMENTOS M√âDICOS E HOSPITALARES LTDA.
    *   Comparar o pre√ßo cobrado com os valores praticados no mercado para servi√ßos similares.
5.  **Identifica√ß√£o e An√°lise das Transa√ß√µes Sem Informa√ß√£o:**
    *   Realizar uma investiga√ß√£o completa para identificar a origem e a natureza das transa√ß√µes que n√£o possuem informa√ß√µes.
    *   Verificar a legalidade e a regularidade desses gastos.
6.  **An√°lise dos Processos de Credenciamento:**
    *   Verificar se os processos de credenciamento p√∫blico para educadores art√≠stico-culturais est√£o seguindo os princ√≠pios da legalidade, impessoalidade, moralidade, publicidade e efici√™ncia.
    *   Analisar os crit√©rios de sele√ß√£o e a qualifica√ß√£o dos educadores contratados.

**Conclus√£o:**

A an√°lise preliminar da lista de compras do Munic√≠pio de Foz do Igua√ßu - PR revela diversos pontos de aten√ß√£o que exigem uma fiscaliza√ß√£o mais aprofundada. As recomenda√ß√µes apresentadas visam garantir a correta aplica√ß√£o dos recursos p√∫blicos, a transpar√™ncia dos gastos e a prote√ß√£o do patrim√¥nio municipal.

### Conclus√£o

Criamos um pipeline completo 'End-to-End':
1.  O PDF entra no sistema.
2.  O Gemini estrutura os dados n√£o estruturados.
3.  O Gemini (em outra chamada) atua como auditor e gera intelig√™ncia sobre os dados.