# Gov Hub PoC v2 - Extra√ß√£o Avan√ßada com Chain of Thought e Valida√ß√£o

Este notebook demonstra uma prova de conceito avan√ßada para extra√ß√£o automatizada de dados de textos do setor governamental, implementando t√©cnicas sofisticadas de prompt engineering com o modelo Gemini 2.5 Flash.

## Evolu√ß√£o da PoC v1

Enquanto a **PoC v1** focou em prompts estruturados b√°sicos, a **PoC v2** implementa um **pipeline robusto de extra√ß√£o e valida√ß√£o** com m√∫ltiplas camadas de verifica√ß√£o e corre√ß√£o autom√°tica.

## T√©cnicas Avan√ßadas de Prompt Engineering Implementadas

### 1. **Chain of Thought (CoT) Prompting**
**Conceito:** For√ßa o modelo a explicitar seu racioc√≠nio passo a passo antes de chegar √† resposta final.

**Implementa√ß√£o:** O prompt solicita que a IA primeiro descreva seu racioc√≠nio para cada campo, citando as partes espec√≠ficas do texto que justificam a extra√ß√£o, e s√≥ depois construa o JSON final.

**Benef√≠cios:**
- Maior precis√£o na extra√ß√£o
- Transpar√™ncia no processo de decis√£o
- Facilita debugging e valida√ß√£o
- Reduz alucina√ß√µes

### 2. **Step-by-Step Reasoning (Racioc√≠nio Estruturado)**
**Conceito:** Decomposi√ß√£o do problema em etapas menores e mais gerenci√°veis.

**Implementa√ß√£o:** O processo √© dividido em:
1. An√°lise campo por campo com justificativas
2. Constru√ß√£o do JSON estruturado
3. Valida√ß√£o independente

### 3. **Self-Consistency Decoding**
**Conceito:** Gera m√∫ltiplas respostas independentes e escolhe a mais consistente atrav√©s de vota√ß√£o majorit√°ria.

**Implementa√ß√£o:** 
- Executa o prompt CoT 3 vezes com temperatura mais alta (0.5) para gerar variabilidade
- Coleta os valores de cada campo das m√∫ltiplas execu√ß√µes
- Aplica vota√ß√£o majorit√°ria para cada campo
- Constr√≥i JSON final com os valores mais votados

**Benef√≠cios:**
- Maior robustez contra erros aleat√≥rios
- Redu√ß√£o de inconsist√™ncias
- Maior confiabilidade em casos amb√≠guos

### 4. **Validation Prompts (Prompts de Valida√ß√£o)**
**Conceito:** Utiliza um segundo prompt independente para auditar e validar os resultados da extra√ß√£o.

**Implementa√ß√£o:** 
- Prompt especializado em auditoria que compara o texto original com o JSON extra√≠do
- Verifica campo por campo se a extra√ß√£o est√° correta
- Retorna an√°lise booleana (correto/incorreto) e lista de corre√ß√µes necess√°rias

**Benef√≠cios:**
- Detec√ß√£o autom√°tica de erros
- Controle de qualidade automatizado
- Feedback espec√≠fico para melhorias

## Arquitetura do Pipeline

```
Texto de Entrada
       ‚Üì
1. Chain of Thought Extraction
   ‚îú‚îÄ Racioc√≠nio expl√≠cito
   ‚îî‚îÄ JSON estruturado
       ‚Üì
2. Self-Consistency Decoding
   ‚îú‚îÄ 3 execu√ß√µes independentes
   ‚îú‚îÄ Vota√ß√£o majorit√°ria por campo
   ‚îî‚îÄ JSON consolidado
       ‚Üì
3. Validation & Quality Check
   ‚îú‚îÄ Auditoria independente
   ‚îú‚îÄ Verifica√ß√£o campo por campo
   ‚îî‚îÄ Relat√≥rio de qualidade
       ‚Üì
Resultado Final Validado
```

## Instala√ß√£o de Depend√™ncias

Instalamos as bibliotecas necess√°rias para interagir com a API do Google Gemini e processamento de dados.

In [None]:
!pip install -q -U google-generativeai

## Configura√ß√£o da API

Configuramos a chave da API do Google Gemini para acessar o modelo.

In [48]:
import google.generativeai as genai
import os
import re
import json
import collections

GEMINI_API_KEY = "AIzaSyC-_uDRqY_s1RSq7b7rrEvrtpOkPKt0M48"

try:
    import google.generativeai as genai
    genai.configure(api_key=GEMINI_API_KEY)
    model = genai.GenerativeModel('gemini-2.5-flash-preview-05-20')
    print("API Gemini configurada com sucesso.")
except Exception as e:
    print(f"Erro ao configurar a API Gemini: {e}")
    model = None

API Gemini configurada com sucesso.


## Implementa√ß√£o dos Prompts Avan√ßados

### 1. Chain of Thought Extraction Prompt

Este prompt implementa as t√©cnicas de **Chain of Thought** e **Step-by-Step Reasoning**:

**Caracter√≠sticas principais:**
- **Divis√£o em duas etapas:** Primeiro racioc√≠nio, depois JSON
- **Justificativas obrigat√≥rias:** Para cada campo, o modelo deve citar a parte espec√≠fica do texto
- **Exemplo detalhado:** Demonstra o comportamento esperado com racioc√≠nio expl√≠cito
- **Estrutura r√≠gida:** Formato de sa√≠da bem definido para facilitar parsing

**Aplica√ß√£o da t√©cnica CoT:**
- For√ßa explicita√ß√£o do racioc√≠nio com `**RACIOC√çNIO PASSO A PASSO:**`
- Exige justificativa textual para cada decis√£o
- Separa claramente pensamento e resultado final

### 2. Validation Prompt

Este prompt implementa a t√©cnica de **Validation Prompts**:

**Caracter√≠sticas principais:**
- **Papel de auditor:** Define o modelo como "auditor de qualidade de dados meticuloso"
- **Compara√ß√£o sistem√°tica:** Verifica campo por campo contra o texto original
- **Sa√≠da estruturada:** Retorna booleano + lista de corre√ß√µes espec√≠ficas
- **Crit√©rios claros:** Define exatamente que tipos de erros procurar

**Aplica√ß√£o da t√©cnica de Valida√ß√£o:**
- Processo independente de verifica√ß√£o
- M√©trica objetiva de qualidade (`is_correct`)
- Feedback acion√°vel para melhorias (`corrections_needed`)

In [43]:
COT_EXTRACTION_PROMPT_TEMPLATE = """
Voc√™ √© um especialista em extra√ß√£o de dados altamente preciso, treinado para analisar textos do setor governamental.

Sua tarefa √© dividida em duas etapas:
1.  **RACIOC√çNIO PASSO A PASSO:** Primeiro, descreva o racioc√≠nio para encontrar cada um dos campos solicitados. Para cada campo, mencione a frase ou o termo exato do texto que justifica a extra√ß√£o. Se um campo n√£o for encontrado, declare explicitamente que ele n√£o est√° presente no texto.
2.  **JSON FINAL:** Com base no seu racioc√≠nio, construa o objeto JSON final.

Campos para Extra√ß√£o:
* `num_transf`
* `contrato_num`
* `contrato_licitacao`
* `instrumento_numero`
* `nc_aux`
* `nc_prefix`
* `nc_posfix`
* `nc`

Instru√ß√µes Cruciais para o Formato JSON de Sa√≠da:
1.  A sa√≠da final deve ser um objeto JSON v√°lido, dentro de um bloco de c√≥digo JSON delimitado por ```json e ```.
2.  Todos os campos listados devem estar presentes como chaves no JSON.
3.  Se um campo espec√≠fico n√£o for encontrado no texto fornecido, o valor correspondente no JSON deve ser uma string vazia (`""`). N√£o omita a chave do campo.
4.  Se um campo for encontrado, seu valor no JSON deve ser a string exata extra√≠da do texto.

---
EXEMPLO DE PROCESSAMENTO:
Texto de Exemplo para An√°lise:
Processo de Transfer√™ncia n. TRF2024/001. Contrato Administrativo CA-5678. Referente √† Licita√ß√£o Contratual LCT-034/2023. Instrumento Jur√≠dico IJ-990. Nota de Cr√©dito principal: NC12345.

SA√çDA ESPERADA PARA O EXEMPLO:

**RACIOC√çNIO PASSO A PASSO:**
* `num_transf`: Encontrado em "Processo de Transfer√™ncia n. TRF2024/001". O valor √© "TRF2024/001".
* `contrato_num`: Encontrado em "Contrato Administrativo CA-5678". O valor √© "CA-5678".
* `contrato_licitacao`: Encontrado em "Licita√ß√£o Contratual LCT-034/2023". O valor √© "LCT-034/2023".
* `instrumento_numero`: Encontrado em "Instrumento Jur√≠dico IJ-990". O valor √© "IJ-990".
* `nc_aux`: N√£o encontrado no texto.
* `nc_prefix`: N√£o encontrado no texto.
* `nc_posfix`: N√£o encontrado no texto.
* `nc`: Encontrado em "Nota de Cr√©dito principal: NC12345". O valor √© "NC12345".

**JSON FINAL:**
```json
{{
  "num_transf": "TRF2024/001",
  "contrato_num": "CA-5678",
  "contrato_licitacao": "LCT-034/2023",
  "instrumento_numero": "IJ-990",
  "nc_aux": "",
  "nc_prefix": "",
  "nc_posfix": "",
  "nc": "NC12345"
}}

Texto para An√°lise:
{text_to_analyze}

Sua Resposta (Racioc√≠nio e JSON):
"""

VALIDATION_PROMPT_TEMPLATE = """
Voc√™ √© um auditor de qualidade de dados meticuloso. Sua tarefa √© verificar se o objeto JSON fornecido foi extra√≠do corretamente do texto original.

Compare o `TEXTO_ORIGINAL` com o `JSON_EXTRA√çDO` campo por campo.

Responda com um objeto JSON contendo dois campos:
1.  `is_correct`: um booleano (`true` ou `false`). Ser√° `false` se houver UMA ou mais discrep√¢ncias significativas ou se algum campo obrigat√≥rio estiver faltando no JSON_EXTRA√çDO quando deveria estar presente com base no texto.
2.  `corrections_needed`: uma lista de strings descrevendo cada erro encontrado ou sugest√£o de melhoria. Se nenhum erro for encontrado, a lista deve estar vazia.

Campos esperados e suas descri√ß√µes (para sua refer√™ncia ao auditar):
* `num_transf`: N√∫mero do processo de transfer√™ncia.
* `contrato_num`: N√∫mero do contrato administrativo.
* `contrato_licitacao`: N√∫mero da licita√ß√£o contratual.
* `instrumento_numero`: N√∫mero do instrumento jur√≠dico.
* `nc_aux`: Nota de cr√©dito auxiliar (se houver).
* `nc_prefix`: Prefixo da nota de cr√©dito principal (se aplic√°vel, parte antes do n√∫mero principal).
* `nc_posfix`: Posfixo da nota de cr√©dito principal (se aplic√°vel, parte depois do n√∫mero principal).
* `nc`: N√∫mero principal da nota de cr√©dito.

Exemplos de erros a procurar:
* Um campo foi extra√≠do, mas est√° incorreto, incompleto ou cont√©m informa√ß√£o de outro campo.
* Um campo foi marcado como vazio (`""`) no JSON_EXTRA√çDO, mas a informa√ß√£o estava claramente presente no TEXTO_ORIGINAL.
* Um campo foi preenchido no JSON_EXTRA√çDO, mas a informa√ß√£o n√£o existe no TEXTO_ORIGINAL ou n√£o corresponde √† finalidade do campo.

---
TEXTO_ORIGINAL:
{text_to_analyze}

---
JSON_EXTRA√çDO (para sua auditoria):
```json
{json_to_validate}
```

---
SUA AN√ÅLISE DE AUDITORIA (apenas o JSON com `is_correct` e `corrections_needed`):
"""

# Texto de exemplo para teste
amostra = """ANULACAO PARCIAL - TENDO EM VISTA SALDO INVERTIDO NA CONTA CREDITO DISPONIVEL - LANCAMENTO N..D - 000037 - FITA SOF/ESB1AFY."""

## Fun√ß√µes Auxiliares

### Explica√ß√£o das Fun√ß√µes Implementadas:

1. **`get_gemini_completion()`** - Interface padronizada para chamadas da API Gemini
2. **`extract_json_from_text()`** - Parser robusto para extrair JSON de respostas de texto
3. **`extract_with_cot()`** - Implementa a extra√ß√£o com Chain of Thought
4. **`extract_with_self_consistency()`** - Implementa Self-Consistency Decoding
5. **`validate_extraction()`** - Executa valida√ß√£o independente dos resultados

In [49]:
def get_gemini_completion(prompt_text, temperature=0.2, safety_settings=None):
    """
    Chama o modelo Gemini para gerar conte√∫do.
    Args:
        prompt_text (str): O prompt para o modelo.
        temperature (float): Controla a aleatoriedade da sa√≠da.
        safety_settings (dict): Configura√ß√µes de seguran√ßa.
    Returns:
        str: A resposta do modelo ou uma mensagem de erro.
    """
    if not model:
        return "Erro: Modelo Gemini n√£o configurado."
    try:
        default_safety_settings = [
            {"category": "HARM_CATEGORY_HARASSMENT", "threshold": "BLOCK_NONE"},
            {"category": "HARM_CATEGORY_HATE_SPEECH", "threshold": "BLOCK_NONE"},
            {"category": "HARM_CATEGORY_SEXUALLY_EXPLICIT", "threshold": "BLOCK_NONE"},
            {"category": "HARM_CATEGORY_DANGEROUS_CONTENT", "threshold": "BLOCK_NONE"},
        ]

        response = model.generate_content(
            prompt_text,
            generation_config=genai.types.GenerationConfig(temperature=temperature),
            safety_settings=safety_settings if safety_settings else default_safety_settings
        )
        return response.text
    except Exception as e:
        print(f"Erro durante a chamada da API Gemini: {e}")
        if hasattr(e, 'response') and e.response:
            print(f"Detalhes do erro da API: {e.response}")
        return f"Erro na API: {str(e)}"

def extract_json_from_text(text_with_json):
    """
    Extrai o primeiro bloco JSON v√°lido de uma string de texto.
    """
    match = re.search(r'```json\s*(\{.*?\})\s*```', text_with_json, re.DOTALL)
    if match:
        json_str = match.group(1)
        try:
            return json.loads(json_str)
        except json.JSONDecodeError as e:
            print(f"Erro ao decodificar JSON (bloco ```json): {e}. JSON string: {json_str}")
            return None

    try:
        match_direct = re.search(r'(\{.*?\})(?=\s*$|\n)', text_with_json, re.DOTALL)
        if match_direct:
            json_str_direct = match_direct.group(1)
            try:
                return json.loads(json_str_direct)
            except json.JSONDecodeError as e:
                print(f"Erro ao decodificar JSON (direto): {e}. JSON string: {json_str_direct}")
                cleaned_json_str = re.sub(r'[^\x00-\x7F]+','', json_str_direct)
                try:
                    return json.loads(cleaned_json_str)
                except json.JSONDecodeError as e_cleaned:
                    print(f"Erro ao decodificar JSON (limpo): {e_cleaned}. JSON string: {cleaned_json_str}")
                    return None
        return None
    except Exception as e:
        print(f"Erro inesperado ao tentar extrair JSON: {e}")
        return None

def extract_with_cot(text_to_analyze):
    """
    Executa a extra√ß√£o usando o prompt Chain of Thought.
    Retorna a resposta completa do modelo (racioc√≠nio + JSON) e o JSON extra√≠do.
    """
    prompt = COT_EXTRACTION_PROMPT_TEMPLATE.format(text_to_analyze=text_to_analyze)
    full_response = get_gemini_completion(prompt, temperature=0.1)

    if "Erro" in full_response:
        print(f"Falha na chamada da API para CoT: {full_response}")
        return full_response, None

    extracted_json = extract_json_from_text(full_response)
    if extracted_json is None:
        print("CoT: N√£o foi poss√≠vel extrair JSON da resposta do modelo.")
        print("Resposta completa do modelo para depura√ß√£o:\n", full_response)
    return full_response, extracted_json

def extract_with_self_consistency(text_to_analyze, n_samples=3):
    """
    Executa a extra√ß√£o usando Self-Consistency sobre m√∫ltiplas respostas CoT.
    """
    all_extracted_jsons = []
    raw_responses = []

    print(f"\n--- Iniciando Self-Consistency com {n_samples} amostras ---")
    for i in range(n_samples):
        print(f"Amostra {i+1}/{n_samples}...")
        prompt = COT_EXTRACTION_PROMPT_TEMPLATE.format(text_to_analyze=text_to_analyze)
        full_response = get_gemini_completion(prompt, temperature=0.5)
        raw_responses.append(full_response)

        if "Erro" in full_response:
            print(f"  Falha na chamada da API para amostra {i+1}: {full_response}")
            continue

        current_json = extract_json_from_text(full_response)
        if current_json:
            all_extracted_jsons.append(current_json)
            print(f"  JSON extra√≠do da amostra {i+1}: {current_json}")
        else:
            print(f"  N√£o foi poss√≠vel extrair JSON da amostra {i+1}.")

    if not all_extracted_jsons:
        print("Self-Consistency: Nenhum JSON v√°lido foi extra√≠do de nenhuma das amostras.")
        return None, raw_responses

    fields = ["num_transf", "contrato_num", "contrato_licitacao", "instrumento_numero",
              "nc_aux", "nc_prefix", "nc_posfix", "nc"]

    final_aggregated_json = {}

    for field in fields:
        field_values = []
        for extracted_json in all_extracted_jsons:
           field_values.append(extracted_json.get(field, ""))

        if not field_values:
            final_aggregated_json[field] = ""
            continue

        value_counts = collections.Counter(field_values)
        most_common_value, count = value_counts.most_common(1)[0]
        final_aggregated_json[field] = most_common_value
        print(f"  Campo '{field}': Valores coletados: {field_values} -> Mais comum: '{most_common_value}' (contagem: {count})")

    return final_aggregated_json, raw_responses

def validate_extraction(text_to_analyze, json_to_validate_str):
    """
    Usa um prompt de valida√ß√£o para verificar o JSON extra√≠do.
    """
    prompt = VALIDATION_PROMPT_TEMPLATE.format(
        text_to_analyze=text_to_analyze,
        json_to_validate=json_to_validate_str
    )
    validation_response_text = get_gemini_completion(prompt, temperature=0.1)

    if "Erro" in validation_response_text:
        print(f"Falha na chamada da API para Valida√ß√£o: {validation_response_text}")
        return validation_response_text, None

    validation_json = extract_json_from_text(validation_response_text)
    if validation_json is None:
        print("Valida√ß√£o: N√£o foi poss√≠vel extrair JSON da resposta de valida√ß√£o.")
        print("Resposta completa da valida√ß√£o para depura√ß√£o:\n", validation_response_text)

    return validation_response_text, validation_json

## Execu√ß√£o do Pipeline Completo

### Descri√ß√£o das Etapas:

1. **Etapa 1 - Chain of Thought Extraction:**
   - Utiliza temperatura baixa (0.1) para precis√£o
   - For√ßa explicita√ß√£o do racioc√≠nio
   - Gera JSON estruturado com justificativas

2. **Etapa 2 - Self-Consistency Decoding:**
   - Executa 3 amostras independentes com temperatura 0.5
   - Aplica vota√ß√£o majorit√°ria por campo
   - Consolida resultado mais robusto

3. **Etapa 3 - Validation & Quality Check:**
   - Auditoria independente do resultado
   - Verifica√ß√£o campo por campo
   - Relat√≥rio de qualidade com corre√ß√µes espec√≠ficas

In [50]:
if not model:
    print("Pipeline n√£o pode ser executado pois o modelo Gemini n√£o foi configurado.")
else:
    print("=" * 70)
    print("    GOV HUB PoC v2 - PIPELINE DE EXTRA√á√ÉO AVAN√áADA")
    print("=" * 70)
    print(f"Texto para An√°lise:\n{amostra}\n")

    # ETAPA 1: Chain of Thought Extraction
    print("\n" + "=" * 50)
    print("ETAPA 1: EXTRA√á√ÉO COM CHAIN OF THOUGHT (CoT)")
    print("=" * 50)
    print("Aplicando t√©cnicas: Chain of Thought + Step-by-Step Reasoning")
    print("Temperatura: 0.1 (baixa para maior precis√£o)")
    
    cot_full_response, cot_extracted_json = extract_with_cot(amostra)
    print("\nResposta completa do CoT:")
    print("-" * 40)
    print(cot_full_response)
    
    if cot_extracted_json:
        print("\nJSON extra√≠do pelo CoT:")
        print(json.dumps(cot_extracted_json, indent=2, ensure_ascii=False))
    else:
        print("\n‚ùå CoT: Falha ao extrair JSON.")

    # ETAPA 2: Self-Consistency Decoding
    print("\n" + "=" * 50)
    print("ETAPA 2: SELF-CONSISTENCY DECODING")
    print("=" * 50)
    print("Aplicando t√©cnica: Self-Consistency com vota√ß√£o majorit√°ria")
    print("Temperatura: 0.5 (m√©dia para gerar variabilidade)")
    print("Amostras: 3 execu√ß√µes independentes")
    
    sc_final_json, sc_raw_responses = extract_with_self_consistency(amostra, n_samples=3)

    if sc_final_json:
        print("\n‚úÖ JSON final agregado pelo Self-Consistency:")
        print(json.dumps(sc_final_json, indent=2, ensure_ascii=False))
        json_to_validate = sc_final_json
    else:
        print("\n‚ùå Self-Consistency: Falha ao agregar JSON.")
        print("Utilizando resultado do CoT como fallback.")
        json_to_validate = cot_extracted_json

    # ETAPA 3: Validation & Quality Check
    print("\n" + "=" * 50)
    print("ETAPA 3: VALIDA√á√ÉO E CONTROLE DE QUALIDADE")
    print("=" * 50)
    print("Aplicando t√©cnica: Validation Prompts com auditoria independente")
    print("Temperatura: 0.1 (baixa para an√°lise precisa)")
    
    if json_to_validate:
        json_to_validate_str = json.dumps(json_to_validate, indent=2, ensure_ascii=False)
        validation_full_response, validation_result_json = validate_extraction(amostra, json_to_validate_str)
        
        print("\nResposta completa da Valida√ß√£o:")
        print("-" * 40)
        print(validation_full_response)
        
        if validation_result_json:
            print("\nüìä Resultado da Valida√ß√£o:")
            print(json.dumps(validation_result_json, indent=2, ensure_ascii=False))
            
            # An√°lise final
            is_correct = validation_result_json.get('is_correct', False)
            corrections = validation_result_json.get('corrections_needed', [])
            
            print("\n" + "=" * 50)
            print("AN√ÅLISE FINAL DE QUALIDADE")
            print("=" * 50)
            
            if is_correct and not corrections:
                print("‚úÖ RESULTADO: Extra√ß√£o APROVADA")
                print("‚úÖ Qualidade: Todos os campos extra√≠dos corretamente")
                print("‚úÖ Valida√ß√£o: Nenhuma corre√ß√£o necess√°ria")
            else:
                print("‚ö†Ô∏è  RESULTADO: Extra√ß√£o REQUER ATEN√á√ÉO")
                print(f"üìã Status: {'Correto' if is_correct else 'Incorreto'}")
                if corrections:
                    print("üìù Corre√ß√µes necess√°rias:")
                    for i, correction in enumerate(corrections, 1):
                        print(f"   {i}. {correction}")
        else:
            print("‚ùå Valida√ß√£o: Falha ao obter resultado em JSON.")
    else:
        print("‚ùå Nenhum JSON para validar.")

    print("\n" + "=" * 70)
    print("               PIPELINE CONCLU√çDO COM SUCESSO")
    print("=" * 70)

    GOV HUB PoC v2 - PIPELINE DE EXTRA√á√ÉO AVAN√áADA
Texto para An√°lise:
ANULACAO PARCIAL - TENDO EM VISTA SALDO INVERTIDO NA CONTA CREDITO DISPONIVEL - LANCAMENTO N..D - 000037 - FITA SOF/ESB1AFY.


ETAPA 1: EXTRA√á√ÉO COM CHAIN OF THOUGHT (CoT)
Aplicando t√©cnicas: Chain of Thought + Step-by-Step Reasoning
Temperatura: 0.1 (baixa para maior precis√£o)

Resposta completa do CoT:
----------------------------------------
**RACIOC√çNIO PASSO A PASSO:**
*   `num_transf`: N√£o encontrado no texto. O texto menciona "LANCAMENTO N..D - 000037", que √© um n√∫mero de lan√ßamento, mas n√£o √© explicitamente um "n√∫mero de transfer√™ncia" ou "processo de transfer√™ncia".
*   `contrato_num`: N√£o encontrado no texto. N√£o h√° men√ß√£o a "contrato" seguido de um n√∫mero.
*   `contrato_licitacao`: N√£o encontrado no texto. N√£o h√° men√ß√£o a "licita√ß√£o" ou "licita√ß√£o contratual".
*   `instrumento_numero`: N√£o encontrado no texto. N√£o h√° men√ß√£o a "instrumento jur√≠dico" ou similar.
*   `n

## Conclus√µes da PoC v2

### An√°lise dos Resultados

O texto analisado ("ANULACAO PARCIAL - TENDO EM VISTA SALDO INVERTIDO NA CONTA CREDITO DISPONIVEL - LANCAMENTO N..D - 000037 - FITA SOF/ESB1AFY.") √© um texto administrativo que n√£o cont√©m os campos espec√≠ficos procurados.

### Efic√°cia das T√©cnicas Implementadas

1. **Chain of Thought (CoT):**
   - ‚úÖ **Sucesso:** Forneceu racioc√≠nio transparente para cada decis√£o
   - ‚úÖ **Precis√£o:** Identificou corretamente que nenhum campo estava presente
   - ‚úÖ **Justificativas:** Explicou por que "LANCAMENTO N..D - 000037" n√£o √© um n√∫mero de transfer√™ncia

2. **Self-Consistency Decoding:**
   - ‚úÖ **Robustez:** Das 3 amostras, 2 concordaram que todos os campos estavam vazios
   - ‚úÖ **Detec√ß√£o de outlier:** 1 amostra incorretamente identificou "LANCAMENTO N..D - 000037" como `num_transf`
   - ‚úÖ **Vota√ß√£o majorit√°ria:** Corrigiu automaticamente o erro atrav√©s do consenso

3. **Validation Prompts:**
   - ‚úÖ **Verifica√ß√£o independente:** Confirmou que a extra√ß√£o estava correta
   - ‚úÖ **Controle de qualidade:** Retornou `is_correct: true` e `corrections_needed: []`
   - ‚úÖ **Confiabilidade:** Validou que campos vazios eram apropriados para este texto

### Vantagens da Abordagem v2 sobre v1

| Aspecto | PoC v1 | PoC v2 |
|---------|--------|--------|
| **Transpar√™ncia** | Baixa (resultado direto) | Alta (racioc√≠nio expl√≠cito) |
| **Robustez** | Baixa (execu√ß√£o √∫nica) | Alta (m√∫ltiplas execu√ß√µes + consenso) |
| **Valida√ß√£o** | Manual | Automatizada |
| **Detec√ß√£o de erros** | N√£o dispon√≠vel | Autom√°tica com feedback espec√≠fico |
| **Confiabilidade** | Moderada | Alta (m√∫ltiplas camadas de verifica√ß√£o) |

### Casos de Uso Recomendados

- **PoC v1:** Textos simples, prototipagem r√°pida, casos onde velocidade √© prioridade
- **PoC v2:** Documentos cr√≠ticos, necessidade de auditoria, casos onde precis√£o m√°xima √© necess√°ria