# Fase 4 - Valida√ß√£o Final (O Conselho dos Agentes)

Esta √© a etapa final e mais cr√≠tica do pipeline de extra√ß√£o do SINKT. Aqui, submetemos o grafo densificado a um rigoroso processo de auditoria e saneamento.

**Objetivo:** Transformar o grafo "bruto" em um **Artefato de Conhecimento.

## Arquitetura: A Mesa Redonda Virtual
Em vez de m√∫ltiplos agentes desconexos, simulamos uma **Mesa Redonda** via Prompt Engineering com o **GPT-4o**. Cada aresta √© debatida por 8 personas especializadas:

1.  **Pedagogical Proponent (O Professor):** Defende valor did√°tico.
2.  **Technical Proponent (O Engenheiro):** Defende precis√£o t√©cnica.
3.  **Redundancy Critic (O Otimizador):** Ca√ßa duplicatas.
4.  **Hallucination Hunter (O C√©tico):** Verifica veracidade.
5.  **Structural Architect (O Top√≥logo):** Verifica hierarquias.
6.  **The Ontologist (O Terminologista):** Padroniza termos.
7.  **The Refactorer (O Reparador):** Prop√µe corre√ß√µes em vez de apenas deletar.
8.  **The Judge (O Decisor):** Bate o martelo (KEEP, DISCARD, REFACTOR).

## Pipeline de Processamento
1.  **Carga:** Importar `enhanced_graph.json`.
2.  **Debate:** Processamento em lote das arestas via LLM.
3.  **Refatora√ß√£o:** Aplicar as corre√ß√µes sugeridas pelo 'Refactorer'.
4.  **Cirurgia Topol√≥gica:**
    *   Remo√ß√£o de Ciclos (DAG Enforcement).
    *   Remo√ß√£o de N√≥s √ìrf√£os/Ilhas.
5.  **Entrega:** Gera√ß√£o do `final_sinkt_graph.json` e relat√≥rio de m√©tricas.

In [5]:
!pip install -q langchain langchain-openai networkx pydantic tqdm python-dotenv

import os
import json
import networkx as nx
from typing import List, Literal, Optional
from tqdm import tqdm
from dotenv import load_dotenv
from pydantic import BaseModel, Field

from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import PydanticOutputParser

load_dotenv()

# Configura√ß√£o do Modelo
llm_judge = ChatOpenAI(model="gpt-5.1", temperature=0)

# --- NOVO DIRET√ìRIO DE ENTRADA/SA√çDA ---
INPUT_FOLDER = "output/02_densification"
OUTPUT_FOLDER = "output/03_final_audit"
os.makedirs(OUTPUT_FOLDER, exist_ok=True)

INPUT_FILE = f"{INPUT_FOLDER}/enhanced_graph.json"
FINAL_FILE = f"{OUTPUT_FOLDER}/final_sinkt_graph.json"
DEBATE_LOG = f"{OUTPUT_FOLDER}/debate_log.md"

In [None]:
## 1. Carregamento dos Dados

def load_enhanced_graph():
    if not os.path.exists(INPUT_FILE):
        raise FileNotFoundError(f"Arquivo {INPUT_FILE} n√£o encontrado. Execute o notebook 3 primeiro.")
    
    with open(INPUT_FILE, 'r', encoding='utf-8') as f:
        data = json.load(f)
    return data['concepts'], data['relations']

concepts, relations = load_enhanced_graph()

print(f"Dados Carregados:")
print(f"   Conceitos: {len(concepts)}")
print(f"   Rela√ß√µes para Auditar: {len(relations)}")

üì¶ Dados Carregados:
   Conceitos: 226
   Rela√ß√µes para Auditar: 261


In [7]:
## 2. O Motor de Debate (Prompt Engineering)

class EdgeVerdict(BaseModel):
    source: str
    target: str
    verdict: Literal['KEEP', 'DISCARD', 'REFACTOR']
    new_type: Optional[Literal['PREREQUISITE', 'PART_OF', 'IS_A', 'USE', 'RELATED_TO']] = Field(
        description="Obrigat√≥rio se verdict='REFACTOR'. O tipo de rela√ß√£o corrigido e padronizado."
    )
    direction_correction: Optional[Literal['FORWARD', 'REVERSE']] = Field(
        default='FORWARD', 
        description="Se 'REVERSE', indica que a seta deve ser invertida (Target -> Source)."
    )
    confidence: float = Field(description="N√≠vel de confian√ßa no veredito (0.0 a 1.0).")
    reason: str = Field(description="Resumo executivo do debate. Ex: 'O Top√≥logo vetou pois criava ciclo, o Engenheiro sugeriu invers√£o'.")

class DebateOutput(BaseModel):
    verdicts: List[EdgeVerdict]

# --- CORRE√á√ÉO: Inicializar o parser ---
parser = PydanticOutputParser(pydantic_object=DebateOutput)

debate_system_prompt = """
Voc√™ √© o **SINKT ORACLE**, o autoridade suprema na valida√ß√£o de Grafos de Conhecimento Educacional para Linux.
Sua miss√£o √© sanear o grafo final, garantindo integridade topol√≥gica e pedag√≥gica.

Para CADA rela√ß√£o recebida, voc√™ deve orquestrar um **Debate Virtual R√°pido** entre 8 especialistas. N√£o pule etapas.

### AS 8 PERSONAS DA MESA:

1.  **Professor:** Foca na *Causalidade Pedag√≥gica*. "Aprender A desbloqueia B? Se n√£o, descarte PREREQUISITE."
2.  **Engenheiro:** Foca na *Verdade T√©cnica*. "O comando 'ls' realmente faz parte do 'kernel'? N√£o! Descarte."
3.  **Otimizador:** Ca√ßa *Redund√¢ncias*. "Se A √© parte de B, e B √© parte de C, precisamos de A->C? Talvez n√£o."
4.  **C√©tico:** Ca√ßa *Alucina√ß√µes*. "O conceito 'Linux' √© um 'Comando'? N√£o. REFACTOR para 'Entidade'."
5.  **Top√≥logo (CR√çTICO):** Protege o *DAG*. "Essa rela√ß√£o cria um ciclo? A hierarquia flui do Geral para o Espec√≠fico? Se A depende de B, B n√£o pode depender de A."
6.  **Terminologista:** Padroniza. "Use 'PREREQUISITE' apenas para bloqueios de aprendizado. Use 'USE' para ferramentas."
7.  **Reparador:** Tenta salvar a aresta. "A rela√ß√£o est√° certa mas a dire√ß√£o errada? Inverta! O tipo est√° fraco? Fortale√ßa!"
8.  **JUIZ:** Sintetiza o debate e emite o veredito final com base na maioria qualificada e seguran√ßa t√©cnica.

### REGRAS DE DECIS√ÉO (Guidelines):

* **KEEP:** A rela√ß√£o √© tecnicamente verdadeira, pedagogicamente √∫til e topologicamente segura.
* **REFACTOR:**
    * **Erro de Dire√ß√£o:** Ex: "Shell" PART_OF "Bash" (Errado) -> Inverter para "Bash" IS_A "Shell".
    * **Erro de Tipo:** Ex: "ls" PREREQUISITE "Terminal" (Fraco) -> Mudar para "Terminal" USE "ls" ou vice-versa.
* **DISCARD:**
    * Alucina√ß√µes (fatos falsos).
    * Conex√µes muito gen√©ricas que poluem o grafo (Ex: "Linux" RELATED_TO "Computador").
    * Ciclos √≥bvios em pr√©-requisitos.

### TIPOS CAN√îNICOS PERMITIDOS:
1.  **PREREQUISITE**: Depend√™ncia forte de aprendizado. (N√≥ A deve ser aprendido antes de B).
2.  **PART_OF**: Composi√ß√£o mereol√≥gica. (N√≥ A √© um componente do N√≥ B).
3.  **IS_A**: Taxonomia/Heran√ßa. (N√≥ A √© um tipo espec√≠fico do N√≥ B).
4.  **USE**: Rela√ß√£o funcional. (Ferramenta A utiliza/manipula Recurso B).
5.  **RELATED_TO**: √öltimo caso. Use apenas se houver rela√ß√£o forte mas que n√£o cabe nas acima.

Retorne o JSON estrito com a decis√£o final.
"""
debate_chain = (
    ChatPromptTemplate.from_messages([
        ("system", debate_system_prompt),
        ("user", """Aqui est√° o lote de arestas para julgamento.
        
        Lembre-se: O SINKT depende de um grafo limpo. Na d√∫vida, seja conservador.

        ARESTAS:
        {edges}

        {format_instructions}""")
    ])
    | llm_judge 
    | parser
)

In [8]:
## 3. Execu√ß√£o do Debate em Lote

BATCH_SIZE = 15 # Tamanho do lote para o GPT-4o
validated_edges = []
discarded_count = 0
refactored_count = 0

print(f"Iniciando Sess√£o do Conselho Jedi (GPT-4o)...")

# Preparar dados para o prompt
edge_strings = [f"{r['source']} -> {r.get('type', 'UNKNOWN')} -> {r['target']}" for r in relations]

for i in tqdm(range(0, len(edge_strings), BATCH_SIZE)):
    batch = edge_strings[i:i+BATCH_SIZE]
    
    try:
        result = debate_chain.invoke({
            "edges": "\n".join(batch),
            "format_instructions": PydanticOutputParser(pydantic_object=DebateOutput).get_format_instructions()
        })
        
        for v in result.verdicts:
            if v.verdict == 'DISCARD':
                discarded_count += 1
            else:
                final_type = v.new_type if v.new_type else 'RELATED_TO'
                if v.verdict == 'REFACTOR':
                    refactored_count += 1
                
                validated_edges.append({
                    "source": v.source,
                    "target": v.target,
                    "type": final_type,
                    "reason": v.reason
                })
                
    except Exception as e:
        print(f"‚ùå Erro no batch {i}: {e}")
        # Fallback: Em caso de erro de API, mantemos as arestas originais como RELATED_TO por seguran√ßa
        # ou descartamos. Aqui, vamos logar e pular para n√£o paralisar.
        pass

print("\n=== Resultado do Debate ===")
print(f"Aprovadas: {len(validated_edges)}")
print(f"Descartadas: {discarded_count}")
print(f"Refatoradas: {refactored_count}")

Iniciando Sess√£o do Conselho Jedi (GPT-4o)...


 50%|‚ñà‚ñà‚ñà‚ñà‚ñà     | 9/18 [06:14<06:29, 43.23s/it]

‚ùå Erro no batch 120: Failed to parse DebateOutput from completion {"verdicts": [{"source": "GNU/Linux", "target": "Software Livre", "verdict": "REFACTOR", "new_type": "RELATED_TO", "direction_correction": "FORWARD", "confidence": 0.82, "reason": "Professor: rela√ß√£o conceitual √∫til mas n√£o √© pr√©-requisito. Engenheiro: GNU/Linux √© um sistema operacional e geralmente √© um exemplo emblem√°tico de software livre, mas nem todo software livre √© GNU/Linux, ent√£o n√£o √© IS_A nem PART_OF. Otimizador: evita generaliza√ß√µes excessivas; conex√£o ainda √© pedag√≥gica. C√©tico: n√£o h√° alucina√ß√£o, s√≥ tipo gen√©rico. Top√≥logo: n√£o cria ciclos instrucionais relevantes. Terminologista: tipo correto √© RELATED_TO, n√£o apenas RELATED. Reparador: mant√©m dire√ß√£o, troca tipo. Juiz: REFACTOR para RELATED_TO."}, {"source": "Comando", "target": "Software Livre", "verdict": "DISCARD", "new_type": null, "direction_correction": null, "confidence": 0.9, "reason": "Professor: pouco valor peda

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 18/18 [11:53<00:00, 39.66s/it]


=== Resultado do Debate ===
Aprovadas: 208
Descartadas: 38
Refatoradas: 134





In [None]:
## 4. Constru√ß√£o do Grafo Final

print("\nConstruindo grafo final com todas as arestas validadas...")

# Construir Grafo NetworkX
G = nx.DiGraph()
for c in concepts:
    G.add_node(c['nome'], tipo=c['tipo'], definicao=c['definicao'])

# Adicionar arestas validadas
# Mantemos todas as arestas aprovadas pelo Conselho, sem filtragem topol√≥gica (ciclos/ilhas permitidos)
for r in validated_edges:
    if G.has_node(r['source']) and G.has_node(r['target']):
        G.add_edge(r['source'], r['target'], type=r['type'], reason=r['reason'])

print(f"Grafo constru√≠do com sucesso.")
print(f"N√≥s: {G.number_of_nodes()}")
print(f"Arestas: {G.number_of_edges()}")


üî® Construindo grafo final com todas as arestas validadas...
‚úÖ Grafo constru√≠do com sucesso.
üìä N√≥s: 226
üîó Arestas: 174


In [12]:
## 5. Consolida√ß√£o e Relat√≥rio Final

# Preparar JSON Final
final_concepts = []
for n, attr in G.nodes(data=True):
    final_concepts.append({
        "nome": n,
        "tipo": attr.get('tipo', 'Concept'),
        "definicao": attr.get('definicao', '')
    })

final_relations = []
for u, v, attr in G.edges(data=True):
    final_relations.append({
        "source": u,
        "target": v,
        "type": attr.get('type', 'RELATED_TO'),
        "reason": attr.get('reason', 'Validated by Council')
    })

output_data = {
    "metadata": {
        "pipeline": "SINKT v2 (Extraction -> Densification -> Council Validation)",
        "model": "GPT-4o",
        "nodes": G.number_of_nodes(),
        "edges": G.number_of_edges(),
        "density": nx.density(G)
    },
    "concepts": final_concepts,
    "relations": final_relations
}

with open(FINAL_FILE, 'w', encoding='utf-8') as f:
    json.dump(output_data, f, indent=4, ensure_ascii=False)

print("="*40)
print("RELAT√ìRIO FINAL DO SINKT")
print("="*40)
print(f"Arquivo Salvo: {FINAL_FILE}")
print(f"N√≥s Finais: {G.number_of_nodes()}")
print(f"Arestas Finais: {G.number_of_edges()}")
print(f"Densidade Final: {nx.density(G):.5f}")
print(f"Ciclos Restantes: {len(list(nx.simple_cycles(G)))}")

RELAT√ìRIO FINAL DO SINKT
Arquivo Salvo: output/03_final_audit/final_sinkt_graph.json
N√≥s Finais: 226
Arestas Finais: 174
Densidade Final: 0.00342
Ciclos Restantes: 19
