# TIEnc

<div>
<img src="imgs/new_rotated.jpg" alt="Description" style="display: block; margin: 20px auto; width: 80%;" />
</div>

<!-- --- -->

| Generator | Validator | Status | Nodes | Chapters | Concepts | Relations | Prereqs | Part-Of | Defs | Props | Orphans | AvgRel/Node |
| --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- |
| claude-opus-4-5 | gpt5-1 | ✅ OK | 450 | 104 | 346 | 1395 | 71 | 632 | 30 | 143 | 0 | 3.1 |
| claude-opus-4-5 | claude-opus-4-5 | ✅ OK | 460 | 104 | 356 | 1432 | 69 | 600 | 26 | 198 | 0 | 3.11 |
| gpt5-1 | gpt5-1 | ✅ OK | 459 | 104 | 355 | 1726 | 119 | 536 | 209 | 242 | 0 | 3.76 |
| gpt5-1 | claude-opus-4-5 | ✅ OK | 423 | 104 | 319 | 1601 | 137 | 490 | 117 | 249 | 0 | 3.78 |


**Estruturas & Modelos**

In [3]:
from enum import Enum
from langchain.chat_models import init_chat_model, BaseChatModel

class LLM_MODELS(str, Enum):
    gpt4_o = "openai:gpt-4o"
    gpt5_1 = "openai:gpt-5.1"
    claude4_5 = "anthropic:claude-opus-4-5"

def get_llm(model_name: LLM_MODELS) -> BaseChatModel:
    return init_chat_model(model_name.value)

In [57]:
from pydantic import BaseModel, Field
from typing import List, Optional, Literal

class Concept(BaseModel):
    """Represents a single educational concept found in the text."""
    concept_name: str = Field(description="The formal name of the concept (e.g., 'Inductive Logic', 'Backpropagation').")
    chapter: List[int] = Field(description="The number of the current chapter, subchapter, etc (e.g., [1] for chapter 1, [1, 2] for subchapter 1.2, [1,2,5] for subsubchapter 1.2.5)")
    description: str = Field(description="A concise definition or summary of the concept based on the text.")
    page_start: int = Field(description="The page number where this concept is first introduced.")
    # page_end: Optional[int] = Field(default=None, description="The page number where the discussion of this concept seems to end (or current page if ongoing).")
    # is_main_chapter: bool = Field(default=False, description="True if this is a chapter or main topic, False if it is a subchapter or subtopic.")

class PageExtraction(BaseModel):
    """Container for multiple concepts found on a specific page processing step."""
    concepts: List[Concept] = Field(description="List of concepts extracted from the current text window.")
    
class Relation(BaseModel):
    source: str = Field(description="The subject concept.")
    target: str = Field(description="The object concept.")
    # relation_type: Literal['prerequisite', 'including', 'part-of', 'property', 'definition']
    relation_type: Literal['prerequisite']
    context: Optional[str] = Field(description="Justification text.")

class ConceptAnalysis(BaseModel):
    """LLM Output for a full chapter/concept file."""
    # Map 'new_concepts' to add to registry
    # new_concepts: List[str] = Field(description="List of MAIN concepts defined in this text.")
    relations: List[Relation] = Field(description="Semantic connections found.")
    
class ValidationResult(BaseModel):
    valid_relations: List[Relation] = Field(description="The filtered list of strictly valid educational relations.")
    rejected_relations: List[Relation] = Field(description="List of relations that were removed.")

## Extração de dados

O SINKT já considera um dataset pronto para uso. Sendo assim essa seção busca extrair os conceitos de um ebook PDF. Primeiramente iremos transformar em Markdown, visto que é melhor utilizar texto puro ao invés de páginas de PDF. Além disso, essa proposta facilita a própria extração para o MAIC, posteriormente.

In [58]:
import unicodedata
import re
import xml.etree.ElementTree as ET
from xml.dom import minidom

def normalize_filename(s: str) -> str:
    """Remove accents, replace underscores and remove non-alphanumeric characters."""
    s = unicodedata.normalize('NFKD', s)
    s = ''.join(c for c in s if not unicodedata.combining(c))
    s = re.sub(r'\s+', '_', s)
    s = re.sub(r'[^\w_]', '', s)
    return s.lower()

def prettify_xml(elem: ET.Element) -> str:
    """
    Return a pretty-printed XML string for the Element.
    Strips the annoying extra newlines minidom likes to add.
    
    :param elem: Element (``ET.Element``)
    """
    rough_string = ET.tostring(elem, 'utf-8')
    reparsed = minidom.parseString(rough_string)
    # Filter out lines that are purely whitespace
    return '\n'.join([line for line in reparsed.toprettyxml(indent="   ").split('\n') if line.strip()])

Configuração inicial.

In [6]:
from dotenv import load_dotenv
import os
from pathlib import Path

load_dotenv("../.env")

assert os.getenv("OPENAI_API_KEY"), "OPENAI_API_KEY not found"
assert os.getenv("ANTHROPIC_API_KEY"), "ANTHROPIC_API_KEY not found"

BOOK_NAME = 'LinuxFundamentals'
EBOOKS_PATH = Path('ebooks')
base_output_dir = EBOOKS_PATH / BOOK_NAME
os.makedirs(base_output_dir, exist_ok=True)

PDF_PATH = Path('../data/701-LinuxFundamentals_material_full_v14.pdf')

Primeiramente é criada a classe de conversão do PDF para markdown, utiliza-se da biblioteca Docling para realizar a conversão. Essa biblioteca permite extrair as imagens e tabelas do texto, posteriormente elas são incluídas no markdown final além de serem salvas juntas.

In [7]:
import os
from PyPDF2 import PdfReader

from docling.document_converter import DocumentConverter
import logging
from docling.datamodel.accelerator_options import AcceleratorDevice, AcceleratorOptions
from docling.datamodel.base_models import InputFormat, OutputFormat
from docling.datamodel.pipeline_options import (
    PdfPipelineOptions
    )
from docling.document_converter import DocumentConverter, PdfFormatOption, MarkdownFormatOption
from docling_core.types.doc import ImageRefMode, PictureItem, TableItem, DoclingDocument
from tqdm.notebook import tqdm_notebook

class PDFConversor():
    """
    Convert PDF to markdown.
    
    :param pdf_path: Path of the input pdf.
    :param output_dir: Path of the output.
    """
    def __init__(self, pdf_path: Path, output_dir: Path):
        self.input_doc_path: Path = pdf_path
        self.base_output_dir: Path = output_dir
        self.pipeline_options: PdfPipelineOptions = self._set_pipeline_options()
        self.document_converter: DocumentConverter = DocumentConverter(
            format_options={
                InputFormat.PDF: PdfFormatOption(pipeline_options=self.pipeline_options),
                OutputFormat.MARKDOWN: MarkdownFormatOption(image_mode=ImageRefMode.REFERENCED)
            },
        )
        self.last_page: int = self._get_no_pages()
        self.doc = None
       
    def _set_pipeline_options(self) -> PdfPipelineOptions:
        IMAGE_SCALE = 2.0
        
        pipeline_options = PdfPipelineOptions()
        pipeline_options.generate_picture_images = True
        pipeline_options.generate_page_images = True
        pipeline_options.images_scale = IMAGE_SCALE
        pipeline_options.do_ocr = False
        pipeline_options.do_table_structure = True
        pipeline_options.table_structure_options.do_cell_matching = True
        pipeline_options.ocr_options.lang = ["pt"]
        pipeline_options.accelerator_options = AcceleratorOptions(
            num_threads=4, device=AcceleratorDevice.CUDA
        )
        return pipeline_options

    
    def _get_no_pages(self) -> int:
        reader = PdfReader(self.input_doc_path)
        return len(reader.pages)
    
    def _replace_image_placeholders(selg, md_str: str, image_files: List[Path]) -> None:
        content = md_str
        for img in image_files:
            content = content.replace("<!-- image -->", f"![]({str(img).split('/')[-1]})", 1)
        return content
        
    def save_images(self, doc: DoclingDocument, output_dir: Path) -> List[str]:
        filenames = []
        for page in doc.pictures:
            # print(page)
            page_no = page.self_ref.split('/')[-1]
            page_image_filename = output_dir / f"{page_no}.png"
            print(page_image_filename)
            with page_image_filename.open("wb") as fp:
                page.image.pil_image.save(fp, format="PNG")
            filenames.append(page_image_filename.relative_to(self.base_output_dir))
        return filenames 
    
    def generate_markdown(self, concepts: List[Concept]) -> None:
        """
        Generate a folder for each concept, with the images captured and a ``document.md`` file.
        
        :param concepts: ``List[Concept]`` List of concepts, their pages must in crescent order and sequentially
        (e.g. Chapter 1, 2, 3...).
        """
        for idx in tqdm_notebook(range(len(concepts))):
            curr_chap: Concept = concepts[idx]
            init_page = curr_chap.page_start
            chap_name = normalize_filename(curr_chap.concept_name)

            output_concept_dir = self.base_output_dir / chap_name
            os.makedirs(output_concept_dir, exist_ok=True)
            
            next_page = self.last_page + 1 if idx == len(concepts) - 1 else concepts[idx + 1].page_start - 1

            doc = self.document_converter.convert(self.input_doc_path, page_range=[init_page, next_page]).document
            md_str = doc.export_to_markdown()

            img_filenames = self.save_images(doc, output_concept_dir)
            raw_markdown = self._replace_image_placeholders(md_str, img_filenames)

            with open(output_concept_dir / "document.md", "w") as f:
                f.write(raw_markdown)

``EBookExtractor`` é a classe principal, encapsulando a classe criada anteriormente e servindo como uma interface de mais alto nível.

In [8]:
from langchain_community.document_loaders import PyMuPDFLoader
from langchain_core.documents.base import Document
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI

class EbookExtractor():
    """
    Extract data from an ebook.
    
    :param pdf_file_path: The path of the desired pdf book.
    :param base_output_dir: Directory where the book is going to be saved.
    """
    def __init__(self, pdf_file_path: Path, base_output_dir: Path, llm: BaseChatModel):
        self.pages: List[Document] = None
        self.llm = llm
        self.pdf_conversor: PDFConversor = PDFConversor(pdf_file_path, base_output_dir)
        self.file_path: Path = pdf_file_path
        self._load_pdf_pages()
    
    def _load_pdf_pages(self) -> None:
        """Loads PDF and returns a list of Document objects (one per page)."""
        print(f"Loading PDF: {self.file_path}...")
        loader = PyMuPDFLoader(self.file_path)
        pages = loader.load()
        last_page = len(pages)
        print(f"Loaded {len(pages)} pages.")
        self.pages = pages
        
    
    def extract_toc_structure(self, end_toc_page = 5) -> PageExtraction:
        """
        Scans the first ``end_toc_page`` pages to find a Table of Contents or Summary.
        Returns a list of 'known concepts' to prime the main extractor.

        :param end_toc_page: The first pages where the summary appears. Default to 5.
        """
        print(f"Scouting Table of Contents (Pages 1-{end_toc_page})...")
        
        # Combine first pages (or fewer if small doc)
        limit = min(len(self.pages), end_toc_page)
        toc_text = "\n".join([p.page_content for p in self.pages[:limit]])
        
        # Simple chain for ToC extraction
        prompt = ChatPromptTemplate.from_messages([
            ("system", "You are an expert content analyzer. Look at the beginning of this book."),
            ("human", """Identify the Table of Contents. 
            Extract ALL chapters, sections, and sub-sections (e.g., 1.1, 1.2.1, 1.2.2) as individual Concepts.
            Do NOT summarize or skip detailed sub-topics. Capture the full hierarchy. Do NOT include chapter number on
            concept_name.
            
            Text:
            {text}""")
        ])
        
        # We reuse the PageExtraction model, though we only care about names/start pages here
        chain = prompt | self.llm.with_structured_output(PageExtraction)
    
        try:
            result = chain.invoke({"text": toc_text})
            print(f"ToC Analysis found {len(result.concepts)} potential concepts.")
            return result.concepts
        except Exception as e:
            print(f"Could not extract ToC (might be missing or unstructured). Proceeding with empty seed. Error: {e}")
            return []
    

Executando o pipeline de extração.

In [9]:
llm = get_llm(LLM_MODELS.gpt5_1)
extractor = EbookExtractor(PDF_PATH, base_output_dir, llm)
toc_concepts = extractor.extract_toc_structure(end_toc_page=5)

Loading PDF: ../data/701-LinuxFundamentals_material_full_v14.pdf...
Loaded 127 pages.
Scouting Table of Contents (Pages 1-5)...


2025-12-10 14:04:42,068 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


ToC Analysis found 104 potential concepts.


Filtrando apenas os capítulos, assim podemos gerar uma pasta para cada, contendo arquivo markdown e imagens.

In [10]:
chapters = []
for c in toc_concepts:
    if len(c.chapter) == 1:
        chapters.append(c)
        print(c.chapter, c.concept_name, c.page_start)

[1] Introdução ao Linux 6
[2] Certificações Linux 13
[3] História do Linux 16
[4] Licenças Open Source 20
[5] Evolução do Linux: distribuições 23
[6] Conhecendo o Linux 34
[7] Tópicos para revisão do capítulo 41
[8] Estrutura do sistema operacional 43
[9] O que é um Shell 52
[10] Variáveis 55
[11] Arquivos de configuração do shell 62
[12] Caminhos de Diretorios 68
[13] Tópicos para revisão do capítulo 74
[14] Como obter ajuda 76
[15] Formas de documentação 77
[16] Comando help 79
[17] Comando apropos 81
[18] Comando whatis 84
[19] Comando man 86
[20] Comando info 89
[21] Comando whereis 91
[22] Comando which 94
[23] FHS, Hierarquia dos Diretórios 96
[24] Aprendendo Comandos do GNU/Linux 110
[25] Localização no sistema 120
[26] Tópicos para revisão do capítulo 127


In [11]:
# extractor.pdf_conversor.generate_markdown(chapters)

# Gerando grafos

In [12]:
ROOT_DIRECTORY = base_output_dir
NODES_XML = ROOT_DIRECTORY / 'nodes.xml'
RELATIONS_XML = ROOT_DIRECTORY / 'relations.xml'

In [13]:
class GlobalRegistry:
    def __init__(self):
        # Stores simple strings: {"Binary Notation", "Kernel", "File Permissions"}
        self.known_concepts = set()

    def add_concepts(self, concepts: List[str]):
        for c in concepts:
            self.known_concepts.add(c)
    
    def get_context_string(self):
        """Returns a comma-separated string of known concepts for the prompt."""
        return ", ".join(sorted(list(self.known_concepts)))

In [69]:
from typing import List
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from langchain.chat_models import init_chat_model
 
class ConceptValidatorAgent:
    """
    A specialized agent that filters lists of relations based on strict 
    Knowledge Graph quality criteria.
    """
    def __init__(self, llm: BaseChatModel):
        self.received_count = 0
        self.rejected_count = 0
        self.valid_count = 0
        self.llm = llm

    def validate(self, relations: List[Relation]) -> List[Relation]:
        """
        Filters the list of relations.
        
        :param relations: List of candidate relations found by the extraction agent.
        # :param context_node: The name of the current chapter/section being analyzed.
        :return: A cleaned list of relations.
        """
        # Quick exit if empty
        if not relations:
            return []

        prompt = ChatPromptTemplate.from_messages([
            ("system", """You are a Strict Quality Control Agent for an Educational Knowledge Graph.
            
            Your Goal: Review the 'Prerequisite Relations' extracted from a text'.
            Filter out noise to ensure high-quality graph nodes.
            
            **ACCEPTANCE CRITERIA**:
            1. **Correlation**: The concepts must strong related, such that someone would struggle to learn the source
            concept without understand the target  
            """),
            ("human", "Candidate relations: {relations}")
        ])

        chain = prompt | self.llm.with_structured_output(ValidationResult)
        
        # try:
        self.received_count += len(relations)
        # We join the list to a string for the prompt
        result: ValidationResult = chain.invoke({
            # "context": context_node,
            "relations": "\n".join([f'{rel.source}-[PREREQUISITE]->{rel.target}' for rel in relations])
        })
        
        # Optional: Print what was rejected for debugging
        if result.rejected_relations:
            self.valid_count += len(result.valid_relations) 
            self.rejected_count += len(result.rejected_relations) 
            # print(f"[Validator] All: {", ".join([for ])}")
            print(f"[Validator] Accepted: {result.valid_relations}")
            print(f"[Validator] Rejected: {result.rejected_relations}")
        
        return result.valid_relations
            
        # except Exception as e:
        #     print(f"Validator Agent Failed: {e}. Keeping original list.")
        #     return relations # Fail open: keep concepts rather than losing data

In [113]:
from IPython.display import clear_output, display
import ipywidgets as widgets
from typing import Dict, Tuple
from tqdm.notebook import tqdm_notebook
from langchain.agents import create_agent
from langchain.agents.middleware import SummarizationMiddleware

class KnowledgeGraph():    
    def __init__(self, concepts: List[Concept], output_dir: Path, creator_llm: BaseChatModel, validator_llm: BaseChatModel):
        self.output_dir = output_dir
        self.nodes_path = self.output_dir / "nodes.xml"
        self.relations_path = self.output_dir / "relations.xml"
        
        self.root_nodes = ET.Element("nodes")
        self.root_rels = ET.Element("relations")
        
        self.files = self.from_toc(concepts, True)
        print(self.files)
        
        self.llm = creator_llm
        self.creator_agent = create_agent(
            model=LLM_MODELS.gpt5_1,
            tools=[],
            middleware=[
                SummarizationMiddleware(
                    model=LLM_MODELS.gpt5_1
                )
            ],
            response_format=ConceptAnalysis
        )
        
        self.validator = ConceptValidatorAgent(llm=validator_llm)
        self.registry = GlobalRegistry()
        
        self.node_elements = self.root_nodes.findall("node")
        self.node_elements.sort(key=lambda x: int(x.get("order", 0)))
        
        self.existing_node_names = {node.get("name").lower().strip() for node in self.node_elements}
        self.existing_node_ids = {node.get("id") for node in self.node_elements}

        print(f"Loaded {len(self.node_elements)} concepts in logical order.")

   
    def from_toc(self, concepts: List[Concept], create_relations=True):
        """
        Populates root_nodes and root_rels based on the Table of Contents hierarchy.
        """
        print(f"Building graph from {len(concepts)} ToC concepts...")
        
        hierarchy_map: Dict[Tuple[int, ...], str] = {}

        # First pass: Create Nodes
        files = {}
        folder_name = ''
        folder_count = 0
        for idx, concept in enumerate(concepts):
            if len(concept.chapter) == 1:
                folder_count += 1
                folder_name = normalize_filename(concept.concept_name)
                files[(folder_name, folder_count)] = []
                
            node_id = normalize_filename(concept.concept_name)
            files[(folder_name, folder_count)].append(concept.concept_name)
            # print(folder_name)
            
            hierarchy_map[tuple(concept.chapter)] = node_id

            node = ET.SubElement(self.root_nodes, "node")
            node.set("id", node_id)
            node.set("name", concept.concept_name)
            node.set("folder", folder_name) # Assumes folder matches ID/safe_name
            node.set("order", str(idx))
            node.set("level", str(len(concept.chapter)))
            node.set("page_start", str(concept.page_start))

        if create_relations:
            # Second pass: Create Relations (Part-Of / Including)
            for concept in concepts:
                current_id = hierarchy_map.get(tuple(concept.chapter))
                
                if len(concept.chapter) > 1:
                    parent_key = tuple(concept.chapter[:-1])
                    parent_id = hierarchy_map.get(parent_key)
                    
                    if parent_id and current_id:
                        # Relation 1: Parent INCLUDES Child
                        rel1 = ET.SubElement(self.root_rels, "relation")
                        rel1.set("type", "contains")
                        rel1.set("source", parent_id)
                        rel1.set("target", current_id)
                        ET.SubElement(rel1, "context").text = "Structural Hierarchy (ToC)"

                        # Relation 2: Child PART-OF Parent
                        # rel2 = ET.SubElement(self.root_rels, "relation")
                        # rel2.set("type", "part-of")
                        # rel2.set("source", current_id)
                        # rel2.set("target", parent_id)
                        # ET.SubElement(rel2, "context").text = "Structural Hierarchy (ToC)" 
        return files
                    
    def _add_relation(self, source, target, rel_type, context):
        """Helper to append relations to XML."""
        # Simple deduplication check could go here if needed
        if source == target:
            return 
        
        rel = ET.SubElement(self.root_rels, "relation")
        rel.set("type", rel_type)
        rel.set("source", source)
        rel.set("target", target)
        ET.SubElement(rel, "context").text = context
             
    def _append_concept(self, analysis, node_name, node_id):
        if analysis.new_concepts:
            new_count = 0
            for concept in analysis.new_concepts:
                clean_name = concept.strip()
                clean_id = normalize_filename(clean_name)
                
                if clean_id not in self.existing_node_ids:
                    # Create new Node entry
                    new_node = ET.SubElement(self.root_nodes, "node")
                    new_node.set("id", clean_id)
                    new_node.set("name", clean_name)
                    new_node.set("type", "extracted")
                    new_node.set("found_in_chapter", node_id)
                    
                    self.existing_node_names.add(clean_name.lower())
                    self.existing_node_ids.add(clean_id)
                    new_count += 1
        
                # self._add_relation(node_id, clean_id, "including", f"Extracted from {node_name}")
                # self._add_relation(clean_id, node_id, "part-of", f"Extracted from {node_name}")
                
            self.registry.add_concepts(analysis.new_concepts)
            print(f"Learned: {len(analysis.new_concepts)} concepts ({new_count} new to XML)")
            
            # The current node itself is now 'known'
            self.registry.add_concepts([node_name])
            
    def _append_relation(self, analysis: ConceptAnalysis):
        print(f'appending relations {analysis.relations}')
        for sem_rel in analysis.relations:
            # target_id = normalize_filename(sem_rel.target)
                        
            # if sem_rel.relation_type == 'prerequisite':
            self._add_relation(
                normalize_filename(sem_rel.source), 
                normalize_filename(sem_rel.target),
                "prerequisite", sem_rel.context)
            # else:
                # self._add_relation(node_id, target_id, sem_rel.relation_type, sem_rel.context) 
                
    def analyze_concept_content(self, current_concepts, text_content):
        """
        Analyzes the entire markdown content for a specific concept node.
        
        :param current_concepts: Name of the current node.
        :param text_content: Text content.
        """
        if not text_content.strip():
            return ConceptAnalysis(relations=[])

        previous_concepts_str = self.registry.get_context_string()


        prompt = ChatPromptTemplate.from_messages([
          ("system", """You are a Knowledge Graph Architect. 
           Your goal is to identify the fundamental **Prerequisite Relations** within the text.
           You can create between CURRENT CONCEPTS and PREVIOUSLY LEARNED CONCEPTS.

            CURRENT CONCEPTS:
            [{current_concepts}]
            
            ### RULES:
            1. If you are creating a prerequisite relation between current concepts, the
            target must have been taught before source.
            
            ### YOUR TASK:
            1. Check the relations:
            - **prerequisite**: Does the current concept require knowing a concept from the PREVIOUSLY LEARNED CONCEPTS list? Answer yes/no and which one.
            
            
            PREVIOUSLY LEARNED CONCEPTS:
            [{history}]
        """), 
          ("human", "{text}")
        ])

        chain = prompt | self.creator_agent
        
        try:
            analysis: ConceptAnalysis = chain.invoke({
                "current_concepts": current_concepts, 
                "text": text_content[:15000], # Safety cap for tokens
                "history": previous_concepts_str
            })['structured_response']
            
            print(f'result: {analysis}')
            
            # Validation phase
            if analysis.relations:
                # original_count = len(analysis.new_concepts_taught)
                validated_relations = self.validator.validate(
                    analysis.relations, 
                    # current_node_name
                )
                
                # Update the analysis object with the clean list
                analysis.relations = validated_relations
                
            return analysis
        except Exception as e:
            print(f"LLM Error: {e}")
            return ConceptAnalysis(relations=[])
        
        
    def build(self):
        """
        Build the graph containing the initial concepts, new concepts learned and the relation
        between them.
        """
        # output = widgets.Output()
        # display(output) 
        
        for folder, idx in tqdm_notebook(sorted(self.files.keys(), key=lambda x: x[1]),
                                    desc="Creating relations and new nodes..."):
            nodes = self.files[(folder, idx)]
            concepts = ', '.join(nodes)
            # break
            
            # Path to the granular MD file
            file_path = os.path.join(self.output_dir, folder, "document.md")
            
            if not os.path.exists(file_path):
                continue
            
            # with output:
            # output.clear_output(wait=True)
            print(f"Analyzing: {folder}")
            
            with open(file_path, 'r', encoding='utf-8') as f:
                content = f.read()
                
            analysis = self.analyze_concept_content(concepts, content)
            # self._append_concept(analysis, node_name, node_id) # add concepts            
            self.registry.add_concepts(nodes) # Add relations
            self._append_relation(analysis) # Add relations
            # break
            

    def save(self):
        """
        Save the final XML files.
        """
        xml_rels_str = prettify_xml(self.root_rels)
        with open(self.relations_path, "w", encoding="utf-8") as f:
            f.write(xml_rels_str)
            
        xml_nodes_str = prettify_xml(self.root_nodes)
        with open(self.nodes_path, "w", encoding="utf-8") as f:
            f.write(xml_nodes_str)
            
        print(f"Updated {self.nodes_path} and {self.relations_path}")

In [114]:
creator_llm = get_llm(LLM_MODELS.gpt5_1)
validator_llm = get_llm(LLM_MODELS.gpt5_1)
kg = KnowledgeGraph(toc_concepts, base_output_dir, creator_llm, validator_llm)

Building graph from 104 ToC concepts...
{('introducao_ao_linux', 1): ['Introdução ao Linux', 'Sobre o material', 'Mercado Linux', 'Onde podemos encontrar o Linux?', 'Market Share – Sistemas Operacionais pelo mundo', 'Dispositivos móveis', 'Desktop Linux', 'Servidores web', 'Profi ssões no mundo OpenSource'], ('certificacoes_linux', 2): ['Certificações Linux', 'Centros certificadores'], ('historia_do_linux', 3): ['História do Linux', 'A origem do Linux'], ('licencas_open_source', 4): ['Licenças Open Source', 'Free Software Foundation', 'Software livre', 'GNU GPL (General Public License)'], ('evolucao_do_linux_distribuicoes', 5): ['Evolução do Linux: distribuições', 'Distribuições livres e corporativas', 'Distribuições from scratch e derivadas', 'Ciclo de vida de algumas distribuições Linux', 'Debian GNU/Linux', 'Evolução do Linux: dispositivos embarcados'], ('conhecendo_o_linux', 6): ['Conhecendo o Linux', 'Principais aplicações desktop Open-Source', 'Principais aplicações em servidores

In [115]:
kg.build()

Creating relations and new nodes...:   0%|          | 0/26 [00:00<?, ?it/s]

Analyzing: introducao_ao_linux


2025-12-10 15:16:38,229 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[]
appending relations []
Analyzing: certificacoes_linux


2025-12-10 15:16:50,306 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='Certificações Linux', target='Introdução ao Linux', relation_type='prerequisite', context="Para compreender o propósito, a estrutura e a relevância das certificações Linux no mercado, é necessário já saber o que é Linux, conceitos básicos do sistema e seu ecossistema, apresentados em 'Introdução ao Linux'."), Relation(source='Certificações Linux', target='Mercado Linux', relation_type='prerequisite', context="Entender por que certificações são valorizadas, como ajudam gerentes de contratação e quais carreiras existem depende de conhecer previamente o contexto de trabalho e demanda profissional descrito em 'Mercado Linux'."), Relation(source='Certificações Linux', target='Profi ssões no mundo OpenSource', relation_type='prerequisite', context="O papel das certificações está diretamente ligado às funções e perfis profissionais no ecossistema open source, discutidos em 'Profissões no mundo OpenSource'."), Relation(source='Certificações Linux', target='M

2025-12-10 15:16:56,318 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: [Relation(source='Centros certificadores', target='Certificações Linux', relation_type='prerequisite', context='Para entender as certificações Linux, é importante antes conhecer o que são e como funcionam os centros certificadores que as emitem.')]
[Validator] Rejected: [Relation(source='Certificações Linux', target='Introdução ao Linux', relation_type='prerequisite', context='Relação invertida: é necessário ter introdução ao Linux antes de estudar certificações, não o contrário.'), Relation(source='Certificações Linux', target='Mercado Linux', relation_type='prerequisite', context='Conhecer o mercado Linux costuma anteceder o estudo de certificações; a dependência como pré-requisito é fraca e invertida.'), Relation(source='Certificações Linux', target='Profi ssões no mundo OpenSource', relation_type='prerequisite', context='Entender profissões no mundo Open Source geralmente vem antes de buscar certificações; a relação está invertida.'), Relation(source='Certific

2025-12-10 15:16:59,724 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='História do Linux', target='Introdução ao Linux', relation_type='prerequisite', context='Para entender a história e a origem do Linux, o aluno precisa já saber, em linhas gerais, o que é o Linux e seu papel como sistema operacional, apresentado em Introdução ao Linux.'), Relation(source='A origem do Linux', target='Introdução ao Linux', relation_type='prerequisite', context='A explicação técnica sobre o kernel Linux, sua criação e relação com sistemas Unix-like parte do entendimento básico do que é Linux e sistema operacional, visto em Introdução ao Linux.')]


2025-12-10 15:17:01,277 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


appending relations [Relation(source='História do Linux', target='Introdução ao Linux', relation_type='prerequisite', context=None), Relation(source='A origem do Linux', target='Introdução ao Linux', relation_type='prerequisite', context=None)]
Analyzing: licencas_open_source


2025-12-10 15:17:07,030 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='Licenças Open Source', target='Introdução ao Linux', relation_type='prerequisite', context='Entender o panorama geral do Linux e seu ecossistema (Introdução ao Linux) ajuda a contextualizar por que licenças open source são importantes.'), Relation(source='Free Software Foundation', target='História do Linux', relation_type='prerequisite', context='Conhecer a história do Linux inclui o movimento de software livre e permite entender o papel da Free Software Foundation na consolidação do GNU e do Linux.'), Relation(source='Software livre', target='Introdução ao Linux', relation_type='prerequisite', context='Uma visão introdutória do Linux prepara o aluno para compreender o conceito de software livre dentro do contexto do sistema operacional e seu ecossistema.'), Relation(source='Software livre', target='História do Linux', relation_type='prerequisite', context='A história do Linux aborda o movimento de software livre e o projeto GNU, contexto necessário

2025-12-10 15:17:12,988 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: [Relation(source='Software livre', target='Introdução ao Linux', relation_type='prerequisite', context='Para entender uma introdução ao Linux, é importante compreender antes o conceito de software livre, já que o Linux está fortemente ligado a esse movimento.'), Relation(source='Software livre', target='História do Linux', relation_type='prerequisite', context='A história do Linux está intimamente ligada ao movimento do software livre; entender esse conceito ajuda a compreender o contexto histórico do sistema.'), Relation(source='GNU GPL (General Public License)', target='Software livre', relation_type='prerequisite', context='Para compreender o papel da GPL, é necessário primeiro entender o conceito geral de software livre, do qual a GPL é uma expressão jurídica específica.')]
[Validator] Rejected: [Relation(source='Licenças Open Source', target='Introdução ao Linux', relation_type='prerequisite', context='A noção de licenças Open Source ajuda, mas não é estritam

2025-12-10 15:17:41,701 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='Evolução do Linux: distribuições', target='A origem do Linux', relation_type='prerequisite', context='Para entender por que surgiram distribuições GNU/Linux e a junção kernel Linux + ferramentas GNU, é necessário conhecer como o Linux surgiu e se estruturou inicialmente.'), Relation(source='Evolução do Linux: distribuições', target='História do Linux', relation_type='prerequisite', context='A explicação sobre a evolução das distribuições a partir das primeiras versões do Linux pressupõe conhecer a linha do tempo histórica do Linux.'), Relation(source='Evolução do Linux: distribuições', target='Introdução ao Linux', relation_type='prerequisite', context='Definir o que é uma distribuição, kernel, aplicativos e tipos de uso pressupõe já saber o que é Linux como sistema operacional.'), Relation(source='Evolução do Linux: distribuições', target='Software livre', relation_type='prerequisite', context='O conceito de distribuições GNU/Linux está ligado ao mo

2025-12-10 15:17:49,324 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: [Relation(source='Distribuições livres e corporativas', target='Software livre', relation_type='prerequisite', context=None), Relation(source='Distribuições livres e corporativas', target='GNU GPL (General Public License)', relation_type='prerequisite', context=None), Relation(source='Distribuições livres e corporativas', target='Licenças Open Source', relation_type='prerequisite', context=None), Relation(source='Distribuições livres e corporativas', target='Free Software Foundation', relation_type='prerequisite', context=None), Relation(source='Debian GNU/Linux', target='Introdução ao Linux', relation_type='prerequisite', context=None), Relation(source='Debian GNU/Linux', target='Software livre', relation_type='prerequisite', context=None), Relation(source='Debian GNU/Linux', target='GNU GPL (General Public License)', relation_type='prerequisite', context=None), Relation(source='Debian GNU/Linux', target='Licenças Open Source', relation_type='prerequisite', conte

2025-12-10 15:18:23,091 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='Conhecendo o Linux', target='Introdução ao Linux', relation_type='prerequisite', context="O entendimento das características do sistema (Unix-like, representação por arquivos, permissões, root, multitarefa/multiusuário) pressupõe que o aluno já tenha visto o que é Linux de forma geral, como apresentado em 'Introdução ao Linux'."), Relation(source='Conhecendo o Linux', target='A origem do Linux', relation_type='prerequisite', context='Ao discutir herança de características do Unix e evolução do sistema, é importante já conhecer como o Linux surgiu e sua relação histórica com Unix.'), Relation(source='Conhecendo o Linux', target='História do Linux', relation_type='prerequisite', context='A compreensão de por que Linux é Unix-like e como isso influenciou seu design é facilitada pelo conhecimento prévio da história do Linux.'), Relation(source='Conhecendo o Linux', target='Evolução do Linux: distribuições', relation_type='prerequisite', context='Para ent

2025-12-10 15:18:31,154 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: [Relation(source='Principais aplicações desktop Open-Source', target='Software livre', relation_type='prerequisite', context=None), Relation(source='Principais aplicações desktop Open-Source', target='Licenças Open Source', relation_type='prerequisite', context=None), Relation(source='Principais aplicações desktop Open-Source', target='Desktop Linux', relation_type='prerequisite', context=None), Relation(source='Principais aplicações desktop Open-Source', target='Onde podemos encontrar o Linux?', relation_type='prerequisite', context=None), Relation(source='Principais aplicações em servidores Open-Source', target='Servidores web', relation_type='prerequisite', context=None), Relation(source='Principais aplicações em servidores Open-Source', target='Evolução do Linux: distribuições', relation_type='prerequisite', context=None), Relation(source='Principais aplicações em servidores Open-Source', target='Software livre', relation_type='prerequisite', context=None), Re

2025-12-10 15:18:46,557 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='Os diretórios no Linux são organizados de acordo com o padrão FHS Filesystem Hierarchy Standard', target='Conhecendo o Linux', relation_type='prerequisite', context='Para entender a organização de diretórios segundo o FHS é necessário já ter uma noção geral do sistema operacional Linux e seu ambiente.'), Relation(source='Os diretórios no Linux são organizados de acordo com o padrão FHS Filesystem Hierarchy Standard', target='Introdução ao Linux', relation_type='prerequisite', context='A introdução ao Linux, seus componentes básicos e estrutura geral do sistema são necessários antes de detalhar o padrão FHS de diretórios.'), Relation(source='O comando touch cria um arquivo vazio e também pode ser usado para modificar a data de criação/modificação de um arquivo ou diretório. O comando file mostra o tipo de um arquivo.', target='Conhecendo o Linux', relation_type='prerequisite', context='Conhecer o ambiente Linux e o conceito de arquivos e diretórios é 

2025-12-10 15:18:52,713 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


appending relations [Relation(source='Os diretórios no Linux são organizados de acordo com o padrão FHS Filesystem Hierarchy Standard', target='Conhecendo o Linux', relation_type='prerequisite', context=None), Relation(source='Os diretórios no Linux são organizados de acordo com o padrão FHS Filesystem Hierarchy Standard', target='Introdução ao Linux', relation_type='prerequisite', context=None), Relation(source='O comando touch cria um arquivo vazio e também pode ser usado para modificar a data de criação/modificação de um arquivo ou diretório. O comando file mostra o tipo de um arquivo.', target='Conhecendo o Linux', relation_type='prerequisite', context=None), Relation(source='O comando mkdir é usado para criar diretórios. O parâmetro -p é usado para não sobrescrever um diretório caso ele já exista.', target='Conhecendo o Linux', relation_type='prerequisite', context=None), Relation(source='O comando rm é usado para remover arquivos ou diretórios. O parâmetro -i faz uma pergunta par

2025-12-10 15:19:17,446 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='Estrutura do sistema operacional', target='Introdução ao Linux', relation_type='prerequisite', context='Compreender a estrutura em camadas do sistema operacional pressupõe já ter sido apresentado ao que é Linux de forma geral.'), Relation(source='Estrutura do sistema operacional', target='Conhecendo o Linux', relation_type='prerequisite', context='Detalhar camadas como kernel, sistema operacional, desktop e hardware requer conhecimento prévio básico sobre o sistema GNU/Linux.'), Relation(source='Estrutura do sistema operacional', target='Debian GNU/Linux', relation_type='prerequisite', context='O exemplo de identificação do sistema no terminal ("Debian GNU/Linux 10") pressupõe familiaridade básica com distribuições como Debian.'), Relation(source='Sessões', target='Introdução ao Linux', relation_type='prerequisite', context='Entender o conceito de sessão de usuário no sistema pressupõe já saber o que é o sistema GNU/Linux e seu modelo multiusuário.')

2025-12-10 15:19:29,469 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: [Relation(source='Início de uma sessão (login)', target='Sessões', relation_type='prerequisite', context='Para compreender o conceito geral de sessões, é fundamental antes entender como se inicia uma sessão (login).'), Relation(source='Início de uma sessão (login)', target='Terminal virtual em modo texto', relation_type='prerequisite', context='Para usar um terminal virtual em modo texto, é necessário saber iniciar uma sessão (login).'), Relation(source='Início de uma sessão (login)', target='Pseudoterminal', relation_type='prerequisite', context='Para utilizar um pseudoterminal, é preciso primeiro compreender o processo de início de sessão (login).'), Relation(source='Encerrando uma sessão (logout)', target='Sessões', relation_type='prerequisite', context='Para dominar o conceito de sessões, é essencial entender como uma sessão é encerrada (logout).'), Relation(source='Encerrando uma sessão (logout)', target='Início de uma sessão (login)', relation_type='prerequi

2025-12-10 15:19:42,115 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='O que é um Shell', target='Terminal virtual em modo texto', relation_type='prerequisite', context='Para entender o que é um shell como meio principal de interação via terminal de comandos, é necessário já conhecer o conceito de terminal virtual em modo texto.'), Relation(source='O que é um Shell', target='Sessões', relation_type='prerequisite', context='A ideia de shell como camada de acesso usada durante o uso do sistema presume o entendimento de uma sessão de uso no sistema.'), Relation(source='O que é um Shell', target='Execução dos primeiros comandos', relation_type='prerequisite', context='Saber que o usuário interage com o sistema digitando comandos no terminal facilita compreender o papel do shell como interpretador desses comandos.'), Relation(source='O que é um Shell', target='Estrutura do sistema operacional', relation_type='prerequisite', context='Compreender o shell como camada de acesso ao sistema básico requer noções prévias sobre a est

2025-12-10 15:19:52,443 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: [Relation(source='Tipos de shell', target='O que é um Shell', relation_type='prerequisite', context='Para entender os diferentes tipos de shell, é necessário antes compreender o conceito geral de shell.'), Relation(source='Alteração do shell atual', target='O que é um Shell', relation_type='prerequisite', context='Para aprender a alterar o shell atual, é essencial saber o que é um shell.'), Relation(source='Alteração do shell atual', target='Tipos de shell', relation_type='prerequisite', context='Para alterar o shell atual, o aluno precisa conhecer os diferentes tipos de shell disponíveis.')]
[Validator] Rejected: [Relation(source='O que é um Shell', target='Terminal virtual em modo texto', relation_type='prerequisite', context='A relação está invertida: compreender o terminal em modo texto é pré-requisito para entender o uso prático do shell, não o contrário.'), Relation(source='O que é um Shell', target='Sessões', relation_type='prerequisite', context='‘Sessões’

2025-12-10 15:20:06,524 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='Variáveis', target='Introdução ao Linux', relation_type='prerequisite', context='Para compreender o conceito de variáveis em shell, o aluno precisa já ter uma noção básica do sistema operacional Linux e de seu uso geral, apresentado em "Introdução ao Linux".'), Relation(source='Variáveis', target='O que é um Shell', relation_type='prerequisite', context='Variáveis são manipuladas dentro do shell; é necessário antes saber o que é um shell para entender onde e como essas variáveis existem e são usadas.'), Relation(source='Variáveis', target='Execução dos primeiros comandos', relation_type='prerequisite', context='O uso de comandos como echo para exibir variáveis pressupõe que o aluno já tenha aprendido a executar comandos básicos no shell.'), Relation(source='Variáveis Locais e de Ambiente (globais)', target='Variáveis', relation_type='prerequisite', context='Antes de diferenciar variáveis locais e de ambiente é necessário compreender o conceito geral 

2025-12-10 15:20:12,756 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: [Relation(source='Variáveis Locais e de Ambiente (globais)', target='Variáveis', relation_type='prerequisite', context=None), Relation(source='Como definir variáveis', target='Variáveis', relation_type='prerequisite', context=None), Relation(source='Como definir variáveis', target='Variáveis Locais e de Ambiente (globais)', relation_type='prerequisite', context=None), Relation(source='Exclusão de variáveis', target='Variáveis', relation_type='prerequisite', context=None), Relation(source='Exclusão de variáveis', target='Variáveis Locais e de Ambiente (globais)', relation_type='prerequisite', context=None), Relation(source='Exclusão de variáveis', target='Como definir variáveis', relation_type='prerequisite', context=None), Relation(source='Alterar o prompt de comando', target='Variáveis de Ambiente (globais)', relation_type='prerequisite', context=None)]
[Validator] Rejected: [Relation(source='Variáveis', target='Introdução ao Linux', relation_type='prerequisite',

2025-12-10 15:20:32,003 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='Arquivos de configuração do shell', target='Início de uma sessão (login)', relation_type='prerequisite', context='Entender quais arquivos o shell lê em diferentes momentos exige saber o que é um login de usuário e o processo de início de sessão.'), Relation(source='Arquivos de configuração do shell', target='Encerrando uma sessão (logout)', relation_type='prerequisite', context='Para compreender quando certos arquivos como ~/.bash_logout são executados, é necessário saber o que é o encerramento de uma sessão (logout).'), Relation(source='Arquivos de configuração do shell', target='O que é um Shell', relation_type='prerequisite', context='A explicação de arquivos de configuração do shell parte do entendimento prévio do que é um shell e qual seu papel na interação com o usuário.'), Relation(source='Arquivos de configuração do shell', target='Tipos de shell', relation_type='prerequisite', context='O tópico trata especificamente do bash e de seu comporta

2025-12-10 15:20:46,597 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: [Relation(source='Comando fc', target='Histórico de comando', relation_type='prerequisite', context='Para entender e usar o comando fc é essencial já saber o que é e como funciona o histórico de comandos do shell.')]
[Validator] Rejected: [Relation(source='Arquivos de configuração do shell', target='Início de uma sessão (login)', relation_type='prerequisite', context='Relação inversa: é preciso antes saber o que é login e como a sessão se inicia para depois entender quais arquivos de configuração são lidos.'), Relation(source='Arquivos de configuração do shell', target='Encerrando uma sessão (logout)', relation_type='prerequisite', context='O conceito de logout e encerramento de sessão não depende de conhecer arquivos de configuração do shell; é mais básico.'), Relation(source='Arquivos de configuração do shell', target='O que é um Shell', relation_type='prerequisite', context='É necessário primeiro entender o que é um shell para depois estudar seus arquivos de co

2025-12-10 15:21:02,770 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='Caminhos de Diretorios', target='Estrutura do sistema operacional', relation_type='prerequisite', context='Para entender caminhos absolutos e relativos é necessário já saber que o Linux organiza arquivos em uma estrutura hierárquica de diretórios como parte da estrutura do sistema operacional.'), Relation(source='Caminhos de Diretorios', target='O que é um Shell', relation_type='prerequisite', context='O texto pressupõe que o aluno saiba o que é um shell/linha de comando para entender comandos como pwd, cd e o conceito de diretório corrente.'), Relation(source='Caminhos de Diretorios', target='Variáveis Locais e de Ambiente (globais)', relation_type='prerequisite', context='A explicação de caminhos de diretório utiliza a variável de ambiente $PATH para mostrar por que é possível executar /bin/ls sem o caminho completo, exigindo noção prévia de variáveis de ambiente.'), Relation(source='Caminhos de Diretorios', target='Variáveis', relation_type='prere

2025-12-10 15:21:15,020 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: [Relation(source='Acessando os diretórios', target='Caminhos de Diretorios', relation_type='prerequisite', context='Para acessar diretórios com segurança e eficiência é necessário antes compreender o conceito de caminhos de diretórios (relativos e absolutos).'), Relation(source='Comando ls', target='Caminhos de Diretorios', relation_type='prerequisite', context='Para interpretar corretamente a saída do comando ls e usá-lo em diferentes locais, o aluno precisa entender caminhos de diretórios.'), Relation(source='Atalhos de teclado utilizados na linha de comando', target='O que é um Shell', relation_type='prerequisite', context='Antes de aprender atalhos da linha de comando é fundamental saber o que é um shell e o ambiente em que esses atalhos são utilizados.'), Relation(source='Atalhos de teclado utilizados na linha de comando', target='Terminal virtual em modo texto', relation_type='prerequisite', context='Os atalhos são usados em um terminal; compreender o que é 

2025-12-10 15:21:19,602 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='Tópicos para revisão do capítulo', target='Caminhos de Diretorios', relation_type='prerequisite', context='Para revisar comandos como mkdir, rm, touch, find, locate e entender a organização de diretórios segundo o FHS, é necessário já compreender o conceito de caminhos de diretórios no sistema de arquivos Linux.'), Relation(source='Tópicos para revisão do capítulo', target='Comando ls', relation_type='prerequisite', context='O estudo dos tópicos sobre criação, remoção, localização e manipulação de arquivos e diretórios pressupõe que o aluno já saiba listar conteúdo de diretórios com o comando ls.'), Relation(source='Tópicos para revisão do capítulo', target='Acessando os diretórios', relation_type='prerequisite', context='Revisar comandos relacionados a diretórios (mkdir, rm, find, locate) depende de já saber navegar e acessar diretórios no Linux.'), Relation(source='Tópicos para revisão do capítulo', target='Estrutura do sistema operacional', relati

2025-12-10 15:21:22,131 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: []
[Validator] Rejected: [Relation(source='Tópicos para revisão do capítulo', target='Caminhos de Diretorios', relation_type='prerequisite', context=None), Relation(source='Tópicos para revisão do capítulo', target='Comando ls', relation_type='prerequisite', context=None), Relation(source='Tópicos para revisão do capítulo', target='Acessando os diretórios', relation_type='prerequisite', context=None), Relation(source='Tópicos para revisão do capítulo', target='Estrutura do sistema operacional', relation_type='prerequisite', context=None)]
appending relations []
Analyzing: como_obter_ajuda


2025-12-10 15:21:28,649 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='Como obter ajuda', target='Introdução ao Linux', relation_type='prerequisite', context="Para entender como buscar ajuda dentro do GNU/Linux, o aluno precisa já saber, em linhas gerais, o que é o sistema e estar contextualizado sobre seu uso, o que é dado em 'Introdução ao Linux'."), Relation(source='Como obter ajuda', target='Conhecendo o Linux', relation_type='prerequisite', context="Buscar e interpretar documentação e man pages pressupõe familiaridade básica com o ambiente Linux e seus componentes, tratada em 'Conhecendo o Linux'."), Relation(source='Como obter ajuda', target='O que é um Shell', relation_type='prerequisite', context='Grande parte da ajuda é acessada via linha de comando (man, etc.); entender o que é um shell e seu papel é prévio para compreender como acionar esses recursos de ajuda.'), Relation(source='Como obter ajuda', target='Terminal virtual em modo texto', relation_type='prerequisite', context='O uso de man pages e outras docu

2025-12-10 15:21:34,311 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: []
[Validator] Rejected: [Relation(source='Como obter ajuda', target='Introdução ao Linux', relation_type='prerequisite', context=None), Relation(source='Como obter ajuda', target='Conhecendo o Linux', relation_type='prerequisite', context=None), Relation(source='Como obter ajuda', target='O que é um Shell', relation_type='prerequisite', context=None), Relation(source='Como obter ajuda', target='Terminal virtual em modo texto', relation_type='prerequisite', context=None), Relation(source='Como obter ajuda', target='Execução dos primeiros comandos', relation_type='prerequisite', context=None), Relation(source='Como obter ajuda', target='Histórico de comando', relation_type='prerequisite', context=None)]
appending relations []
Analyzing: formas_de_documentacao


2025-12-10 15:21:43,266 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='Formas de documentação', target='Conhecendo o Linux', relation_type='prerequisite', context='Para entender as formas de documentação no contexto de GNU/Linux, é necessário já conhecer o sistema Linux em nível introdutório.'), Relation(source='Formas de documentação', target='Como obter ajuda', relation_type='prerequisite', context='As formas de documentação são parte dos mecanismos de ajuda; relacionam-se diretamente ao conceito geral de como obter ajuda no sistema.'), Relation(source='How-to’s', target='Conhecendo o Linux', relation_type='prerequisite', context='Para localizar e utilizar how-to’s em /usr/share/doc e compreender exemplos como configuração de firewall ou servidor web, o aluno precisa já conhecer o Linux em termos gerais.'), Relation(source='How-to’s', target='Caminhos de Diretorios', relation_type='prerequisite', context='O uso de how-to’s no caminho /usr/share/doc/iptables/ requer entendimento prévio de caminhos de diretórios.'), Rel

2025-12-10 15:21:48,703 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: [Relation(source='Formas de documentação', target='Como obter ajuda', relation_type='prerequisite', context=None), Relation(source='How-to’s', target='Como obter ajuda', relation_type='prerequisite', context=None), Relation(source='Manuais', target='Como obter ajuda', relation_type='prerequisite', context=None), Relation(source='Documentação', target='Como obter ajuda', relation_type='prerequisite', context=None)]
[Validator] Rejected: [Relation(source='Formas de documentação', target='Conhecendo o Linux', relation_type='prerequisite', context=None), Relation(source='How-to’s', target='Conhecendo o Linux', relation_type='prerequisite', context=None), Relation(source='How-to’s', target='Caminhos de Diretorios', relation_type='prerequisite', context=None), Relation(source='How-to’s', target='Acessando os diretórios', relation_type='prerequisite', context=None), Relation(source='How-to’s', target='Execução dos primeiros comandos', relation_type='prerequisite', contex

2025-12-10 15:21:58,023 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='Comando help', target='Como obter ajuda', relation_type='prerequisite', context='Para compreender o uso específico do comando help, o aluno já deve conhecer, em termos gerais, as formas de obter ajuda no sistema, incluindo a ideia de documentação e comandos de ajuda.'), Relation(source='Comando help', target='O que é um Shell', relation_type='prerequisite', context='O texto explica que o comando help atua sobre comandos internos do interpretador de comandos (shell), o que exige saber previamente o que é um shell.'), Relation(source='Comando help', target='Tipos de shell', relation_type='prerequisite', context='A distinção entre comandos internos do interpretador e comandos externos depende de entender que há diferentes shells, cada qual com seu conjunto de internos.'), Relation(source='Comando help', target='Comando ls', relation_type='prerequisite', context='O exemplo de uso de --help para comandos externos é dado com ls (ls --help), exigindo que o 

2025-12-10 15:22:04,927 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: [Relation(source='Comando help', target='Como obter ajuda', relation_type='prerequisite', context='Para utilizar o comando `help` de forma eficaz, o aluno precisa antes entender o conceito geral de como obter ajuda em um ambiente de linha de comando.')]
[Validator] Rejected: [Relation(source='Comando help', target='O que é um Shell', relation_type='prerequisite', context='Embora entender o que é um shell seja útil no geral, não é estritamente necessário para aprender o comando `help` em si.'), Relation(source='Comando help', target='Tipos de shell', relation_type='prerequisite', context='Conhecer diferentes tipos de shell não é requisito forte para aprender o comando `help` básico.'), Relation(source='Comando help', target='Comando ls', relation_type='prerequisite', context='Saber `ls` não é pré-requisito para entender o comando `help`; são comandos independentes.'), Relation(source='Comando help', target='Utilização de aliases (apelidos)', relation_type='prerequi

2025-12-10 15:22:13,341 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='Comando apropos', target='Comando man', relation_type='prerequisite', context='Para entender o funcionamento do comando apropos, o aluno precisa saber o que são e como funcionam as páginas de manual, tradicionalmente acessadas com o comando man. O texto menciona que o apropos pesquisa as páginas de manual e inclusive cita o uso de `man -k` como equivalente.'), Relation(source='Comando apropos', target='Como obter ajuda', relation_type='prerequisite', context='O conceito de apropos é um mecanismo de ajuda e descoberta de comandos baseado em palavras‑chave, que se insere no conjunto de formas de obter ajuda no sistema.'), Relation(source='Comando apropos', target='Manuais', relation_type='prerequisite', context='O apropos pesquisa descrições nas páginas de manual; para compreender isso, é necessário já conhecer o conceito de manuais no Linux.'), Relation(source='Comando apropos', target='Formas de documentação', relation_type='prerequisite', context='O

2025-12-10 15:22:18,646 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: [Relation(source='Comando apropos', target='Comando man', relation_type='prerequisite', context='Entender o comando man (e o sistema de manuais) é necessário para compreender e usar o comando apropos, que pesquisa nas páginas de manual.'), Relation(source='Comando apropos', target='Manuais', relation_type='prerequisite', context='Conhecer o conceito de manuais do sistema (páginas de manual) é necessário para entender o que o comando apropos busca e onde realiza as pesquisas.'), Relation(source='Comando apropos', target='Formas de documentação', relation_type='prerequisite', context='Ter uma noção prévia das formas de documentação disponíveis no sistema ajuda a entender o papel do comando apropos como ferramenta de pesquisa nessa documentação.')]
[Validator] Rejected: [Relation(source='Comando apropos', target='Como obter ajuda', relation_type='prerequisite', context='"Como obter ajuda" é um objetivo ou tópico geral, não um conceito técnico bem definido cujo domíni

2025-12-10 15:22:24,139 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='Comando whatis', target='Comando apropos', relation_type='prerequisite', context='O texto compara diretamente o comando whatis com o comando apropos, assumindo que o leitor já conheça o apropos para entender a diferença de comportamento nas buscas.'), Relation(source='Comando whatis', target='Manuais', relation_type='prerequisite', context='É mencionado que whatis usa as páginas de manuais (man pages) e também é apresentada a forma equivalente `man -f`, exigindo conhecimento prévio de manuais para plena compreensão.'), Relation(source='Comando whatis', target='Como obter ajuda', relation_type='prerequisite', context="O comando whatis faz parte do conjunto de mecanismos de ajuda em linha de comando, complementando apropos e man, que estão no escopo de 'Como obter ajuda'.")]


2025-12-10 15:22:28,117 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: [Relation(source='Comando whatis', target='Comando apropos', relation_type='prerequisite', context='Entender o comando `whatis` (que mostra descrições curtas de comandos/manuais) ajuda a compreender o funcionamento de `apropos`, que busca por palavras‑chave nessas descrições.'), Relation(source='Comando whatis', target='Manuais', relation_type='prerequisite', context='Para usar `whatis`, o aluno precisa entender o conceito de manuais de sistema (páginas de manual / man pages), pois `whatis` consulta esses resumos.')]
[Validator] Rejected: [Relation(source='Comando whatis', target='Como obter ajuda', relation_type='prerequisite', context='"Como obter ajuda" é um tópico amplo e genérico; não é um conhecimento específico que seja pré-requisito para aprender o comando `whatis`, mas sim um contexto em que `whatis` é uma das ferramentas.')]
appending relations [Relation(source='Comando whatis', target='Comando apropos', relation_type='prerequisite', context='Entender o 

2025-12-10 15:22:47,153 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='Comando man', target='Comando ls', relation_type='prerequisite', context='O texto usa `ls /usr/share/man/` como exemplo para listar diretórios de manuais, exigindo conhecimento prévio do comando ls.'), Relation(source='Comando man', target='Como obter ajuda', relation_type='prerequisite', context='O comando man é apresentado como o principal recurso de documentação e ajuda no Linux, dependente do conceito geral de como obter ajuda no sistema.'), Relation(source='Comando man', target='Manuais', relation_type='prerequisite', context='O conteúdo descreve que `man` acessa os manuais do sistema, exigindo a compreensão prévia do que são manuais de documentação.'), Relation(source='Comando man', target='Formas de documentação', relation_type='prerequisite', context='O man é apresentado como uma das principais formas de documentação no Linux, dependendo do entendimento geral sobre diferentes formas de documentação.'), Relation(source='Comando man', target='D

2025-12-10 15:22:58,555 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: [Relation(source='Comando man', target='Comando ls', relation_type='prerequisite', context='Para usar o comando ls de forma autônoma, é importante saber usar o comando man para consultar sua documentação e opções.'), Relation(source='Comando man', target='Como obter ajuda', relation_type='prerequisite', context='O comando man é um dos meios centrais de obtenção de ajuda no Linux; entender man é parte fundamental de "como obter ajuda" no sistema.'), Relation(source='Comando man', target='Manuais', relation_type='prerequisite', context='O comando man é a interface padrão para acessar os manuais do sistema; aprender man é essencial para utilizar esses manuais na prática.'), Relation(source='Comando man', target='Formas de documentação', relation_type='prerequisite', context='O comando man representa uma das formas principais de documentação em sistemas Unix/Linux, sendo um elemento essencial ao aprender sobre documentação do sistema.'), Relation(source='Comando man',

2025-12-10 15:23:02,943 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='Comando info', target='Comando man', relation_type='prerequisite', context='O conceito de info é apresentado como alternativa/navegação semelhante às man pages, portanto pressupõe que o aluno já conheça o que são manuais e o comando man.'), Relation(source='Alternativas para consulta', target='Comando man', relation_type='prerequisite', context='As alternativas yelp e xman são descritas como ferramentas para visualização de manuais, inclusive xman como front-end para o comando man, o que exige entender previamente o comando man e suas man pages.'), Relation(source='Alternativas para consulta', target='Documentação', relation_type='prerequisite', context='O trecho trata de ferramentas de documentação (yelp, xman), que se apoiam no conceito geral de documentação já apresentado.'), Relation(source='Comando info', target='Como obter ajuda', relation_type='prerequisite', context='O comando info é uma das formas de ajuda do sistema; para entendê-lo no flux

2025-12-10 15:23:07,325 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: [Relation(source='Alternativas para consulta', target='Comando man', relation_type='prerequisite', context='"Alternativas para consulta" (alternative ways to look up information) requires understanding the basic use of the "man" command as one of the primary Unix help tools.'), Relation(source='Alternativas para consulta', target='Documentação', relation_type='prerequisite', context='To understand "Alternativas para consulta" (ways to query or look up information), a learner must understand what documentation is and how it is used as a primary information source.')]
[Validator] Rejected: [Relation(source='Comando info', target='Comando man', relation_type='prerequisite', context='Knowing the GNU "info" command is not a strict prerequisite for understanding the "man" command; each can be learned independently as separate help systems.'), Relation(source='Comando info', target='Como obter ajuda', relation_type='prerequisite', context='"Comando info" is one specific 

2025-12-10 15:23:22,480 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='Comando whereis', target='Comando apropos', relation_type='prerequisite', context='O exemplo mostra o uso de `whereis apropos`, pressupondo que o aluno já conheça o que é o comando apropos e sua finalidade.'), Relation(source='Comando whereis', target='Comando ls', relation_type='prerequisite', context='A compreensão de caminhos como `/bin`, `/usr/bin`, `/usr/share/man` pressupõe familiaridade básica com listagem e navegação de diretórios, usualmente introduzida junto ao comando ls.'), Relation(source='Comando whereis', target='Comando man', relation_type='prerequisite', context='Várias opções do whereis (-m, -M, exemplos com páginas de manual) fazem referência direta a páginas de manual, o que requer que o aluno já saiba o que é e como usar o comando man.'), Relation(source='Comando whereis', target='Caminhos de Diretorios', relation_type='prerequisite', context='As opções -B, -M e -S dependem de o usuário entender caminhos como `/bin`, `/usr/share/

2025-12-10 15:23:32,962 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: [Relation(source='Comando whereis', target='Comando apropos', relation_type='prerequisite', context='Ambos são comandos de localização/consulta de ajuda; entender um auxilia fortemente a compreensão do outro, pois fazem parte do mesmo conjunto conceitual de ferramentas de busca de informações sobre comandos.'), Relation(source='Comando whereis', target='Comando whatis', relation_type='prerequisite', context='Comando whatis e whereis são frequentemente aprendidos em conjunto como ferramentas básicas de descoberta de informações sobre comandos; o entendimento de um reforça o conceito do outro.'), Relation(source='Comando whereis', target='Comando info', relation_type='prerequisite', context='Comandos de consulta como whereis, whatis, apropos e info formam um grupo conceitual; conhecer o uso de whereis ajuda a entender o fluxo de descoberta de documentação em geral, incluindo o comando info.')]
[Validator] Rejected: [Relation(source='Comando whereis', target='Comando

2025-12-10 15:23:42,652 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='Comando which', target='Comando whereis', relation_type='prerequisite', context='Para entender o comando which, o texto o compara diretamente ao comando whereis, assumindo que o aluno já conheça whereis para perceber a diferença (which mostra somente a localização do binário).'), Relation(source='Comando which', target='Comando man', relation_type='prerequisite', context='Na revisão, which é listado junto com outros comandos de consulta como man; entender man como ferramenta de ajuda geral é base para situar which no conjunto de comandos de localização/ajuda.'), Relation(source='Comando which', target='Comando whatis', relation_type='prerequisite', context='whatis é citado como comando relacionado à consulta de informações; conhecer o ecossistema de comandos de consulta (whatis, apropos etc.) facilita entender o papel específico de which.'), Relation(source='Comando which', target='Comando info', relation_type='prerequisite', context='info é apresent

2025-12-10 15:23:55,441 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: [Relation(source='Comando which', target='Comando whereis', relation_type='prerequisite', context='Understanding how one command locates executables (which) supports learning another locator command (whereis), which extends the idea to other paths and locations.'), Relation(source='Comando which', target='Comando whatis', relation_type='prerequisite', context='Knowing how commands are resolved and found in the system (which) helps in understanding tools that retrieve command descriptions (whatis) since both operate over the command space and documentation.'), Relation(source='Comando which', target='Comando info', relation_type='prerequisite', context='Familiarity with basic command lookup and usage (which) is helpful before using more advanced documentation systems like info.'), Relation(source='Comando which', target='Comando help', relation_type='prerequisite', context='Knowing how to identify commands on the system (which) is useful before invoking their built

2025-12-10 15:24:35,995 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='FHS, Hierarquia dos Diretórios', target='Estrutura do sistema operacional', relation_type='prerequisite', context='Entender a hierarquia FHS pressupõe já saber, em nível básico, o que é um sistema operacional e sua estrutura geral.'), Relation(source='FHS, Hierarquia dos Diretórios', target='Conhecendo o Linux', relation_type='prerequisite', context='A padronização de diretórios via FHS é estudada após uma visão geral do sistema GNU/Linux.'), Relation(source='Estrutura de Diretórios GNU/Linux', target='Caminhos de Diretorios', relation_type='prerequisite', context='Para compreender a árvore de diretórios e seus níveis, o aluno precisa já entender o conceito de caminho de diretório.'), Relation(source='Estrutura de Diretórios GNU/Linux', target='Acessando os diretórios', relation_type='prerequisite', context='Conhecer como navegar entre diretórios é necessário para explorar a estrutura de diretórios do sistema.'), Relation(source='Estrutura de Diretór

2025-12-10 15:24:49,027 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: [Relation(source='FHS, Hierarquia dos Diretórios', target='Estrutura do sistema operacional', relation_type='prerequisite', context=None), Relation(source='Estrutura de Diretórios GNU/Linux', target='Caminhos de Diretorios', relation_type='prerequisite', context=None), Relation(source='Estrutura de Diretórios GNU/Linux', target='Acessando os diretórios', relation_type='prerequisite', context=None), Relation(source='Diretório /', target='Estrutura de Diretórios GNU/Linux', relation_type='prerequisite', context=None), Relation(source='Diretório /proc', target='Estrutura do sistema operacional', relation_type='prerequisite', context=None), Relation(source='Diretório /sys', target='Estrutura do sistema operacional', relation_type='prerequisite', context=None)]
[Validator] Rejected: [Relation(source='FHS, Hierarquia dos Diretórios', target='Conhecendo o Linux', relation_type='prerequisite', context=None), Relation(source='Estrutura de Diretórios GNU/Linux', target='Com

2025-12-10 15:25:13,330 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='Aprendendo Comandos do GNU/Linux', target='O que é um Shell', relation_type='prerequisite', context='Para entender a execução de comandos é preciso saber previamente o conceito de shell como interface entre usuário e sistema.'), Relation(source='Aprendendo Comandos do GNU/Linux', target='Execução dos primeiros comandos', relation_type='prerequisite', context='A introdução a comandos pressupõe que o aluno já tenha executado alguns comandos básicos em capítulos anteriores.'), Relation(source='Aprendendo Comandos do GNU/Linux', target='Terminal virtual em modo texto', relation_type='prerequisite', context='Aprender comandos assume que o aluno já sabe utilizar um terminal de linha de comando.'), Relation(source='Aprendendo Comandos do GNU/Linux', target='Tipos de shell', relation_type='prerequisite', context='O texto menciona o shell como interpretador; conhecer os tipos de shell ajuda a contextualizar a execução de comandos.'), Relation(source='Extraind

2025-12-10 15:25:22,501 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: [Relation(source='Aprendendo Comandos do GNU/Linux', target='O que é um Shell', relation_type='prerequisite', context=None), Relation(source='Aprendendo Comandos do GNU/Linux', target='Execução dos primeiros comandos', relation_type='prerequisite', context=None), Relation(source='Aprendendo Comandos do GNU/Linux', target='Terminal virtual em modo texto', relation_type='prerequisite', context=None), Relation(source='Aprendendo Comandos do GNU/Linux', target='Tipos de shell', relation_type='prerequisite', context=None), Relation(source='Extraindo mais do comando ls', target='Comando ls', relation_type='prerequisite', context=None), Relation(source='Extraindo mais do comando ls', target='Estrutura de Diretórios GNU/Linux', relation_type='prerequisite', context=None), Relation(source='Extraindo mais do comando ls', target='Hierarquia dos Diretórios', relation_type='prerequisite', context=None), Relation(source='Extraindo mais do comando ls', target='Caminhos de Direto

2025-12-10 15:25:51,980 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='Localização no sistema', target='Estrutura de Diretórios GNU/Linux', relation_type='prerequisite', context='Para localizar arquivos e entender caminhos usados com find, xargs e locate é necessário conhecer a estrutura de diretórios do sistema.'), Relation(source='Localização no sistema', target='Caminhos de Diretorios', relation_type='prerequisite', context='Noções de caminhos absolutos e relativos são pré-requisito para compreender a localização de arquivos no sistema.'), Relation(source='Localização no sistema', target='Acessando os diretórios', relation_type='prerequisite', context='É preciso saber navegar entre diretórios para entender o conceito de localização no sistema.'), Relation(source='Comando find', target='Aprendendo Comandos do GNU/Linux', relation_type='prerequisite', context='O uso do comando find pressupõe conhecimento básico de sintaxe e execução de comandos em GNU/Linux.'), Relation(source='Comando find', target='Comando ls', relat

2025-12-10 15:26:20,530 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: [Relation(source='Comando find', target='Curingas', relation_type='prerequisite', context='Para usar o comando find de forma eficaz é importante entender curingas (wildcards) para especificar padrões de nomes de arquivos.'), Relation(source='Comando find', target='Estrutura de Diretórios GNU/Linux', relation_type='prerequisite', context='Para localizar arquivos com find é necessário compreender a estrutura de diretórios do GNU/Linux, pois a busca é feita em diretórios específicos.'), Relation(source='Comando find', target='Diretórios /home e /root', relation_type='prerequisite', context='Saber o papel dos diretórios /home e /root ajuda a entender onde buscar arquivos de usuários e do administrador com find.'), Relation(source='Comando find', target='Diretório /', relation_type='prerequisite', context='Entender o diretório raiz / é essencial para saber o ponto de partida de buscas globais com find.'), Relation(source='Comando find', target='Diretório /etc', relatio

2025-12-10 15:26:25,564 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


result: relations=[Relation(source='Tópicos para revisão do capítulo', target='Estrutura de Diretórios GNU/Linux', relation_type='prerequisite', context='Para revisar tópicos sobre diretórios organizados segundo o FHS e comandos que atuam sobre arquivos/diretórios, é necessário já conhecer a estrutura de diretórios do GNU/Linux.'), Relation(source='Tópicos para revisão do capítulo', target='FHS', relation_type='prerequisite', context='O primeiro tópico de revisão cita explicitamente que os diretórios são organizados segundo o padrão FHS, então é preciso já ter aprendido o conceito de FHS.'), Relation(source='Tópicos para revisão do capítulo', target='Comando find', relation_type='prerequisite', context='Um dos tópicos revisa o comando find; para entendê-lo em revisão, o comando find já deve ter sido apresentado antes.'), Relation(source='Tópicos para revisão do capítulo', target='Comando xargs', relation_type='prerequisite', context='Há um item de revisão sobre a função do comando xarg

2025-12-10 15:26:28,692 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


[Validator] Accepted: []
[Validator] Rejected: [Relation(source='Tópicos para revisão do capítulo', target='Estrutura de Diretórios GNU/Linux', relation_type='prerequisite', context=None), Relation(source='Tópicos para revisão do capítulo', target='FHS', relation_type='prerequisite', context=None), Relation(source='Tópicos para revisão do capítulo', target='Comando find', relation_type='prerequisite', context=None), Relation(source='Tópicos para revisão do capítulo', target='Comando xargs', relation_type='prerequisite', context=None), Relation(source='Tópicos para revisão do capítulo', target='Comando locate', relation_type='prerequisite', context=None)]
appending relations []


In [116]:
kg.save()

Updated ebooks/LinuxFundamentals/nodes.xml and ebooks/LinuxFundamentals/relations.xml


In [117]:
OUTPUT_HTML = base_output_dir / 'graph.html'
OUTPUT_HTML = str(OUTPUT_HTML)

In [119]:
import os
import xml.etree.ElementTree as ET
from pyvis.network import Network
import networkx as nx

def get_node_color_by_level(level_str):
    """Returns a color hex code based on hierarchy level."""
    try:
        level = int(level_str)
    except (ValueError, TypeError):
        level = 1

    # Palette: Deep Blue -> Teal -> Green -> Light Green
    palette = {
        0: "#f0a202", # Gold (Root)
        1: "#22577a", # Dark Blue (Chapters)
        2: "#38a3a5", # Teal (Sections)
        3: "#57cc99", # Mint (Sub-sections)
        4: "#80ed99", # Light Green
        5: "#c7f9cc"  # Pale Green
    }
    return palette.get(level, "#c7f9cc") # Default to lightest for deep levels

def create_interactive_graph():
    if not os.path.exists(NODES_XML) or not os.path.exists(RELATIONS_XML):
        print("❌ XML files not found.")
        return

    print("📊 Constructing NetworkX Graph...")
    G = nx.DiGraph()

    # 1. Parse Nodes
    tree_nodes = ET.parse(NODES_XML)
    for node in tree_nodes.findall("node"):
        node_id = node.get("id")
        name = node.get("name")
        node_type = node.get("type", "chapter") 
        level = node.get("level", "1")
        
        # Default styling
        size = 15
        title = f"Type: {node_type}\nLevel: {level}"
        
        if node_type == "extracted":
            color = "#ffafcc" # Pink/Pastel for Extracted Concepts (Distinct from structure)
            size = 10         
            found_in = node.get("found_in_chapter", "unknown")
            title += f"\nFound in: {found_in}"
        elif node_type == "root":
            color = get_node_color_by_level(0)
            size = 30
        else:
            # Structural Node (Chapter/ToC) -> Color by Level
            color = get_node_color_by_level(level)
            # Make higher levels slightly bigger
            size = max(10, 25 - (int(level) * 3))

        G.add_node(node_id, label=name, title=title, color=color, size=size, shape="dot")

    # 2. Parse Relations
    tree_rels = ET.parse(RELATIONS_XML)
    for rel in tree_rels.findall("relation"):
        source = rel.get("source")
        target = rel.get("target")
        rel_type = rel.get("type")
        
        # --- EDGE STYLING LOGIC ---
        # Default
        color = "#888888" 
        width = 1
        dashes = False
        
        if rel_type == "prerequisite":
            color = "#ff3366"  # Bright Red/Pink (Critical Path)
            width = 3
            dashes = False
            
        elif rel_type == "part-of":
            color = "#4a90e2"  # Solid Blue
            width = 1
            dashes = True      # Dashed to show hierarchy
            
        elif rel_type == "including":
            color = "#00b4d8"  # Cyan
            width = 1
            dashes = True
            
        elif rel_type == "definition":
            color = "#9b5de5"  # Purple (Semantic Definition)
            width = 2
            dashes = False
            
        elif rel_type == "property":
            color = "#f15bb5"  # Magenta (Attribute/Property)
            width = 1
            dashes = False

        if G.has_node(source) and G.has_node(target):
            # Title allows you to hover over the edge to see "prerequisite", etc.
            G.add_edge(source, target, title=rel_type, color=color, width=width, dashes=dashes)

    print(f"🕸️  Graph created with {G.number_of_nodes()} nodes and {G.number_of_edges()} edges.")

    # 3. Generate PyVis Visualization (Obsidian Style)
    print("🎨 Generating Obsidian-like HTML Visualization...")
    
    net = Network(height="900px", width="100%", bgcolor="#1e1e1e", font_color="#cccccc", select_menu=False, filter_menu=False)
    
    net.from_nx(G)
    
    options = """
    var options = {
      "nodes": {
        "borderWidth": 0,
        "borderWidthSelected": 2,
        "font": {
          "size": 14,
          "face": "tahoma",
          "color": "#eeeeee",
          "strokeWidth": 2,
          "strokeColor": "#1e1e1e"
        },
        "shadow": {
            "enabled": true,
            "color": "black",
            "size": 5,
            "x": 2,
            "y": 2
        }
      },
      "edges": {
        "smooth": {
          "type": "continuous",
          "forceDirection": "none"
        },
        "arrows": {
            "to": {
                "enabled": true,
                "scaleFactor": 0.5
            }
        },
        "color": {
            "inherit": false,
            "opacity": 1.0
        }
      },
      "interaction": {
        "hover": true,
        "hoverConnectedEdges": true,
        "selectConnectedEdges": true,
        "navigationButtons": true,
        "keyboard": true,
        "tooltipDelay": 200
      }
    }
    """
    net.set_options(options)
    
    # net.show_buttons(filter_=['physics'])

    net.save_graph(OUTPUT_HTML)
    print(f"✅ Visualization saved to: {os.path.abspath(OUTPUT_HTML)}")


In [120]:
create_interactive_graph()

📊 Constructing NetworkX Graph...
🕸️  Graph created with 101 nodes and 206 edges.
🎨 Generating Obsidian-like HTML Visualization...
✅ Visualization saved to: /home/pras/EMBRAPII/4linux/notebooks/ebooks/LinuxFundamentals/graph.html


In [28]:
import os
import xml.etree.ElementTree as ET
from collections import Counter
from typing import List, Tuple, Dict, Any

def get_single_run_stats(nodes_path: str, relations_path: str) -> Dict[str, Any]:
    """
    Helper function to parse a single pair of XML files and return raw stats.
    """
    stats = {
        "status": "OK",
        "nodes_total": 0,
        "nodes_chapter": 0,
        "nodes_extracted": 0,
        "relations_total": 0,
        "rel_prereq": 0,
        "rel_partof": 0,
        "rel_def": 0,
        "rel_prop": 0,
        "orphans": 0,
        "avg_rel": 0.0
    }

    if not os.path.exists(nodes_path) or not os.path.exists(relations_path):
        stats["status"] = "Missing Files"
        return stats

    try:
        # 1. Analyze Nodes
        tree_nodes = ET.parse(nodes_path)
        root_nodes = tree_nodes.getroot()
        all_nodes = root_nodes.findall("node")
        
        stats["nodes_total"] = len(all_nodes)
        node_ids = set()

        for node in all_nodes:
            n_type = node.get("type", "chapter")
            if n_type == "extracted":
                stats["nodes_extracted"] += 1
            else:
                stats["nodes_chapter"] += 1 # Counts root and chapters together
            
            node_ids.add(node.get("id"))

        # 2. Analyze Relations
        tree_rels = ET.parse(relations_path)
        root_rels = tree_rels.getroot()
        all_rels = root_rels.findall("relation")
        
        stats["relations_total"] = len(all_rels)
        
        connected_nodes = set()

        for rel in all_rels:
            r_type = rel.get("type", "unknown")
            
            if r_type == "prerequisite":
                stats["rel_prereq"] += 1
            elif r_type == "part-of":
                stats["rel_partof"] += 1
            elif r_type == "definition":
                stats["rel_def"] += 1
            elif r_type == "property":
                stats["rel_prop"] += 1
            
            connected_nodes.add(rel.get("source"))
            connected_nodes.add(rel.get("target"))

        # 3. Health Metrics
        orphans = node_ids - connected_nodes
        stats["orphans"] = len(orphans)
        
        if stats["nodes_total"] > 0:
            stats["avg_rel"] = round(stats["relations_total"] / stats["nodes_total"], 2)

    except Exception as e:
        stats["status"] = f"Error: {str(e)[:20]}..."
    
    return stats

def analyze_graph_files(graph_runs):
    headers = [
        "Generator", "Validator", "Status", "Nodes", "Chapters", "Concepts",
        "Relations", "Prereqs", "Part-Of", "Defs", "Props", "Orphans", "Avg Rel/Node"
    ]
    lines = []
    lines.append("### Knowledge Graph Analysis Report")
    header_row = "| " + " | ".join(headers) + " |"
    separator = "| " + " | ".join(["---"] * len(headers)) + " |"
    lines.append(header_row)
    lines.append(separator)
    

    for idx, (run_name, n_path, r_path) in enumerate(graph_runs, 1):
        data = get_single_run_stats(n_path, r_path)
        if data["status"] != "OK":
            row = [str(idx), data["status"]] + ["-"] * (len(headers) - 2)
        else:
            row = [
                str(run_name.split('_')[0]),
                str(run_name.split('_')[1]),
                "✅ OK",
                str(data["nodes_total"]),
                str(data["nodes_chapter"]),
                str(data["nodes_extracted"]),
                str(data["relations_total"]),
                str(data["rel_prereq"]),
                str(data["rel_partof"]),
                str(data["rel_def"]),
                str(data["rel_prop"]),
                str(data["orphans"]),
                str(data["avg_rel"])
            ]
        lines.append("| " + " | ".join(row) + " |")
    lines.append("\n*Note: 'Chapters' includes structural nodes (Root, Sections, Chapters). 'Concepts' are LLM extracted entities.*")
    return "\n".join(lines)

In [72]:
import os
from pathlib import Path

GRAPH_RUNS_DIR = Path("graph_runs")
graph_runs = []

for run_dir in GRAPH_RUNS_DIR.iterdir():
    if run_dir.is_dir():
        nodes_path = run_dir / "nodes.xml"
        relations_path = run_dir / "relations.xml"
        if nodes_path.exists() and relations_path.exists():
            graph_runs.append((run_dir.name, nodes_path, relations_path))
graph_runs

[('claude-opus-4-5_gpt5-1',
  PosixPath('graph_runs/claude-opus-4-5_gpt5-1/nodes.xml'),
  PosixPath('graph_runs/claude-opus-4-5_gpt5-1/relations.xml')),
 ('claude-opus-4-5_claude-opus-4-5',
  PosixPath('graph_runs/claude-opus-4-5_claude-opus-4-5/nodes.xml'),
  PosixPath('graph_runs/claude-opus-4-5_claude-opus-4-5/relations.xml')),
 ('gpt5-1_gpt5-1',
  PosixPath('graph_runs/gpt5-1_gpt5-1/nodes.xml'),
  PosixPath('graph_runs/gpt5-1_gpt5-1/relations.xml')),
 ('gpt5-1_claude-opus-4-5',
  PosixPath('graph_runs/gpt5-1_claude-opus-4-5/nodes.xml'),
  PosixPath('graph_runs/gpt5-1_claude-opus-4-5/relations.xml'))]