# Definição do projeto de pesquisa

Vamos explorar algumas possibilidades de temas, que se encaixem com o Skill Tree Project.

## Estruturação da árvore de habilidades

JSON, por si só, é um formato orientado a árvore – ou seja, ele pressupõe uma estrutura hierárquica em que cada nó tem um único pai. Quando você precisa representar uma estrutura onde nós de ramos distintos se unem novamente (ou seja, quando há múltiplos pais para um mesmo nó), estamos tratando de um grafo (mais especificamente, um grafo acíclico dirigido – DAG) e não de uma árvore propriamente dita.

##### Por que o JSON padrão não é ideal para esse modelo

- **Estrutura Hierárquica:**  
  JSON foi projetado para representar dados de forma hierárquica, onde cada elemento aninhado aparece apenas uma vez dentro de seu contexto de pai. Se dois ramos convergirem em um mesmo nó, isso implica que esse nó teria dois pais – o que foge à estrutura de árvore tradicional.

- **Referências e Reutilização:**  
  Embora seja possível “simular” essa união utilizando referências (por exemplo, com JSON Reference ou JSON Pointer), essa abordagem não é inerente ao formato e adiciona complexidade ao processamento e à interpretação dos dados.

##### Modelos mais adequados para representar essa estrutura

Para representar grafos (ou árvores com nós compartilhados), alguns modelos e formatos são mais indicados:

- **GraphSON:**  
  Um formato JSON desenvolvido como parte do ecossistema Apache TinkerPop, projetado especificamente para representar grafos. Ele permite expressar nós, arestas e propriedades, suportando grafos onde nós podem ter múltiplos pais.

- **JSON-LD:**  
  Um formato baseado em JSON para Linked Data que permite representar relações entre recursos. Por meio de identificadores únicos (@id), ele pode expressar conexões que vão além de uma estrutura hierárquica simples, representando efetivamente um grafo.

- **Outros Modelos de Grafo:**  
  Alternativamente, formatos como GraphML ou GraphSON (já mencionado) são utilizados para representar estruturas de grafos de forma nativa. Em ambientes que requerem manipulação de grafos, bancos de dados de grafos (como Neo4j) e linguagens de consulta para grafos podem ser mais apropriados.

### Grafo Acíclico Direcionado (DAG)
Um DAG é um grafo direcionado que não contém ciclos. Isso significa:

Grafo Direcionado: As arestas têm uma direção, indo de um nó (vértice) para outro.

Acíclico: Não há caminhos que comecem e terminem no mesmo nó, ou seja, não há loops.

## Artigos

- [DART-LLM: Dependency-Aware Multi-Robot Task Decomposition and
Execution using Large Language Models](https://www.semanticscholar.org/reader/4dd9e7343ccf50e859d1829d62535d19b820b2d3)

Propõe a estruturação de tarefas e subtarefas a partir de um input textual utilizando LLM. É aplicado na área de robótica.

- [Language Models are Few-Shot Learners](https://arxiv.org/pdf/2005.14165)

Mostra como podemos fazer um fine tunning de um LLM para realizar uma tarefa específica.

## Palavras chave

- Nós compartilhados
- GraphSON, JSON‑LD
- Grafo Acíclico Direcionado (DAG)

# Candidatos para projeto

## "Geração Automatizada de Grafos Acíclicos Direcionados (DAGs) para Estruturação de Conhecimento via Modelos de Linguagem de Grande Escala (LLMs"

Descrição Detalhada:
Este trabalho focará no desenvolvimento de um sistema automatizado que utiliza LLMs para transformar prompts textuais (ex.: descrições de projetos, requisitos técnicos) em grafos acíclicos direcionados (DAGs) que representem hierarquias de habilidades, dependências entre tarefas ou fluxos de conhecimento em Engenharia. O DAG será gerado a partir da análise semântica do texto, utilizando técnicas de Text Mining para extrair entidades (nós) e relações (arestas direcionadas), garantindo a ausência de ciclos e a coerência lógica. A validação do grafo será feita por meio de simulações numéricas (inspiradas em PINNs) e análise de sentimentos para avaliar a confiabilidade das conexões identificadas. Para escalabilidade, o sistema integrará HPC para processar grandes volumes de dados e otimizar a inferência de LLMs.

## "Geração Automatizada de Grafos Acíclicos Direcionados (DAGs) para Estruturação de Conhecimento via Modelos de Linguagem de Grande Escala (LLMs"


Este trabalho focará no desenvolvimento de um sistema automatizado que utiliza LLMs para desenvolver grafos acíclicos direcionados (DAGs) a partir de prompts textuais (ex.: descrições de projetos, habilidades a serem desenvolvidas). Os grafos deverão representar hiearquias de habilidades ou tarefas e suas respectivas dependências de forma acíclica, garantindo a sequência lógica da informação. 