## Relatório do Trabalho Final de Inteligência Artificial

**Disciplina:** Inteligência Artificial

**Data:** 18/12/24

**Professors:** Edjard Mota 

**Turma:** EC01 & CB500

**Aluno:** Aline Silva da Cunha          
**Matrícula:** 22250558  

**Aluno:** Lorena Pantoja dos Anjos      
**Matrícula:** 22252592

**Instituição:** Universidade Federal do Amazonas (UFAM)  

**1. Introdução**

Este trabalho final aborda o problema clássico de classificação de trens, utilizando técnicas neuro-simbólicas e algoritmos de clustering. A proposta é implementar soluções baseadas no exemplo do trem de Michalski, que categoriza trens indo para o leste ou oeste com base em suas características. Este problema é um marco em estudos de inteligência artificial por exemplificar a integração de lógica simbólica e aprendizado baseado em dados, oferecendo uma plataforma para explorar como o raciocínio humano pode ser modelado computacionalmente.

A abordagem proposta neste trabalho se desdobra em três etapas principais:

1. Aplicar clustering para agrupar trens com características similares, independente da direção.
2. Gerar axiomas a partir dos clusters e treinar modelos LTN (Logic Tensor Network) para classificação.
3. Comparar os resultados obtidos com modelos existentes e extrair regras explicativas a partir do modelo treinado.

Além disso, este trabalho discute a importância de variáveis booleanas como uma ponte entre a representação lógica e o aprendizado por redes neurais, permitindo que o modelo interprete padrões complexos com maior transparência.

**2. Referencial Teórico**

O problema é inspirado no modelo de aprendizado neuro-simbólico proposto por Artur S. d’Avila Garcez, Krysia B. Broda e Dov M. Gabbay em *Neural-Symbolic Learning Systems Foundation*. Esse modelo busca combinar a capacidade de aprendizado e generalização das redes neurais com a habilidade de representar conhecimento e raciocinar logicamente, característica dos sistemas simbólicos. Essa integração é particularmente útil para problemas que exigem tanto o processamento de dados brutos quanto a aplicação de regras e axiomas previamente conhecidos.

O uso de técnicas neuro-simbólicas é amplamente aplicável em áreas como processamento de linguagem natural, reconhecimento de padrões e sistemas de suporte à decisão. A lógica simbólica permite representar relações complexas de forma explícita, enquanto as redes neurais fornecem a capacidade de lidar com incertezas e variabilidade nos dados.

**3. Metodologia**

### 3.1. Agrupamento e geração de axiomas

Os trens foram agrupados por similaridade utilizando algoritmos de clustering. Para realizar esse agrupamento, foram considerados os seguintes atributos principais:

- **Quantidade de vagões:** valores entre 3 a 5, representando a estrutura básica de cada trem.
- **Quantidade de cargas diferentes:** valores entre 1 a 4, que indicam a diversidade das cargas transportadas.
- **Formato da carroceria do vagão:** incluindo opções como retângulo fechado, retângulo aberto, elipse, hexágono, entre outros.
- **Tipo de carga no vagão:** representado por formas geométricas como círculo, hexágono, retângulo ou triângulo.
- **Adjacência entre vagões:** uma série de variáveis booleanas indicando se tipos específicos de vagões ou cargas estão próximos uns dos outros.

Essas variáveis booleanas, que assumem valores de Verdadeiro (V) ou Falso (F), foram fundamentais para capturar padrões como:
- "Existe um retângulo próximo de um triângulo."
- "Existe um círculo próximo de outro círculo."

A partir dos clusters gerados, foram propostos axiomas lógicos que descrevem as relações observadas. Esses axiomas foram modelados por predicados, como:

- **num\_cars(t, nc):** número de vagões em um trem.
- **shape(t, c, s):** formato da carroceria de um vagão.
- **next\_crc(t, c, x):** se há cargas em círculo adjacentes em vagões consecutivos.
- **next\_hex(t, c, x):** se há cargas em formato hexagonal adjacentes em vagões consecutivos.

Essa etapa permitiu estabelecer uma base formal para o treinamento do modelo LTN, promovendo maior interpretabilidade dos resultados.

### 3.2. Implementação de modelos LTN

A implementação foi realizada utilizando a biblioteca LTNTorch, projetada especificamente para trabalhar com redes neurais que incorporam lógica simbólica. A arquitetura do modelo incluiu sub-redes especializadas, cada uma responsável por modelar um predicado ou relação lógica específica. Essas sub-redes foram então conectadas a uma rede principal, responsável por realizar a classificação final (leste ou oeste).

O conjunto de dados foi dividido da seguinte forma:
- **70% para treinamento:** utilizado para ajustar os pesos e parâmetros das redes.
- **30% para validação:** utilizado para avaliar o desempenho do modelo em dados não vistos.

A taxa de aprendizado e o número de épocas foram ajustados iterativamente para otimizar a performance, sendo observada uma estabilização no aprendizado após aproximadamente 200 épocas.

### 3.3. Extração de regras

Uma vez treinado, o modelo foi utilizado como base para a extração de regras interpretáveis. Para isso, foi implementada uma abordagem baseada em árvores de decisão, que mapeia as decisões da rede neural em representações lógicas explícitas. Isso permitiu identificar padrões como:
- "Se um trem tem vagões curtos e fechados, ele vai para o leste."
- "Se um trem possui mais de dois tipos diferentes de carga, ele segue para o leste."

Essas regras foram validadas em relação aos dados originais, confirmando sua consistência com o comportamento observado nos clusters.

**4. Resultados**

### 4.1. Resultados dos clusters

Os algoritmos de clustering identificaram grupos de trens com características comuns. Alguns padrões identificados incluem:

- Trens com vagões curtos e teto fechado foram frequentemente associados à direção leste.
- Trens com dois vagões ou com vagões de teto irregular tendem a se mover para o oeste.

Os clusters não apenas agruparam os dados de forma coerente, mas também forneceram insights úteis para a formulação de axiomas e a estruturação do modelo LTN.

### 4.2. Desempenho do modelo LTN

Os modelos LTN apresentaram resultados consistentes, com métricas de desempenho como:

- **Acurácia geral:** 87%.
- **Erro em validação:** Apenas 13% dos casos testados apresentaram classificação incorreta.


### 4.3. Extração de regras

As regras extraídas das árvores de decisão confirmaram hipóteses preexistentes, como:

1. Se um trem tem vagões curtos e fechados, ele vai para o leste.
2. Se um trem possui mais de dois tipos diferentes de carga, ele segue para o leste.
3. Trens com vagões de teto irregular geralmente seguem para o oeste.

Essas regras foram comparadas com as teorias descritas no livro *Neural-Symbolic Learning Systems Foundation*, mostrando forte alinhamento com os padrões identificados na literatura. As variáveis booleanas (V/F) desempenharam um papel essencial na formulação e interpretação das regras.

**5. Análise Comparativa**

A implementação foi comparada com abordagens anteriores, como o modelo LTN descrito por Garcez. As regras extraídas demonstraram que o modelo proposto é capaz de capturar padrões relevantes e oferecer uma classificação robusta. A inclusão de novos predicados ampliou a capacidade explicativa do modelo, embora tenha introduzido desafios no treinamento devido ao aumento da complexidade.

**6. Considerações Finais**

Este trabalho destacou o potencial das técnicas neuro-simbólicas na resolução de problemas de classificação complexos. A abordagem combinou algoritmos de clustering para agrupar dados similares e modelos LTN para representar relações lógicas. A extração de regras trouxe clareza ao processo de classificação, permitindo compreender as decisões do modelo. O uso de variáveis booleanas (V/F) revelou-se crucial para capturar relações importantes entre os atributos dos trens.

**7. Referências**


- Craven, M., Shavlik, J. *Extracting Tree-Structured Representations of Trained Networks*. Advances in Neural Information Processing Systems.
- Garcez, A.S., Broda, K.B., Gabbay, D.M. *Neural-Symbolic Learning Systems Foundation*.



