# Analisador Sintático Baseado em Autômatos Finitos - Parte 1: Introdução

In [1]:
# Importar bibliotecas necessárias
import sys
import os
from IPython.display import Image, display
from IPython.core.display import HTML

# Adicionar o diretório atual ao path para importar os módulos
sys.path.append('.')

## 1. Conceitos Teóricos

### 1.1 Autômatos Finitos

Os estados representam diferentes estágios da análise sintática
Os símbolos são as funções sintáticas (sujeito, verbo, objeto, etc)
As transições definem sequências válidas de funções sintáticas
O estado inicial é o ponto de partida da análise
O estado final indica que a frase foi analisada com sucesso

### 1.2 Análise Sintática

A análise sintática é o processo de analisar uma frase para determinar sua estrutura gramatical. Envolve:

1. **Tokenização**
2. **Classificação**
3. **Mapeamento sintático**
4. **Validação**

## 2. Arquitetura do Sistema

O sistema é composto por vários módulos:

1. **grammar.py**: Define as categorias gramaticais e estruturas sintáticas válidas
2. **automaton.py**: Implementa a estrutura do autômato finito
3. **syntactic_analyzer.py**: Implementa o analisador sintático usando o autômato
4. **visualize_automaton.py**: Gera visualizações do autômato
5. **automaton_gui.py**: Fornece uma interface gráfica para o analisador

In [4]:
# Importar os módulos
from grammar import CATEGORIES, VALID_STRUCTURES
from automaton import FiniteAutomaton
from syntactic_analyzer import SyntacticAnalyzer

# Exibir as categorias gramaticais disponíveis
print("Categorias gramaticais disponíveis:")
for category, words in CATEGORIES.items():
    print(f"- {category}: {len(words)} palavras")

Categorias gramaticais disponíveis:
- ARTIGO: 8 palavras
- PRONOME: 41 palavras
- SUBSTANTIVO: 47 palavras
- VERBO: 122 palavras
- ADJETIVO: 71 palavras
- PREPOSICAO: 22 palavras
- PONTUACAO: 6 palavras
- CONJUNCAO: 10 palavras
- ADVERBIO: 25 palavras


## 3. Fluxo de Processamento

O fluxo de processamento do analisador sintático segue estas etapas:

1. **Entrada**: Uma frase em português brasileiro
2. **Tokenização**: A frase é dividida em tokens (palavras e pontuação)
3. **Classificação Gramatical**: Cada token é classificado em uma categoria gramatical (substantivo, verbo, etc.)
4. **Mapeamento Sintático**: Cada token recebe uma função sintática (sujeito, verbo, objeto, etc.)
5. **Processamento pelo Autômato**: A sequência de funções sintáticas é processada pelo autômato
6. **Validação**: O autômato verifica se a sequência forma uma estrutura sintática válida
7. **Saída**: O resultado da análise, incluindo as funções sintáticas e a validação

Este fluxo é implementado principalmente no método `analyze_sentence` da classe `SyntacticAnalyzer`.

In [5]:
# Criar um analisador sintático
analyzer = SyntacticAnalyzer()

# Analisar uma frase simples
frase = "O gato come o peixe."
is_valid, syntactic_tokens, path = analyzer.analyze_sentence(frase)

print(f"Frase: '{frase}'")
print(f"Estrutura sintática válida: {is_valid}\n")

print("Tokens e funções sintáticas:")
for token, category, function in syntactic_tokens:
    print(f"  - '{token}': {category} → {function}")

Frase: 'O gato come o peixe.'
Estrutura sintática válida: True

Tokens e funções sintáticas:
  - 'o': ARTIGO → DET_SUJEITO
  - 'gato': SUBSTANTIVO → SUJEITO
  - 'come': VERBO → VERBO
  - 'o': ARTIGO → DET_OBJETO
  - 'peixe': SUBSTANTIVO → OBJETO
  - '.': PONTUACAO → PONTUACAO
