### Instalacao de Bibliotecas

O script utiliza a versao do python 3.12.2

In [2]:
%pip install automathon --upgrade

Note: you may need to restart the kernel to use updated packages.


### Leitura das Palvras

In [3]:
words = []
with open("./resources/commons.txt") as commons:
    while word := commons.readline():
        words.append(word.strip())

### Trie (Arvore de prefixos)

Uma trie ou arvore de prefixos e uma estrutura de dados que armazena cadeias de simbolos de maneira eficiente, pense que voce tem um conjunto de palavras para armazenar como: ['carro', 'carrinho', 'caminhao'] repare que algumas delas tem um mesmo prefixo isso ja te da uma dica que uma boa forma de armazenamento seria algo que guardasse o prefixo uma so vez, vale a pena notar que armazenar as palavras em uma lista tambem pode ser custoso para verificar se uma dada palavra pertence ou nao ao conjunto.

Dito isso veja como uma trie armazenaria aquele conjunto:



```python
type Trie = dict[str, Trie]
def insert(trie: Trie, word: str) -> None:
def search(trie: Trie, prefix: str) -> bool:
```

Vamos discutir abaixo cada um desses metodos.

In [4]:
# Define o tipo Trie para nosso notebook
from typing import NamedTuple

type trie = dict[str, trie] # Aqui definimos apenas o tipo recursivamente
Trie = NamedTuple("Trie", [("root", dict[str, trie])])

#### Trie (Insert Method)


Durante as insercoes podemos ler a cadeia de simbolos da palvra e verificar se a cada simbolo de entrada ja existe uma transicao para ele no nosso estado atual, logo temos dois casos:

- Durante a leitura de simbolos encontramos uma transicao nao mapeada (1)
- Durante a leitura de simbolos todas as transicoes foram mapeadas (2)


In [5]:
def insert(trie: Trie, word: str) -> None:
    """
    O tratamento de transicoes nao mapeadas ocorre com a chamada setdefault(letter, {}),
    se a transicao nao existe (1) ele cria um novo dicionario que vai
    armazenar a trie contendo as transicoes a partir daquela transicao criando um
    novo ramo na trie, caso a transicao exista (2) o ramo criado previamente
    criado e reaproveitado.
    
    Por fim setdefault(".") indica que o node current e 
    folha ou terminal.
    """
    current = trie.root
    for letter in word:
        current = current.setdefault(letter, {})
    current.setdefault(".")

#### Trie (Search Method)

Repare que em uma busca (search) podemos processar uma consulta de prefixos, isto e, de acordo com a definicao que tivemos na disciplina de automatos um prefixo e "qualquer sequencia inicial de simbolos de uma palavra" que tambem inclui a propria palavra, portanto a estrutura de dados trie nos fornece duas informacoes quando executamos uma busca:

- Se uma palvra existe 
- Se um prefixo existe

In [6]:
def search(trie: Trie, prefix: str) -> bool:
    node = trie.root
    for letter in prefix:
        if letter not in node:
            return False
        node = node[letter]
    return '.' in node

### Automatos Finitos Deterministicos (AFD)

Um AFD pode ser reprsentado por uma 5-tupla ordernada da forma (Σ, Q, δ, q0, F), onde:

-  Σ: Conjunto de Simbolos
-  Q: Conjunto de Estados
-  δ: Funcao de Transicao
- q0: Estado Inicial
-  F: Conjunto de Estados Finais

Note que e uma estrutura com um formalismo muito maior quando comparada com a Trie, pois precisamos definir um conjunto alfabeto, a funcao de transicao, o estado inicial, o conjunto de estados e um conjunto de estados finais.

Vamos definir seu tipo abaixo:

In [19]:
# Define todos os tipos necessarios para construcao de um AFD
from dataclasses import dataclass, field

@dataclass 
class AFD: 
    Σ: set[str] = field(default_factory=set)
    Q: set[str] = field(default_factory=set)
    δ: dict[str, dict[str, str]] = field(default_factory=dict)
    q0: str = '0'
    F: set[str] = field(default_factory=set)

#### AFD (Accept Method)

Um automato eh uma estrutura de processamento muito simples, temos apenas uma oeperacao que indica a aceitacao ou nao de uma determinada palavra pertencente a uma determinada linguagem e ela tem a seguinte assinatura:

```python
def accept(afd: AFD, word: str) -> bool
```

Abaixo temos a implementacao dessa operacao, repare que a aceitacao de uma determinada palavra esta condicionada ao processamento de toda a palavra por meio de transicoes disponiveis em __δ__ e o estado de parada pertencer ao __F__ conjunto de estados finais do __AFD__.

In [8]:
def accept(afd: AFD, word: str) -> bool:
    actual = afd.q0
    for symbol in word:
        if symbol in afd.δ[actual]:
            actual = afd.δ[actual][symbol]
        else:
            return False
    return actual in afd.F

#### Construindo um AFD

Abaixo vamos construir um AFD com os principios de construcao de uma Trie.

Perceba que todo item da 5-upla ordenada de um AFD pode ser construido enquanto estamos lendo as palavras de uma dada linguagem, sendo assim o algoritmo de construcao da Trie vai ser adaptado para construcao do nosso AFD.



In [59]:
def build(afd: AFD, language: set[str]) -> None:
    pass

In [60]:
from automathon import DFA

afd = AFD(set(), set(), dict(), '0', set())
build(afd, ['carro', 'carrinho', 'caminhao']) 

aut = DFA(afd.Q, afd.Σ, afd.δ, afd.q0, afd.F)
print(afd.δ)

{0: {}, '0': {'c': '1'}, '1': {'a': '2'}, '2': {'r': '3', 'm': '8'}, '3': {'r': '4', 'i': '8'}, '4': {'o': '5', 'i': '5', 'n': '8'}, '5': {'n': '6', 'h': '8'}, '6': {'h': '7', 'a': '8'}, '7': {'o': '8'}, '8': {}}


In [61]:
aut.view('test')