<h3>Token</h3>
<h4>Analisador Lexico - AFD </h4>

In [7]:
T_KEYWORD = "<keyword %s>"
T_OP = "<op %s>"
T_INT = "<int %s>"
T_STRING = "<string %s>"
T_IDENTIF = "<id %s>"
T_SPECIAL = "<special %s>"
T_PUNCT = "<punct %s>"
T_DOT = "<dot>"
T_CONDITIONAL_OP = "<conditional_op %s>"
T_COMMENT = "<comment>"

class Token():
    def __init__(self, tipo, valor=None):
        self.tipo = tipo
        self.valor = valor

    def __str__(self):
        return f"{self.tipo}({self.valor})" if self.valor else self.tipo

class StopExecution(Exception):
    def _render_traceback_(self):
        pass

def tokenize_line(line, line_number):
    tokens = []
    i = 0
    n = len(line)

    while i < n:
        if line[i].isspace():
            i += 1
        elif line[i] == '#':  # Comment
            tokens.append(T_COMMENT)
            break 
        elif line[i].isalpha():
            start = i
            while i < n and (line[i].isalnum() or line[i] == '_'):
                i += 1
            word = line[start:i]
            if word in ["var", "func", "if", "elif", "else", "return", "object", "init"]:
                tokens.append(Token("T_KEYWORD", word))
            elif word in ["true", "false", "null", "end", "main"]:
                tokens.append(Token("T_SPECIAL", word))
            else:
                tokens.append(Token("T_IDENTIF", word))
        elif line[i].isdigit():
            start = i
            while i < n and line[i].isdigit():
                i += 1
            tokens.append(Token("T_INT", line[start:i]))
        elif line[i] == '"':
            start = i
            i += 1
            while i < n and line[i] != '"':
                i += 1
            if i >= n:
                print(f"Erro: String não fechada na linha {line_number}")
                raise StopExecution
            i += 1
            tokens.append(Token("T_STRING", line[start:i]))
        elif line[i] in "=<>!+-*/":
            start = i
            i += 1
            if i < n and line[i] == "=":
                i += 1
            tokens.append(Token("T_OP", line[start:i]))
        elif line[i] in "(),[]{}":
            tokens.append(Token("T_PUNCT", line[i]))
            i += 1
        elif line[i] in "?:":
            tokens.append(Token("T_CONDITIONAL_OP", line[i]))
            i += 1
        elif line[i] == '.':
            tokens.append(Token("T_DOT"))
            i += 1
        else:
            print(f"Erro: Caractere não reconhecido '{line[i]}' na linha {line_number}")
            raise StopExecution
    return tokens

def tokenize():

    try:
        token_total = [];
        with open('codigo.x', 'r') as f:
            lines = f.read().splitlines()

        line_number = 0
        for line in lines:
            line_number += 1
            tokens = tokenize_line(line, line_number)
            token_total.extend(tokens)
            #print(tokens)

        return token_total

    except StopExecution:
        print("Execução parada devido a erro.")

<h3>Analisador Sinatico - Parser </h3>

In [8]:
class Token():
    def __init__(self, tipo, valor=None):
        self.tipo = tipo
        self.valor = valor

    def __str__(self):
        return f"{self.tipo}({self.valor})" if self.valor else self.tipo

class Parser():
    def __init__(self, tokens):
        self.tokens = [Token(t.split(" ")[0], t.split(" ")[1] if len(t.split(" ")) > 1 else None) for t in tokens]
        self.pos = -1
        self.token_atual = None
        self.symbol_table = {}
        self.proximo()

    def proximo(self):
        self.pos += 1
        
        if self.pos >= len(self.tokens):
            self.token_atual = Token("EOF")
        else:    
            self.token_atual = self.tokens[self.pos]

        print(self.token_atual)
        return self.token_atual

    def erro(self):
        raise Exception('Erro de sintaxe. %s' % (self.token_atual))

    def use(self, tipo, valor=None):
        if self.token_atual.tipo != tipo:
            self.erro()
        elif valor is not None and self.token_atual.valor != valor:
            self.erro()
        else:
            self.proximo()

    def expression(self):
        return self.term()

    def term(self):
        return self.factor()

    def factor(self):
        if self.token_atual.tipo == "T_INT":
            value = int(self.token_atual.valor)
            self.use("T_INT")
            return value
        elif self.token_atual.tipo == "T_IDENTIF":
            value = self.token_atual.valor
            self.use("T_IDENTIF")
            return value
        elif self.token_atual.tipo == "T_PUNCT" and self.token_atual.valor == "(":
            self.use("T_PUNCT", "(")
            value = self.expression()
            self.use("T_PUNCT", ")")
            return value
        # ... adicione mais cláusulas aqui para outros tipos de fatores, como variáveis ou chamadas de funções

    def statement(self):
        if self.token_atual.tipo == "T_IDENTIF":
            self.assignment_statement()
        elif self.token_atual.tipo == "T_KEYWORD" and self.token_atual.valor in ["if", "elif", "else"]:
            self.conditional_statement()
        elif self.token_atual.tipo == "T_KEYWORD" and self.token_atual.valor in ["for", "while"]:
            self.loop_statement()
        elif self.token_atual.tipo == "T_KEYWORD" and self.token_atual.valor == "func":
            self.function_definition()
        elif self.token_atual.tipo == "T_KEYWORD" and self.token_atual.valor == "object":
            self.object_definition()
        # TODO: Adicione outros tipos de instruções conforme sua gramática

    def assignment_statement(self):
        var_name = self.token_atual.valor
        self.use("T_IDENTIF")
        self.use("T_OP", "=")
        value = self.expression()  # Chamar a função de análise de expressão aqui
        self.use("T_PUNCT", ";")
        self.symbol_table[var_name] = value

    def conditional_statement(self):
        if self.token_atual.valor == "if":
            self.use("T_KEYWORD", "if")
            self.use("T_PUNCT", "(")
            self.expression()  # Chamar a função de análise de expressão aqui
            self.use("T_PUNCT", ")")
            self.statement()
        elif self.token_atual.valor == "elif":
            self.use("T_KEYWORD", "elif")
            self.use("T_PUNCT", "(")
            self.expression()
            self.use("T_PUNCT", ")")
            self.statement()
        elif self.token_atual.valor == "else":
            self.use("T_KEYWORD", "else")
            self.statement()

    def loop_statement(self):
        # Implemente as instruções de loop (como for e while) aqui

    def function_definition(self):
        # Implemente a definição de função aqui

    def object_definition(self):
        # Implemente a definição do objeto aqui

    def start(self):
        # A função start deve ser o ponto de entrada para iniciar o parser
        # Você deve implementar o fluxo de controle principal aqui


<h3>Compilador</h3>

In [11]:
def main():
    filename = 'codigo.x'
    print(f"Lendo o arquivo {filename}...")

    # Tokenização
    print("\nTokenização:")
    tokens = tokenize()
    
    # Análise Sintática (Parser)
    print("\nAnálise Sintática:")
    parser = Parser(tokens)
    try:
        parser.start()
        print("Análise sintática concluída com sucesso!")
    except Exception as e:
        print(f"Erro no parser: {e}")

    states = {
        'tokens': tokens,
        'symbol_table': parser.symbol_table
    }
    print("\nEstados salvos:", states)

if __name__ == '__main__':
    main()

Lendo o arquivo codigo.x...

Tokenização:

Análise Sintática:


NameError: name 'Token' is not defined