Refinamento (melhorias e otimizações)

In [1]:
import time

# Simulando um compilador simples com otimizações

# Analisador Léxico (Versão simples e otimizada)
def analisador_lexico(codigo):
    tokens = []
    i = 0
    while i < len(codigo):
        char = codigo[i]

        if char.isdigit():  # Se for um número
            num = ''
            while i < len(codigo) and codigo[i].isdigit():
                num += codigo[i]
                i += 1
            tokens.append(('NUMBER', num))
        elif char == '+':
            tokens.append(('PLUS', char))
            i += 1
        elif char == '*':
            tokens.append(('TIMES', char))
            i += 1
        elif char == '(':
            tokens.append(('LPAREN', char))
            i += 1
        elif char == ')':
            tokens.append(('RPAREN', char))
            i += 1
        elif char == ' ':
            i += 1
        else:
            raise SyntaxError(f"Caractere inválido: {char}")

    tokens.append(('EOF', ''))  # Fim do código
    return tokens

# Exemplo de entrada
entrada = '3 + 5 * 2'

# Medindo o tempo de execução da versão otimizada
start_time = time.time()
tokens = analisador_lexico(entrada)
end_time = time.time()

print(f"Tokens: {tokens}")
print(f"Tempo de execução: {end_time - start_time:.6f} segundos")


Tokens: [('NUMBER', '3'), ('PLUS', '+'), ('NUMBER', '5'), ('TIMES', '*'), ('NUMBER', '2'), ('EOF', '')]
Tempo de execução: 0.000098 segundos


Depuração sistemática do compilador

In [2]:
# Função de depuração no analisador léxico

def analisador_lexico(codigo):
    tokens = []
    i = 0
    while i < len(codigo):
        char = codigo[i]

        print(f"Analisando o caractere: {char}")  # Log de depuração

        if char.isdigit():
            num = ''
            while i < len(codigo) and codigo[i].isdigit():
                num += codigo[i]
                i += 1
            tokens.append(('NUMBER', num))
            print(f"Token gerado: NUMBER({num})")
        elif char == '+':
            tokens.append(('PLUS', char))
            i += 1
            print(f"Token gerado: PLUS(+)")
        elif char == '*':
            tokens.append(('TIMES', char))
            i += 1
            print(f"Token gerado: TIMES(*)")
        elif char == '(':
            tokens.append(('LPAREN', char))
            i += 1
            print(f"Token gerado: LPAREN(()")
        elif char == ')':
            tokens.append(('RPAREN', char))
            i += 1
            print(f"Token gerado: RPAREN())")
        elif char == ' ':
            i += 1
        else:
            raise SyntaxError(f"Caractere inválido: {char}")

    tokens.append(('EOF', ''))  # Fim do código
    return tokens

# Exemplo de entrada com depuração
entrada = '3 + 5 * 2'

tokens = analisador_lexico(entrada)
print(f"Tokens gerados: {tokens}")


Analisando o caractere: 3
Token gerado: NUMBER(3)
Analisando o caractere:  
Analisando o caractere: +
Token gerado: PLUS(+)
Analisando o caractere:  
Analisando o caractere: 5
Token gerado: NUMBER(5)
Analisando o caractere:  
Analisando o caractere: *
Token gerado: TIMES(*)
Analisando o caractere:  
Analisando o caractere: 2
Token gerado: NUMBER(2)
Tokens gerados: [('NUMBER', '3'), ('PLUS', '+'), ('NUMBER', '5'), ('TIMES', '*'), ('NUMBER', '2'), ('EOF', '')]


Interface final (CLI simples) e argumentos

In [6]:
import argparse

# Função de análise léxica simples
def analisador_lexico(codigo):
    tokens = []
    i = 0
    while i < len(codigo):
        char = codigo[i]
        if char.isdigit():
            num = ''
            while i < len(codigo) and codigo[i].isdigit():
                num += codigo[i]
                i += 1
            tokens.append(('NUMBER', num))
        elif char == '+':
            tokens.append(('PLUS', char))
            i += 1
        elif char == '*':
            tokens.append(('TIMES', char))
            i += 1
        elif char == '(':
            tokens.append(('LPAREN', char))
            i += 1
        elif char == ')':
            tokens.append(('RPAREN', char))
            i += 1
        elif char == ' ':
            i += 1
        else:
            raise SyntaxError(f"Caractere inválido: {char}")

    tokens.append(('EOF', ''))  # Fim do código
    return tokens

# Função para simular a execução com argumentos via linha de comando
def main(codigo):
    print(f"Código fonte a ser compilado: {codigo}")
    tokens = analisador_lexico(codigo)
    print(f"Tokens gerados: {tokens}")

# Simulação dos argumentos no Google Colab
entrada = '3 + 5 * 2'  # Exemplo de código fornecido como entrada
main(entrada)


Código fonte a ser compilado: 3 + 5 * 2
Tokens gerados: [('NUMBER', '3'), ('PLUS', '+'), ('NUMBER', '5'), ('TIMES', '*'), ('NUMBER', '2'), ('EOF', '')]


Testes de validação

In [4]:
import pytest

# Função de análise léxica
def analisador_lexico(codigo):
    tokens = []
    i = 0
    while i < len(codigo):
        char = codigo[i]
        if char.isdigit():
            num = ''
            while i < len(codigo) and codigo[i].isdigit():
                num += codigo[i]
                i += 1
            tokens.append(('NUMBER', num))
        elif char == '+':
            tokens.append(('PLUS', char))
            i += 1
        elif char == '*':
            tokens.append(('TIMES', char))
            i += 1
        elif char == '(':
            tokens.append(('LPAREN', char))
            i += 1
        elif char == ')':
            tokens.append(('RPAREN', char))
            i += 1
        elif char == ' ':
            i += 1
        else:
            raise SyntaxError(f"Caractere inválido: {char}")

    tokens.append(('EOF', ''))  # Fim do código
    return tokens

# Testes de validação com pytest
def test_analisador_lexico():
    assert analisador_lexico('3 + 5 * 2') == [('NUMBER', '3'), ('PLUS', '+'), ('NUMBER', '5'), ('TIMES', '*'), ('NUMBER', '2'), ('EOF', '')]
    assert analisador_lexico('10 + 20') == [('NUMBER', '10'), ('PLUS', '+'), ('NUMBER', '20'), ('EOF', '')]

# Executando os testes
pytest.main()


ERROR: usage: colab_kernel_launcher.py [options] [file_or_dir] [file_or_dir] [...]
colab_kernel_launcher.py: error: unrecognized arguments: -f
  inifile: None
  rootdir: /root/.local/share/jupyter/runtime



<ExitCode.USAGE_ERROR: 4>