<a href="https://colab.research.google.com/github/alessandroholiver/AulasPython/blob/main/TinyPyLexama.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [12]:
# CONSTANTES PARA OS TOKENS

#COMANDOS
WRITE = "WRITE"
PROGRAM =  "PROGRAM"
READ = "READ" 
BEGIN = "BEGIN"
END = "END"


#ESTRUTURAS DE REPETIÇÃO E CONDICIONAIS
IF = "IF"
ELSEIF = "ELSEIF"
ELSE = "ELSE"
FOR = "FOR"
WHILE = "WHILE"
DO = "DO"
AND = "AND"
OR = "OR"

#VARIAVEIS  
VARIAVEL = "VARIAVEL"
STRING = "STRING"
NUMERO = "NUMERO"

#COMANDOS SECUNDARIOS 
PONTO_VIRGULA = "PONTO_VIRGULA"
COMENTARIO_LINHA = "COMENTARIO_LINHA"
ABRE_PARENTESE = "ABRE_PARENTESE"
FECHA_PARENTESE = "FECHA_PARENTESE"


#OPERADORES LÓGICOS, ARITMÉTICOS, RELACIONAIS E ATRIBUIÇÃO
OPERADOR_ADICAO = "OPERADOR_ADIÇÃO"
OPERADOR_MULTIPLICACAO = "OPERADOR_MULTIPLICAÇÃO"
OPERADOR_SUBTRACAO = "OPERADOR_SUBTRAÇÃO"
OPERADOR_DIVISAO = "OPERADOR_DIVISÃO"
ATRIBUICAO = "ATRIBUICAO"
ATRIBUICAO_ADICAO = "ATRIBUICAO_ADICAO"
DESATRIBUICAO_SUBTRACAO = "DESATRIBUICAO_SUBTRACAO"
INCREMENTAR = "INCREMENTAR"
DECREMENTAR = "DECREMENTAR"
IGUAL_A = "IGUAL_A"
DIFERENTE_DE = "DIFERENTE_DE"
MENOR = "MENOR"
MAIOR = "MAIOR"
MENOR_IGUAL = "MENOR_IGUAL"
MAIOR_IGUAL = "MAIOR_IGUAL"


In [2]:
def listar_alfabeto():
  # devolve todos os caracteres do alfabeto
  return [chr(i) for i in range(ord('0'),ord('9')+1)]

listar_alfabeto()

['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']

In [3]:
class Estado:
  """
  Classe que representa um estado do analisador léxico
  """

  def __init__(self, nome, eh_final=False, codigo_token=-1, estado_variavel=None):
    """
    Construtor
    ----------

    Parâmetros:

    nome: nome do estado

    eh_final: indica se o estado é estado final (default=False)

    codigo_token: código do token para ser utilizado no analisador sintático

    estado_variavel: estado cujo propósito é tratar nome de variáveis
      caso não esteja tratando de palavras reservadas

    """
    self.nome = nome
    self.eh_final = eh_final
    self.codigo_token = codigo_token
    self.lista_transicoes = []
    self.estado_variavel = estado_variavel

  def adicionar_transicao(self, simbolos, proximo_estado):
    """
    Adiciona uma transição ao estado
    ----------

    Parâmetros:

    simbolos: símbolos que o estado aceita para realizar a transição

    proximo_estado: próximo estado caso a transição feita
    """
    transicao = {
        'simbolos':simbolos,
        'proximo_estado':proximo_estado
    }
    self.lista_transicoes.append(transicao)

  def realizar_transicao(self, simbolo):
    """
    Realiza a transição de fato
    ----------

    Parâmetros:
    simbolo: símbolo que o estado analisará para realizar
             ou não a transição (pode gerar uma exception caso
             o símbolo não seja aceito pelo estado)

    """
    for t in self.lista_transicoes:
      # se o símbolo for aceito pela transição
      if simbolo in t['simbolos']:
        # retorna o próximo estado
        return t['proximo_estado']


    # pode ser que aqui se trate de uma variável,
    # portanto é importante dar uma segunda chance...
    # TODO: depois tem que rever este ponto!
    if self.estado_variavel is not None:
      return self.estado_variavel
        
    # Aqui é no caso do símbolo não ser aceito por nenhuma transição
    # do estado
    return None
    
  def get_nome(self):
    """
    Você sabe o que esse método faz...
    """
    return self.nome

  def get_eh_final(self):
    """
    Você sabe o que esse método faz...
    """
    return self.eh_final

  def get_codigo_token(self):
    return self.codigo_token
    


In [4]:

class AnalisadorLexico:
  """
  Analisador Lexico da linguagem TinyPy
  """

  def __init__(self, codigo):
    """
    Construtor
    ----------

    Parâmetros:
    codigo: código fonte que será analisado 
            pelo analisador léxico
    """
    self.codigo = codigo
    # o estado inicial vai ser configurado no método
    # __configurar_analisador_lexico
    self.estado_inicial = None

    # posicao atual no código fonte
    self.posicao_atual = 0

    # É aqui que a mágica acontece!!!
    self.__configurar_analisador_lexico() 
  
  def __configurar_analisador_lexico(self):
    """
    Realiza a configuração do analisador léxico,
    ou seja, cria o AFD
    """

    # a completar....
    lista_fim_token = ["\n", "\t", " ", "(", ")", ";", '"']


    # Configurando para variáveis (antecede o estado inicial)
    # TODO: deixar esse código mais bonito...
    s1000 = Estado("S1000")
    letra_minusculas = [ 'a',  'b',  'c',  'd',  'e',  'f',  'g',  'h',
    'i',  'j',  'k',  'l',  'm',  'n',  'o',  'p',  'q',  'r',  's',  't',
    'u',  'v',  'w',  'x',  'y',  'z']
    s1001 = Estado("S1001")
    s1000.adicionar_transicao(letra_minusculas, s1001)
    letras_ou_numeros = [ 'a',  'b',  'c',  'd',  'e',  'f',  'g',  'h',
    'i',  'j',  'k',  'l',  'm',  'n',  'o',  'p',  'q',  'r',  's',  't',
    'u',  'v',  'w',  'x',  'y',  'z',   'A',  'B',  'C',  'D',  'E',  'F',
    'G',  'H',  'I',  'J',  'K',  'L',  'M',  'N',  'O',  'P',  'Q',  'R',  'S',
    'T',  'U',  'V',  'W',  'X',  'Y',  'Z',  '0', '1', '2', '3', '4', '5', 
    '6', '7', '8', '9']
    s1001.adicionar_transicao(letras_ou_numeros, s1001)
    s1002 = Estado("S1002", eh_final=True, codigo_token=VARIAVEL)
    s1001.adicionar_transicao(lista_fim_token, s1002)
    s1000.adicionar_transicao(lista_fim_token, s1002)

    # Configurando o estado inicial
    s0 = Estado("S0", estado_variavel=s1000)
    s0.adicionar_transicao(["\n", "\t", " "], s0)
    self.estado_inicial = s0

    #----------------------CONFIGURACAO DOS COMANDOS------------------------

    # configurando para a palavra write
    s1 = Estado("S1", estado_variavel=s1001)
    s0.adicionar_transicao(["w"], s1)
    s2 = Estado("S2", estado_variavel=s1001)
    s1.adicionar_transicao(["r"], s2)
    s3 = Estado("S3", estado_variavel=s1001)
    s2.adicionar_transicao(["i"], s3)
    s4 = Estado("S4", estado_variavel=s1001)
    s3.adicionar_transicao(["t"], s4)
    s5 = Estado("S5", estado_variavel=s1001)
    s4.adicionar_transicao(["e"], s5)
    s6 = Estado("S6", eh_final=True, codigo_token=WRITE, estado_variavel=s1001)
    s5.adicionar_transicao(lista_fim_token, s6)

    # configurando para a palavra read
    s28 = Estado("S28", estado_variavel=s1001)
    s0.adicionar_transicao(["r"], s28)
    s29 = Estado("S29", estado_variavel=s1001)
    s28.adicionar_transicao(["e"], s29)
    s30 = Estado("S30", estado_variavel=s1001)
    s29.adicionar_transicao(["a"], s30)
    s31 = Estado("S31", estado_variavel=s1001)
    s30.adicionar_transicao(["d"], s31)
    s32 = Estado("S32", eh_final=True, codigo_token=READ, estado_variavel=s1001)
    s31.adicionar_transicao(lista_fim_token, s32)

     # configurando para a palavra end
    s33 = Estado("S33", estado_variavel=s1001)
    s0.adicionar_transicao(["e"], s33)
    s34 = Estado("S34", estado_variavel=s1001)
    s33.adicionar_transicao(["n"], s34)
    s35 = Estado("S35", estado_variavel=s1001)
    s34.adicionar_transicao(["d"], s35)
    s36 = Estado("S36", eh_final=True, codigo_token=END, estado_variavel=s1001)   
    s35.adicionar_transicao(lista_fim_token, s36)

     # configurando para a palavra begin
    s37 = Estado("S37", estado_variavel=s1001)
    s0.adicionar_transicao(["b"], s37)
    s38 = Estado("S38", estado_variavel=s1001)
    s37.adicionar_transicao(["e"], s38)
    s39 = Estado("S39", estado_variavel=s1001)
    s38.adicionar_transicao(["g"], s39)
    s40 = Estado("S40",estado_variavel=s1001)
    s39.adicionar_transicao(["i"], s40)
    s41 = Estado("S41",estado_variavel=s1001)
    s40.adicionar_transicao(["n"], s41)
    s42 = Estado("S42", eh_final=True, codigo_token=BEGIN, estado_variavel=s1001)   
    s41.adicionar_transicao(lista_fim_token, s42)

    # configurando para a palavra program
    s43 = Estado("S43", estado_variavel=s1001)
    s0.adicionar_transicao(["p"], s43)
    s44 = Estado("S44", estado_variavel=s1001)
    s43.adicionar_transicao(["r"], s44)
    s45 = Estado("S45", estado_variavel=s1001)
    s44.adicionar_transicao(["o"], s45)
    s46 = Estado("S46",estado_variavel=s1001)
    s45.adicionar_transicao(["g"], s46)
    s47 = Estado("S47",estado_variavel=s1001)
    s46.adicionar_transicao(["r"], s47)
    s48 = Estado("S48",estado_variavel=s1001)
    s47.adicionar_transicao(["a"], s48)
    s49 = Estado("S49",estado_variavel=s1001)
    s48.adicionar_transicao(["m"], s49)
    s50 = Estado("S50", eh_final=True, codigo_token=PROGRAM, estado_variavel=s1001)   
    s49.adicionar_transicao(lista_fim_token, s50)


    # configurando para a palavra while
    s51 = Estado("S51", estado_variavel=s1001)
    s1.adicionar_transicao(["h"], s51)
    s52 = Estado("S52", estado_variavel=s1001)
    s51.adicionar_transicao(["i"], s52)
    s53 = Estado("S53", estado_variavel=s1001)
    s52.adicionar_transicao(["l"], s53)
    s54 = Estado("S54", estado_variavel=s1001)
    s53.adicionar_transicao(["e"], s54)
    s55 = Estado("S55", eh_final=True, codigo_token=WHILE, estado_variavel=s1001)
    s54.adicionar_transicao(lista_fim_token, s55)

     # configurando para a palavra if
    s56 = Estado("S56", estado_variavel=s1001)
    s0.adicionar_transicao(["i"], s56)
    s57 = Estado("S57", estado_variavel=s1001)
    s56.adicionar_transicao(["f"], s57)
    s58 = Estado("S58", eh_final=True, codigo_token=IF, estado_variavel=s1001)
    s57.adicionar_transicao(lista_fim_token, s58)

    # configurando para a palavra else
    s60 = Estado("S60", estado_variavel=s1001)
    s33.adicionar_transicao(["l"], s60)
    s61 = Estado("S61", estado_variavel=s1001)
    s60.adicionar_transicao(["s"], s61)
    s62 = Estado("S62", estado_variavel=s1001)
    s61.adicionar_transicao(["e"], s62)   
    s63 = Estado("S63", eh_final=True, codigo_token=ELSE, estado_variavel=s1001)
    s62.adicionar_transicao(lista_fim_token, s63)

    # configurando para a palavra elseif
    s101 = Estado("S101",estado_variavel=s1001)
    s62.adicionar_transicao("i", s101)
    s102 = Estado("S102",estado_variavel=s1001)
    s101.adicionar_transicao("f", s102)
    s103 = Estado("S103", eh_final=True, codigo_token=ELSEIF, estado_variavel=s1001)
    s102.adicionar_transicao(lista_fim_token, s103)
    
    
     # configurando para a palavra for
    s64 = Estado("S64", estado_variavel=s1001)
    s0.adicionar_transicao(["f"], s64)
    s65 = Estado("S65", estado_variavel=s1001)
    s64.adicionar_transicao(["o"], s65)
    s66 = Estado("S66", estado_variavel=s1001)
    s65.adicionar_transicao(["r"], s66)
    s67 = Estado("S67", eh_final=True, codigo_token=FOR, estado_variavel=s1001)   
    s66.adicionar_transicao(lista_fim_token, s67)

     # configurando para a palavra do
    s68 = Estado("S68", estado_variavel=s1001)
    s0.adicionar_transicao(["d"], s68)
    s69 = Estado("S69", estado_variavel=s1001)
    s68.adicionar_transicao(["o"], s69)
    s70 = Estado("S70", eh_final=True, codigo_token=DO, estado_variavel=s1001)
    s69.adicionar_transicao(lista_fim_token, s70)


   #------------------------------COMANDOS SECUNDARIOS---------------------
   
    # configurar para abrir parenteses
    s7 = Estado("S7")
    s0.adicionar_transicao(["("], s7)
    s8 = Estado("S8", eh_final=True, codigo_token=ABRE_PARENTESE)
    s7.adicionar_transicao(lista_fim_token+['0', '1', '2', '3', '4', '5', 
      '6', '7', '8', '9'], s8)

    # configurar para fechar parenteses
    s9 = Estado("S9")
    s0.adicionar_transicao([")"], s9)
    s10 = Estado("S10", eh_final=True, codigo_token=FECHA_PARENTESE)
    s9.adicionar_transicao(lista_fim_token+['0', '1', '2', '3', '4', '5', 
      '6', '7', '8', '9'], s10)

    # configurar para strings
    s11 = Estado("S11")
    s0.adicionar_transicao(['"'], s11)
    # lista de caracteres que aceita em uma string
    lista_caracteres_string = [ 'a',  'b',  'c',  'd',  'e',  'f',  'g',  'h',
    'i',  'j',  'k',  'l',  'm',  'n',  'o',  'p',  'q',  'r',  's',  't',
    'u',  'v',  'w',  'x',  'y',  'z',   'A',  'B',  'C',  'D',  'E',  'F',
    'G',  'H',  'I',  'J',  'K',  'L',  'M',  'N',  'O',  'P',  'Q',  'R',  'S',
    'T',  'U',  'V',  'W',  'X',  'Y',  'Z',  '0', '1', '2', '3', '4', '5', 
    '6', '7', '8', '9', ',', ';', ' ', '_', '?', '!', '.', '\t']
    s11.adicionar_transicao(lista_caracteres_string, s11)
    s12 = Estado("S12")
    s11.adicionar_transicao(['"'], s12)
    s13 = Estado("S13", eh_final=True, codigo_token=STRING)
    s12.adicionar_transicao(lista_fim_token, s13)

    # configurar para ponto e virgula
    s14 = Estado("S14")
    s0.adicionar_transicao([";"], s14)
    s15 = Estado("S15", eh_final=True, codigo_token=PONTO_VIRGULA)
    s14.adicionar_transicao(lista_fim_token, s15)

    # configurar para comentário de linha
    s16 = Estado("S16")
    s0.adicionar_transicao(["/"], s16)
    s17 = Estado("S17")
    s16.adicionar_transicao(["/"], s17)
    s17.adicionar_transicao(lista_caracteres_string, s17)
    s18 = Estado("S18", eh_final=True, codigo_token=COMENTARIO_LINHA)
    s17.adicionar_transicao(["\n"], s18)

    # Configurar para número
    s19 = Estado("S19")
    lista_digitos = ['0', '1', '2', '3', '4', '5',  '6', '7', '8', '9']
    s0.adicionar_transicao(lista_digitos, s19)
    s19.adicionar_transicao(lista_digitos, s19)
    s20 = Estado("S20")
    s19.adicionar_transicao(["."], s20)
    s20.adicionar_transicao(lista_digitos, s20)
    s21 = Estado("S21", eh_final=True, codigo_token=NUMERO)
    s19.adicionar_transicao(lista_fim_token, s21)    
    s20.adicionar_transicao(lista_fim_token, s21)


   #------------------------------COMANDOS OPERADORES---------------------
    # Configurar operador +
    s22 = Estado("S22")
    s0.adicionar_transicao(["+"], s22)
    s23 = Estado("S23", eh_final=True, codigo_token=OPERADOR_ADICAO)
    s22.adicionar_transicao(lista_fim_token, s23)    

     # Configurar operador == (INCREMENTAR)
    s74 = Estado("S74")
    s22.adicionar_transicao(["+"], s74)
    s75 = Estado("S75", eh_final=True, codigo_token=INCREMENTAR)
    s74.adicionar_transicao(lista_fim_token, s75)    
    
    
    # Configurar operador - (SUBTRAÇÃO)
    s24 = Estado("S24")
    s0.adicionar_transicao(["-"], s24)
    s25 = Estado("S25", eh_final=True, codigo_token=OPERADOR_SUBTRACAO)
    s24.adicionar_transicao(lista_fim_token, s25)

    # Configurar operador - (DECREMENTAR)
    s76 = Estado("S76")
    s24.adicionar_transicao(["-"], s76)
    s77 = Estado("S77", eh_final=True, codigo_token=DECREMENTAR)
    s76.adicionar_transicao(lista_fim_token, s77)        

    # Configurar operador * (MULTIPLICAÇÃO)
    s26 = Estado("S26")
    s0.adicionar_transicao(["*"], s26)
    s27 = Estado("S27", eh_final=True, codigo_token=OPERADOR_MULTIPLICACAO)
    s26.adicionar_transicao(lista_fim_token, s27) 

    # Configurar operador / (DIVISÃO)
    s71 = Estado("S71", eh_final=True, codigo_token=OPERADOR_DIVISAO)
    s16.adicionar_transicao(lista_fim_token, s71)

    # Configurar o operador = 
    s72 = Estado("S72")
    s0.adicionar_transicao(["="], s72)
    s73 = Estado("S73", eh_final=True, codigo_token=ATRIBUICAO)
    s72.adicionar_transicao(lista_fim_token, s73) 

     # Configurar o operador == IGUAL A 
    s78 = Estado("S78")
    s72.adicionar_transicao(["="], s78)
    s79 = Estado("S79", eh_final=True, codigo_token=IGUAL_A)
    s78.adicionar_transicao(lista_fim_token, s79)

    # Configurar o operador != DIFERENTE
    s80 = Estado("S80")
    s0.adicionar_transicao(["!"], s80)
    s81 = Estado("S81")
    s80.adicionar_transicao(["="],s81)
    s82 = Estado("S82", eh_final=True, codigo_token=DIFERENTE_DE)
    s81.adicionar_transicao(lista_fim_token,s82)  

     # Configurar o operador > MAIOR 
    s83 = Estado("S83")
    s0.adicionar_transicao([">"], s83)
    s84 = Estado("S84", eh_final=True, codigo_token=MAIOR)
    s83.adicionar_transicao(lista_fim_token, s84)

    # Configurar o operador < MENOR 
    s85 = Estado("S85")
    s0.adicionar_transicao(["<"], s85)
    s86 = Estado("S86", eh_final=True, codigo_token=MENOR)
    s85.adicionar_transicao(lista_fim_token, s86)

    # Configurar o operador <= MENOR IGUAL
    s87 = Estado("S87")
    s85.adicionar_transicao(["="], s87)
    s88 = Estado("S88", eh_final=True, codigo_token=MENOR_IGUAL)
    s87.adicionar_transicao(lista_fim_token, s88)

     # Configurar o operador >= MAIOR IGUAL
    s89 = Estado("S89")
    s83.adicionar_transicao(["="], s89)
    s90 = Estado("S90", eh_final=True, codigo_token=MAIOR_IGUAL)
    s89.adicionar_transicao(lista_fim_token, s90)
    

     # Configurar o operador || OR
    s91 = Estado("S91")
    s0.adicionar_transicao(["|"], s91)
    s92 = Estado("S92")
    s91.adicionar_transicao(["|"],s92)
    s93 = Estado("S93", eh_final=True, codigo_token=OR)
    s92.adicionar_transicao(lista_fim_token,s93) 

    # Configurar o operador && AND
    s94 = Estado("S94")
    s0.adicionar_transicao(["&"], s94)
    s95 = Estado("S95")
    s94.adicionar_transicao(["&"],s95)
    s96 = Estado("S96", eh_final=True, codigo_token=AND)
    s95.adicionar_transicao(lista_fim_token,s96) 

    # Configurar operador +=
    s97 = Estado("S97")
    s22.adicionar_transicao(["="], s97)
    s98 = Estado("S98", eh_final=True, codigo_token=ATRIBUICAO_ADICAO)
    s97.adicionar_transicao(lista_fim_token, s98)  
   
    # Configurar operador -=
    s99 = Estado("S99")
    s24.adicionar_transicao(["="], s99)
    s100 = Estado("S100", eh_final=True, codigo_token=DESATRIBUICAO_SUBTRACAO)
    s99.adicionar_transicao(lista_fim_token, s100) 


  def retornar_proximo_token(self):
    """
    Percorre o código fonte em busca do próximo token
    """
    # O estado inicial é sempre S0
    estado_atual = self.estado_inicial
    estado_anterior = None 
    #print(f'Estado incial: {estado_atual.get_nome()}')

    # Acumula o lexema
    lexema = ""

    # percorre o código da posição atual até o final do código fonte
    # OUUUUUUU
    # até que o estado atual fique nulo
    # ou
    # até encontrar um estado final (ou seja, o estado atual é diferente
    # do estado final)
    while self.posicao_atual < len(self.codigo) and estado_atual is not None and not estado_atual.get_eh_final():
      #print(f'Estado {estado_atual.get_nome()} / é final? {estado_atual.get_eh_final()}')
      
      s = self.codigo[self.posicao_atual]
      #print(f'Simbolo: {s}')
      estado_anterior = estado_atual
      estado_atual = estado_atual.realizar_transicao(s)

      # vou acumular o lexema apenas se próximo estado seja
      # diferente do estado inicial
      if estado_atual != self.estado_inicial:
        lexema += s

      #print(f'Próximo estado {estado_atual.get_nome()}')
      self.posicao_atual += 1

    # cheguei ao estado atual e ele é nulo
    if estado_atual is None:
      raise Exception(f'Lexema não reconhecido "{lexema}" - estado anterior "{estado_anterior.get_nome()}"')

    if estado_atual.get_eh_final():
      # faz o push back
      self.posicao_atual -= 1

      # remove do lexema o último caractere
      lexema = lexema[0:(len(lexema)-1)]

      return [estado_atual.get_codigo_token(), lexema]
    
    # caso contrário....
    return None


In [5]:
codigo_fonte = """

program
begin
end
if
elseif
else
for
while
do
(
)
+
++
-
--
*
=
==
!=
<
>
<=
>=
/
read
write
||
&&
+=
-=
;
cacacacacav
1231


"""

codigo_fonte

'\n\nprogram\nbegin\nend\nif\nelseif\nelse\nfor\nwhile\ndo\n(\n)\n+\n++\n-\n--\n*\n=\n==\n!=\n<\n>\n<=\n>=\n/\nread\nwrite\n||\n&&\n+=\n-=\n;\ncacacacacav\n1231\n\n\n'

## Execução do analisador léxico

In [6]:
lexico = AnalisadorLexico(codigo_fonte)

In [7]:
t = lexico.retornar_proximo_token()
# suprimindo o comentário de linha
if t is not None and t[0] != COMENTARIO_LINHA:
  print(t)


while t is not None:
  t = lexico.retornar_proximo_token()

  # suprimindo o comentário de linha
  if t is not None and t[0] != COMENTARIO_LINHA:
    print(t)

['PROGRAM', 'program']
['BEGIN', 'begin']
['END', 'end']
['IF', 'if']
['ELSEIF', 'elseif']
['ELSE', 'else']
['FOR', 'for']
['WHILE', 'while']
['DO', 'do']
['ABRE_PARENTESE', '(']
['FECHA_PARENTESE', ')']
['OPERADOR_ADIÇÃO', '+']
['INCREMENTAR', '++']
['OPERADOR_SUBTRAÇÃO', '-']
['DECREMENTAR', '--']
['OPERADOR_MULTIPLICAÇÃO', '*']
['ATRIBUICAO', '=']
['IGUAL_A', '==']
['DIFERENTE_DE', '!=']
['MENOR', '<']
['MAIOR', '>']
['MENOR_IGUAL', '<=']
['MAIOR_IGUAL', '>=']
['OPERADOR_DIVISÃO', '/']
['READ', 'read']
['WRITE', 'write']
['OR', '||']
['AND', '&&']
['ATRIBUICAO_ADICAO', '+=']
['ATRIBUICAO_SUBTRACAO', '-=']
['PONTO_VIRGULA', ';']
['VARIAVEL', 'cacacacacav']
['NUMERO', '1231']


## Analisador sintático

## Gramática da linguagem

- S -> COMANDO
- COMANDO -> $\lambda$ | **write** WRITE COMANDO | `VARIAVEL` CALCULO COMANDO
- WRITE -> `ABRE_PARENTESE` (`STRING` | `NUMERO` | `VARIAVEL`) `FECHA_PARENTESE` `PONTO_VIRGULA`
- CALCULO -> `ATRIBUICAO` (`NUMERO` | `VARIAVEL`) 

In [8]:
codigo_fonte = """

  // primeiro comentario de linha

  
write("algum texto");       write("outro text texto"); 

  // comentario de linha aqui neste codigo fonte!!!
  write(1234);

            write(23456789.987654321);

abc = 123

        write( resultado );

  // ultimo comentario de linha

"""

codigo_fonte

'\n\n  // primeiro comentario de linha\n\n  \nwrite("algum texto");       write("outro text texto"); \n\n  // comentario de linha aqui neste codigo fonte!!!\n  write(1234);\n\n            write(23456789.987654321);\n\nabc = 123\n\n        write( resultado );\n\n  // ultimo comentario de linha\n\n'

In [9]:
lexico = AnalisadorLexico(codigo_fonte)

In [10]:
# princípio do analisador sintático
def S(lex, debug=False):
  if debug:
    print("Start")

  comando(lex, 0, debug)

# para a lista de comandos
def comando(lex, deep = 0, debug=False):
  if debug:
    print("\t"*deep, "|-", "comando")

  t = lex.retornar_proximo_token()
  # tratando o comentário de linha
  # simplesmente não levo em consideração
  # não faz coisa alguma com o comentário
  while (t is not None) and (t[0] == COMENTARIO_LINHA):
    t = lex.retornar_proximo_token()

  if t is None:
    # não faz nada se o token for vazio (nulo)
    print("  "*(deep + 1), "|-", "<<vazio>>")
  elif t[0] == WRITE:
    write(lex, deep+1, debug)
    comando(lex, deep, debug)
  elif t[0] == VARIAVEL:
    calculo(lex, deep+1, debug)
    comando(lex, deep, debug)
  else:
    raise Exception ("Erro!!!")

# para o comando 'write'
def write(lex, deep, debug=False):
  if debug:
    print("  "*deep, "|-", "write")

  t = lex.retornar_proximo_token()
  # aqui estou esperando o token ABRE_PARENTESE
  assert t[0] == ABRE_PARENTESE, f"Estava esperando o token ABRE_PARENTESE, e veio {t[0]} :-("

  t = lex.retornar_proximo_token()
  # aqui estou esperando o token STRING, NUMERO ou VARIÁVEL
  assert (t[0] == STRING or t[0]==NUMERO or t[0]==VARIAVEL), f"Estava esperando o token STRING, NUMERO OU VARIAVEL, e veio {t[0]} :-( "

  t = lex.retornar_proximo_token()
  # aqui estou esperando o token FECHA_PARENTESE
  assert t[0] == FECHA_PARENTESE, f"Estava esperando o token FECHA_PARENTESE, e veio {t[0]} :-("

  t = lex.retornar_proximo_token()
  # aqui estou esperando o token PONTO_VIRGULA
  assert t[0] == PONTO_VIRGULA, f"Estava esperando o token PONTO_VIRGULA, e veio {t[0]} :-("


def calculo(lex, deep, debug=False):
  if debug:
    print("  "*deep, "|-", "calculo")

  t = lex.retornar_proximo_token()
  # aqui estou esperando o token ABRE_PARENTESE
  assert t[0] == ATRIBUICAO, f"Estava esperando o token ATRIBUICAO, e veio {t[0]} :-("

  t = lex.retornar_proximo_token()
  # aqui estou esperando o token NUMERO ou VARIÁVEL
  assert t[0]==NUMERO or t[0]==VARIAVEL, f"Estava esperando o token NUMERO OU VARIAVEL, e veio {t[0]} :-( "




In [11]:
S(lexico, debug=True)

Start
 |- comando
   |- write
 |- comando
   |- write
 |- comando
   |- write
 |- comando
   |- write
 |- comando
   |- calculo
 |- comando
   |- write
 |- comando
   |- <<vazio>>


Exercício valendo meu grande amor e carinho que tenho por todos os meus alunos:

- Utilizar a gramática do slide 13 da aula de análise sintática
- Tornar a gramática não recursiva à esquerda (ou seja, remover a recursão)
- Implementá-la aqui :-)