In [1]:
def token_expr(text, esp = False):
    """
    Analiza una cadena de texto y extrae diferentes tipos de tokens utilizando expresiones regulares.

    Los tokens que se pueden extraer incluyen:
    - Variables
    - Operadores aritméticos (+, -, *, /, //, %, **)
    - Comparaciones (==, !=, <, <=, >, >=)
    - Números enteros y flotantes
    - Paréntesis
    - Espacios en blanco (opcional)

    Parámetros:
    text (str): La cadena de texto a analizar.
    esp (bool): Si es True, incluye los espacios en blanco en los resultados. 
    Si es False (por defecto), los espacios se excluyen.

    Retorna:
    list: Una lista de tuplas donde cada tupla contiene el tipo de token y su valor correspondiente.
          Si esp es False, los tokens de tipo "Espacio" se excluyen de la lista.
    """    
    import re
    p1 = r'(?P<Variable>[a-zA-Z_][a-zA-Z_0-9]*)' 
    p2 = r'(?P<Igual>=)'
    p3 = r'(?P<Suma>\+)'
    p4 = r'(?P<Mulpiplicacion>\*)'
    p5 = r'(?P<Resta>-)'
    p6 = r'(?P<Division_exacta>\//)'
    p7 = r'(?P<Modulo>%)'
    p8 = r'(?P<Division>\/)'
    p9 = r'(?P<float>(\d+[.]\d+|[.]\d+|\d+[.]))\s*'
    p0 = r'(?P<int>(\d+\s*$|\d+\s*))'
    p  = r'(?P<Espacio>\s+)'
    pp = r'(?P<Potencia>\*\*)'
    LT = r'(?P<Menor><)'
    LE = r'(?P<Menor_Igual><=)'
    GT = r'(?P<Mayor>>)'
    GE = r'(?P<Mayor_Igual>>=)'
    LP = r'(?P<Parentesis_izq>\()'
    RP = r'(?P<Parentesis_der>\))'
    DS = r'(?P<Distinto>!=)'
    EX = r'(?P<Exacto>==)'
    master_pat = re.compile('|'.join([EX,LE,GE,LT,GT,DS,pp,p1,p2,p3,p4,p5,p6,p7,p8,p9,p0,p,LP,RP]))
    bus        = master_pat.scanner(text)
    if esp:
        return [(i.lastgroup,i.group().strip()) for i in iter(bus.search,None)]
                
    return [(i.lastgroup,i.group().strip()) for i in iter(bus.search,None)
           if i.lastgroup != "espacio"]

En el contexto del módulo re de Python, que se utiliza para trabajar con expresiones regulares, los métodos scanner y search tienen funciones distintas pero relacionadas.

- scanner
  - Descripción: 
    
    El método scanner crea un objeto escáner que permite realizar búsquedas de coincidencias en un texto utilizando un patrón de expresión regular. Este objeto escáner se puede utilizar para iterar sobre las coincidencias encontradas en el texto.


  - Uso: 
    
    Al llamar a `master_pat.scanner(text)`, donde master_pat es un patrón de expresión regular compilado, se genera un objeto escáner que puede buscar coincidencias en la cadena text.


  - Ventajas: 
    
    Utilizar un escáner es eficiente cuando se necesita realizar múltiples búsquedas en el mismo texto, ya que el escáner mantiene el estado entre las búsquedas.


- search

  - Descripción: 
    
    El método search busca la primera coincidencia del patrón en el texto. Devuelve un objeto de coincidencia (match object) si encuentra una coincidencia, o None si no hay coincidencias.


  - Uso: 
    
    En el contexto de un escáner, `bus.search()` se utiliza para buscar la próxima coincidencia en el texto que está siendo analizado. El escáner devuelve un objeto de coincidencia cada vez que se llama a search.


  - Iteración: 
    
    En el código, se utiliza `iter(bus.search, None)` para crear un iterador que continuará llamando a search hasta que no se encuentren más coincidencias (cuando search devuelve None).


- Resumen de su uso en el código

    Se crea un escáner con master_pat.scanner(text), que permite buscar coincidencias en text utilizando el patrón master_pat.
    Luego, se utiliza bus.search() en un bucle para encontrar todas las coincidencias en el texto.
    Cada coincidencia se procesa y se almacena en una lista, que se devuelve al final de la función.
    
    Scaner permite una búsqueda eficiente y continua en el texto, mientras que search se utiliza para encontrar coincidencias específicas dentro de ese texto.

In [2]:
print(*token_expr("hola=12+1"),sep="\n")
print()
print(*token_expr("hola=(12+1) * otra **2"),sep="\n")
print()
print(*token_expr("promedio = suma % longitud"),sep="\n")
print()
print(*token_expr("(12**0.5) != .2-4"),sep="\n")
print()
print(*token_expr("1=(.5)+-*/**//><>=<=!===0.1% 8."),sep="\n")

('Variable', 'hola')
('Igual', '=')
('int', '12')
('Suma', '+')
('int', '1')

('Variable', 'hola')
('Igual', '=')
('Parentesis_izq', '(')
('int', '12')
('Suma', '+')
('int', '1')
('Parentesis_der', ')')
('Espacio', '')
('Mulpiplicacion', '*')
('Espacio', '')
('Variable', 'otra')
('Espacio', '')
('Potencia', '**')
('int', '2')

('Variable', 'promedio')
('Espacio', '')
('Igual', '=')
('Espacio', '')
('Variable', 'suma')
('Espacio', '')
('Modulo', '%')
('Espacio', '')
('Variable', 'longitud')

('Parentesis_izq', '(')
('int', '12')
('Potencia', '**')
('float', '0.5')
('Parentesis_der', ')')
('Espacio', '')
('Distinto', '!=')
('Espacio', '')
('float', '.2')
('Resta', '-')
('int', '4')

('int', '1')
('Igual', '=')
('Parentesis_izq', '(')
('float', '.5')
('Parentesis_der', ')')
('Suma', '+')
('Resta', '-')
('Mulpiplicacion', '*')
('Division', '/')
('Potencia', '**')
('Division_exacta', '//')
('Mayor', '>')
('Menor', '<')
('Mayor_Igual', '>=')
('Menor_Igual', '<=')
('Distinto', '!=')
('Exacto'

In [3]:
token_expr("hola=(12+1) * otra **2")

[('Variable', 'hola'),
 ('Igual', '='),
 ('Parentesis_izq', '('),
 ('int', '12'),
 ('Suma', '+'),
 ('int', '1'),
 ('Parentesis_der', ')'),
 ('Espacio', ''),
 ('Mulpiplicacion', '*'),
 ('Espacio', ''),
 ('Variable', 'otra'),
 ('Espacio', ''),
 ('Potencia', '**'),
 ('int', '2')]

In [4]:
token_expr("promedio = suma % longitud")

[('Variable', 'promedio'),
 ('Espacio', ''),
 ('Igual', '='),
 ('Espacio', ''),
 ('Variable', 'suma'),
 ('Espacio', ''),
 ('Modulo', '%'),
 ('Espacio', ''),
 ('Variable', 'longitud')]

In [5]:
token_expr("(12**0.5) != .2-4")

[('Parentesis_izq', '('),
 ('int', '12'),
 ('Potencia', '**'),
 ('float', '0.5'),
 ('Parentesis_der', ')'),
 ('Espacio', ''),
 ('Distinto', '!='),
 ('Espacio', ''),
 ('float', '.2'),
 ('Resta', '-'),
 ('int', '4')]

In [6]:
token_expr("1=(.5)+-*/**//><>=<=!===0.1 8.")

[('int', '1'),
 ('Igual', '='),
 ('Parentesis_izq', '('),
 ('float', '.5'),
 ('Parentesis_der', ')'),
 ('Suma', '+'),
 ('Resta', '-'),
 ('Mulpiplicacion', '*'),
 ('Division', '/'),
 ('Potencia', '**'),
 ('Division_exacta', '//'),
 ('Mayor', '>'),
 ('Menor', '<'),
 ('Mayor_Igual', '>='),
 ('Menor_Igual', '<='),
 ('Distinto', '!='),
 ('Exacto', '=='),
 ('float', '0.1'),
 ('float', '8.')]