# **re**

Proporciona herramientas para trabajar con expresiones regulares, lo que permite buscar, coincidir y manipular cadenas de texto de forma más eficiente y flexible.

## **Funciones Principales**

- `re.match()` Intenta hacer coincidir una expresión regular al principio de una cadena. Si la coincidencia tiene éxito, devuelve un objeto Match, de lo contrario, devuelve None.
- `group()` devuelve la cadena completa que coincide con el patrón.
- `\d` Representa cualquier dígito numérico (del 0 al 9).
- `+` Es un cuantificador que indica "uno o más" de lo que lo precede.

In [101]:
import re

resultado = re.match(r'\d+', "123abc")
print(type(resultado))
print(resultado.group())

<class 're.Match'>
123


- `re.search()` Busca una coincidencia en toda la cadena. Si encuentra una coincidencia, devuelve un objeto `Match`, si no, devuelve `None`.

In [102]:
import re

resultado = re.search(r'\d+', "abc123xyz")
print(resultado.group())

123


- `re.findall()` Devuelve todas las coincidencias de la expresión regular en la cadena como una lista. Si no hay coincidencias, devuelve una lista vacía.

In [103]:
import re

resultados = re.findall(r'\d+', "123 abc 456 def 789")
print(type(resultados))
print(resultados)

<class 'list'>
['123', '456', '789']


- `re.finditer()` Devuelve un iterador que produce objetos Match para todas las coincidencias de la expresión regular en la cadena.

In [104]:
import re

resultados = re.finditer(r'\d+', "123 abc 456 def 789")
print(type(resultados))

for match in resultados:
    print(match.group())

<class 'callable_iterator'>
123
456
789


- `re.sub()` Sustituye las coincidencias encontradas por la expresión regular con un texto especificado. Si no hay coincidencias, devuelve la cadena original.

In [105]:
import re

# Sustituye los dígitos por un símbolo
resultado = re.sub(r'\d+', '#', 'abc123xyz')
print(resultado)

abc#xyz


- `re.subn()` Similar a `re.sub()`, pero también devuelve el número de sustituciones realizadas.

In [106]:
import re

# Sustituye y cuenta las sustituciones
resultado, cantidad = re.subn(r'\d+', '#', 'abc123def456')
print(resultado)
print(cantidad)

abc#def#
2


- `re.split()` Divide una cadena en una lista usando la expresión regular como delimitador.

In [107]:
import re

# Divide la cadena por cualquier número de dígitos
resultado = re.split(r'\d+', 'abc123def456ghi')
print(resultado)

['abc', 'def', 'ghi']


- `re.compile()` Compila una expresión regular en un objeto `Pattern`, que luego puede ser reutilizado varias veces para realizar búsquedas.

In [108]:
import re

# Compila una expresión regular
patron = re.compile(r'\d+')
print(type(patron))

# Utiliza el objeto Pattern para buscar
resultado = patron.match('123abc')
print(resultado.group())

<class 're.Pattern'>
123


- `re.fullmatch()` Verifica si toda la cadena coincide con la expresión regular. Si la coincidencia es completa, devuelve un objeto `Match`; de lo contrario, devuelve `None`.

In [109]:
import re

# Verifica si toda la cadena es un número
resultado = re.fullmatch(r'\d+', '123')
print(resultado.group())

123


- `re.escape()` Escapa todos los caracteres especiales de la expresión regular para que puedan ser utilizados literalmente.

In [110]:
import re

# Escapa los caracteres especiales
resultado = re.escape('abc?123')
print(resultado)

abc\?123


- `re.purge()` Elimina los patrones de expresión regular compilados de la caché interna. Esto puede ser útil si se ha estado trabajando con muchas expresiones regulares y se desea liberar memoria.

In [111]:
import re

# Elimina los patrones de la caché
re.purge()

- `re.A / re.ASCII` Este flag hace que la expresión regular solo coincida con caracteres ASCII, excluyendo otros caracteres Unicode.

In [112]:
import re

# Coincide solo con caracteres ASCII
resultado = re.findall(r'[a-z]+', 'abc123©', re.ASCII)
print(resultado)

['abc']


- `re.I / re.IGNORECASE` Hace que la expresión regular no distinga entre mayúsculas y minúsculas.

In [113]:
import re

# Coincide sin distinguir mayúsculas o minúsculas
resultado = re.findall(r'abc', 'AbcABCabc', re.IGNORECASE)
print(resultado)

['Abc', 'ABC', 'abc']


- `re.M / re.MULTILINE` Hace que los caracteres ^ y $ coincidan con el inicio y final de cada línea (no solo con el inicio y final de la cadena).

In [114]:
import re

# Coincide con el inicio de cada línea
resultado = re.findall(r'^abc', 'abcss\nabc\nabc', re.MULTILINE)
print(resultado)

['abc', 'abc', 'abc']


- `re.S / re.DOTALL` Hace que el carácter `.` coincida con cualquier carácter, incluidos los saltos de línea.

In [115]:
import re

# Coincide con cualquier cosa, incluyendo saltos de línea
resultado = re.findall(r'abc.*def', 'zxc abc\n123\ndef', re.DOTALL)
print(resultado)

['abc\n123\ndef']


- `re.X / re.VERBOSE` Permite escribir expresiones regulares más legibles, permitiendo comentarios y saltos de línea en la expresión regular.

In [116]:
import re

# Expresión regular más legible
resultado = re.findall(r'''
    \d+     # Coincide con números
    \s+     # Coincide con espacios
    \w+     # Coincide con palabras
''', '123 abc', re.VERBOSE)
print(resultado)

['123 abc']
