# Expresiones regulares

In [1]:
# re.search : buscar un patron en una cadena
import re

texto = "En esta cadena se encuentra una palabra secreta"

re.search('secreta', texto)

<re.Match object; span=(40, 47), match='secreta'>

In [2]:
re.search('hi!', texto)

In [3]:
palabra = "secreta"

encontrado = re.search(palabra, texto)

In [4]:
if encontrado is not None:
    print("Se ha encontrado la palabra")
else:
    print("No se ha encontrado la palabra")

Se ha encontrado la palabra


In [5]:
# Devuelve la posicion en donde inicia la coincidencia en la cadena
encontrado.start()

40

In [6]:
# Devuelve la posicion en donde termina la coincidencia en la cadena
encontrado.end()

47

In [8]:
# Una tupla con la posicion en donde inicia y termina
encontrado.span()

(40, 47)

In [9]:
encontrado.string

'En esta cadena se encuentra una palabra secreta'

In [10]:
texto = "Hello World"
re.match("Hello", texto)

<re.Match object; span=(0, 5), match='Hello'>

In [11]:
re.match("hola", texto)

In [15]:
# re.split : Dividir una cadena a partir de un patron
texto = "Cadena,dividida,por,comas"
re.split(',', texto)

['Cadena', 'dividida', 'por', 'comas']

In [16]:
# re.sub : sustituye todas las coincidencias en una cadena
texto = "Hi amigo"
re.sub("Hi", "Hola", texto)

'Hola amigo'

In [17]:
# re.findall: buscar todas las coincidencias en una cadena
texto = "hola adios hello adios hello hola"
re.findall("(adios|hello)", texto)

['adios', 'hello', 'adios', 'hello']

In [18]:
texto = "hla hola hoola hoooola hooooooola"
re.findall("hla", texto)

['hla']

In [19]:
re.findall('hola', texto)

['hola']

In [20]:
def buscar(patrones, texto):
    for patron in patrones:
        print(re.findall(patron, texto))
        
patrones = ['hla', 'hola', 'hoola']
buscar(patrones, texto)

['hla']
['hola']
['hoola']


In [21]:
# Meta-caracter * : Ninguna o mas repeticiones de la letra a su izquierda
texto = "hla hola hoola hoooola hooooooola"

patrones = ['ho', 'ho*', 'ho*la', 'hu*la']

buscar(patrones, texto)

['ho', 'ho', 'ho', 'ho']
['h', 'ho', 'hoo', 'hoooo', 'hooooooo']
['hla', 'hola', 'hoola', 'hoooola', 'hooooooola']
['hla']


In [25]:
# Meta-caracter + : una o mas repeticiones de la letra a su izquierda
texto = "hla hola hoola hoooola hooooooola"

patrones = ['ho*', 'ho+']
buscar(patrones, texto)

['h', 'ho', 'hoo', 'hoooo', 'hooooooo']
['ho', 'hoo', 'hoooo', 'hooooooo']


In [26]:
# Meta-caracter ? : una o ninguna repeticion de la letra a su izquierda
texto = "hla hola hoola hoooola hooooooola"

patrones = ['ho*', 'ho+', 'ho?', 'ho?la']
buscar(patrones, texto)

['h', 'ho', 'hoo', 'hoooo', 'hooooooo']
['ho', 'hoo', 'hoooo', 'hooooooo']
['h', 'ho', 'ho', 'ho', 'ho']
['hla', 'hola']


In [27]:
# Sintaxis con {n} : indica un numero de repeticiones explicito de la letra a su izquierda
texto = "hla hola hoola hoooola hooooooola"

patrones = ['ho{0}la', 'ho{1}la', 'ho{2}la']
buscar(patrones, texto)

['hla']
['hola']
['hoola']


In [28]:
# Sintaxis con rango {n, m} : indica un numero de repeticiones variable entre n y m de la letra a su izquierda
texto = "hla hola hoola hoooola hooooooola"

patrones = ['ho{0,1}la', 'ho{1,2}la', 'ho{2,10}la']
buscar(patrones, texto)

['hla', 'hola']
['hola', 'hoola']
['hoola', 'hoooola', 'hooooooola']


In [29]:
# Conjunto de caracteres []
texto = "hala hela hila hola hula"

patrones = ['h[ou]la', 'h[aio]la', 'h[aeiou]la']
buscar(patrones, texto)

['hola', 'hula']
['hala', 'hila', 'hola']
['hala', 'hela', 'hila', 'hola', 'hula']


In [30]:
texto = "haala heeela hiiiila hoooooola"

patrones = ['h[ae]la', 'h[ae]*la', 'h[io]{3,9}la']
buscar(patrones, texto)

[]
['haala', 'heeela']
['hiiiila', 'hoooooola']


In [31]:
# Exclusion en conjunto [^] para busquedas contrarias
texto = "hala hela hila hola hula"

patrones = ['h[o]la', 'h[^o]la']
buscar(patrones, texto)

['hola']
['hala', 'hela', 'hila', 'hula']


In [33]:
# Rangos [A-Za-z] [0-9] [a-zA-Z0-9]
texto = "hola h0la Hola mola m0la M0la asda UB40 Mnbh"

patrones = ['h[a-z]la', 'h[0-9]la', '[A-z]{4}', '[A-Z][A-z0-9]{3}']
buscar(patrones, texto)

['hola']
['h0la']
['hola', 'Hola', 'mola', 'asda', 'Mnbh']
['Hola', 'M0la', 'UB40', 'Mnbh']


In [34]:
texto = "Este curso de python 3   se curso   en el año 2021"

patrones = [r'\d', r'\d+', r'\D', r'\D+', r'\s', r'\S', r'\S+', r'\w', r'\w+', r'\W', r'\W+']

buscar(patrones, texto)

['3', '2', '0', '2', '1']
['3', '2021']
['E', 's', 't', 'e', ' ', 'c', 'u', 'r', 's', 'o', ' ', 'd', 'e', ' ', 'p', 'y', 't', 'h', 'o', 'n', ' ', ' ', ' ', ' ', 's', 'e', ' ', 'c', 'u', 'r', 's', 'o', ' ', ' ', ' ', 'e', 'n', ' ', 'e', 'l', ' ', 'a', 'ñ', 'o', ' ']
['Este curso de python ', '   se curso   en el año ']
[' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ']
['E', 's', 't', 'e', 'c', 'u', 'r', 's', 'o', 'd', 'e', 'p', 'y', 't', 'h', 'o', 'n', '3', 's', 'e', 'c', 'u', 'r', 's', 'o', 'e', 'n', 'e', 'l', 'a', 'ñ', 'o', '2', '0', '2', '1']
['Este', 'curso', 'de', 'python', '3', 'se', 'curso', 'en', 'el', 'año', '2021']
['E', 's', 't', 'e', 'c', 'u', 'r', 's', 'o', 'd', 'e', 'p', 'y', 't', 'h', 'o', 'n', '3', 's', 'e', 'c', 'u', 'r', 's', 'o', 'e', 'n', 'e', 'l', 'a', 'ñ', 'o', '2', '0', '2', '1']
['Este', 'curso', 'de', 'python', '3', 'se', 'curso', 'en', 'el', 'año', '2021']
[' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ']
[' ', ' ', ' '