# Pair programming Expresiones Regulares

1. Validar un número de teléfono.

Descripción: Verificar si una cadena representa un número de teléfono válido en el formato (XXX) XXX-XXXX.

Probad para cada uno de los teléfonos que tenemos en la siguiente lista:

telefonos = ["(123) 456-7890", "178 1890-733", "(555) 238-1987", "(123) 4560-7890", "(ABC) 098-1111"]

\(\d{3}\)\s\d{3}-\d{4}

In [24]:
import re

telefonos = ["(123) 456-7890", "178 1890-733", "(555) 238-1987", "(123) 4560-7890", "(ABC) 098-1111"]
patron_tlf = "\(\d{3}\)\s\d{3}-\d{4}"
telf = " ".join(telefonos)

x = re.findall(patron_tlf, telf)

print(x)

['(123) 456-7890', '(555) 238-1987']


2. Buscar todas las direcciones de correo electrónico en un texto.

Descripción: Encontrar todas las direcciones de correo electrónico presentes en una cadena de texto.

Probad con el siguiente string:

texto = "Mi correo es user@example.com. Contacta conmigo en john.doe@email.com"

patron_email = "\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}\b"

In [19]:
emails = "Mi correo es user@example.com. Contacta conmigo en john.doe@email.com"
patron_email = "[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}"

e = re.findall(patron_email, emails)

print(e)

['user@example.com', 'john.doe@email.com']


3. Validar un código postal.

Descripción: Verificar si una cadena representa un código postal válido de 5 dígitos.

Probad para cada uno de los códigos postales que tenemos en la siguiente lista:

codigos_postales = ["12345", "190037", "78409", "986449", "19305"]

In [25]:
codigos_postales = ["12345", "190037", "78409", "986449", "19305"]
patron_cp = "\d{6}"
codigos_p = " ".join(codigos_postales)

cp = re.findall(patron_cp, codigos_p)

print(cp)


['190037', '986449']


4. Encontrar todas las palabras que comienzan con una vocal en un texto.

Descripción: Encontrar todas las palabras en un texto que comienzan con una vocal (a, e, i, o, u).

Probad con el siguiente string:

texto = "El perro está ladrando. Ana tiene una manzana. La casa es grande."

In [46]:
texto = "El perro está ladrando. Ana tiene una manzana. La casa es grande."
patron_texto = r"\b[aeiouAEIOU]\w*\b"

t = re.findall(patron_texto, texto)

print(t)

['El', 'está', 'Ana', 'una', 'a', 'es']


5. Extraer todos los hashtags de un texto.

Descripción: Extraer todos los hashtags (#) presentes en una cadena de texto.

Probad con el siguiente string:

texto = "Me encanta el #deporte. #FelizViernes a todos. Estoy en la conferencia #Tech2022."

In [53]:
texto_a = "Me encanta el #deporte. #FelizViernes a todos. Estoy en la conferencia #Tech2022."
patron_ta = r"\#\w+\b"

a = re.findall(patron_ta, texto_a)

print(a)

['#deporte', '#FelizViernes', '#Tech2022']


6. Buscar todos los números decimales en una cadena de texto.

Descripción: Encontrar todos los números decimales presentes en una cadena de texto.

Probad con el siguiente string:

texto = "El precio es $19.99. La temperatura es 25.5°C. El índice de inflación es del 2.5%."     

In [63]:
decimales = "El precio es $19.99. La temperatura es 25.5°C. El índice de inflación es del 2.5%."     
patron_decimales = r"(\d+(\.\d+)?)"

d = re.findall(patron_decimales, decimales)

print(d)

[('19.99', '.99'), ('25.5', '.5'), ('2.5', '.5')]


7. Validar un nombre de usuario.

Descripción: Verificar si una cadena representa un nombre de usuario válido, que contiene solo letras minúsculas, números y guiones bajos (_).

Probad con la siguiente lista de usuarios:

lista_usuarios = ["juan_doe123", "lola_12", "Aurora_23", "12marta_lopez"]

In [None]:
lista_usuarios = ["juan_doe123", "lola_12", "Aurora_23", "12marta_lopez"]
usuarios = " , ".join(lista_usuarios)

print(usuarios)
patron = "^[a-z0-9]*_?[a-z0-9]*_?[a-z0-9]*_?"

z = re.findall(patron, usuarios)

print(z)
# No vemos dónde está el problema...

8. Encontrar todas las fechas en formato "dd/mm/aaaa" en un texto.

Descripción: Encontrar todas las fechas válidas en formato "dd/mm/aaaa" presentes en una cadena de texto.

Probad con el siguiente string:

texto = "La fecha límite es el 31/12/2022. Hoy es 01/01/2023. Cumpleaños: 15/05/1990."

In [None]:
texto = "La fecha límite es el 31/12/2022. Hoy es 01/01/2023. Cumpleaños: 15/05/1990."
patron = "[0-9]{2}\/[0-9]{2}\/[0-9]{4}"

fechas = re.findall(patron, texto)

print(fechas)

9. Remover caracteres especiales.

Descripción: Dada una cadena de texto, remover cualquier carácter especial, como signos de puntuación y símbolos.

Probad con el siguiente string:

texto = '¡Hola, cómo estás? ¿Todo bien?'

In [None]:
texto = '¡Hola, cómo estás? ¿Todo bien?'
#Hemos dejado las tildes áéíóú
patron_texto = "[^A-Za-záéíóú0-9\s]"

string = re.sub(patron_texto, "", texto)

print(string)

# 10. BONUS: Enmascarar información personal.

Descripción: Dada una cadena de texto que contiene información personal, como nombres y direcciones, enmascarar esta información reemplazándola con asteriscos (*).

Probad con este string:

texto = 'El nombre del cliente es John Doe y su dirección es 123 Main Street.'

In [None]:
enmascarar = 'El nombre del cliente es John Doe y su dirección es 123 Main Street.'
patron_enmascarar_palabras = r"\s[A-ZÁÉÍÓÚ]{1}[a-záéíóú]+\s[A-ZÁÉÍÓÚ]{1}[a-záéíóú]+"
patron_enmascarar_numeros = r"\s[0-9]+\s"

enmascarar = re.sub(patron_enmascarar_palabras, " *", enmascarar)
enmascarar = re.sub(patron_enmascarar_numeros, " *", enmascarar)

print(enmascarar)