# PAIR PROGRAMMING - Expresiones Regulares

1. Validar un número de teléfono.
Descripción: Verificar si una cadena representa un número de teléfono válido en el formato (XXX) XXX-XXXX.
Probad para cada uno de los teléfonos que tenemos en la siguiente lista:
telefonos = ["(123) 456-7890", "178 1890-733", "(555) 238-1987", "(123) 4560-7890", "(ABC) 098-1111"]


In [26]:
import re

In [29]:
telefonos = ["(123) 456-7890", "178 1890-733", "(555) 238-1987", "(123) 4560-7890", "(ABC) 098-1111"]
patron1 = r"\(\d{3}\) \d{3}-\d{4}"

for el in telefonos:
    if re.findall(patron1, el):
        print(el)
    else:
        print("No es correcto", el)

(123) 456-7890
No es correcto 178 1890-733
(555) 238-1987
No es correcto (123) 4560-7890
No es correcto (ABC) 098-1111


In [55]:
#Otra opción de resolucion:
for el in telefonos:
    if re.match(patron1, el):
        print(el)
    else:
        print("No es valido")

(123) 456-7890
No es valido
(555) 238-1987
No es valido
No es valido


2. Buscar todas las direcciones de correo electrónico en un texto.
Descripción: Encontrar todas las direcciones de correo electrónico presentes en una cadena de texto.
Probad con el siguiente string:
texto = "Mi correo es user@example.com. Contacta conmigo en john.doe@email.com"


In [41]:
texto = "Mi correo es user@example.com. Contacta conmigo en john.doe@email.com"
patron2 = re.findall(r"\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}\b", texto)
print("Las direcciones de correo electronico:", patron2)

Las direcciones de correo electronico: ['user@example.com', 'john.doe@email.com']


3. Validar un código postal.
Descripción: Verificar si una cadena representa un código postal válido de 5 dígitos.
Probad para cada uno de los códigos postales que tenemos en la siguiente lista:
codigos_postales = ["12345", "190037", "78409", "986449", "19305"]

In [65]:
codigos_postales = ["12345", "190037", "78409", "986449", "19305"]
patron3 = "\d{5}"
for el in codigos_postales:
        if re.findall(patron3, el):
            if len(el) <=5:
                print(el)

12345
78409
19305


In [67]:
# Otra opción de resolución:
codigos_postales = ["12345", "190037", "78409", "986449", "19305"]
patron13 = "^\d{5}$"

codigos_validos = []

for cod in codigos_postales:
    objetivo = re.findall(patron13, cod)
    
    if len(objetivo) != 0:
        codigos_validos.append(objetivo[0])
        
codigos_validos

['12345', '78409', '19305']

4. Encontrar todas las palabras que comienzan con una vocal en un texto.
Descripción: Encontrar todas las palabras en un texto que comienzan con una vocal (a, e, i, o, u).
Probad con el siguiente string:
texto = "El perro está ladrando. Ana tiene una manzana. La casa es grande."


In [43]:
texto = "El perro está ladrando. Ana tiene una manzana. La casa es grande."
patron4 = r'\b[aeiouAEIOU]\w*\b'

palabras_encontradas = re.findall(patron4, texto)

print(palabras_encontradas)


['El', 'está', 'Ana', 'una', 'es']


5. Extraer todos los hashtags de un texto.
Descripción: Extraer todos los hashtags (#) presentes en una cadena de texto.
Probad con el siguiente string:
texto = "Me encanta el #deporte. #FelizViernes a todos. Estoy en la conferencia #Tech2022."

In [44]:
texto = "Me encanta el #deporte. #FelizViernes a todos. Estoy en la conferencia #Tech2022."
patron5 = r'\#\w+'
hashtags = re.findall(patron5, texto)

print(hashtags)

['#deporte', '#FelizViernes', '#Tech2022']


6. Buscar todos los números decimales en una cadena de texto.
Descripción: Encontrar todos los números decimales presentes en una cadena de texto.
Probad con el siguiente string:
texto = "El precio es $19.99. La temperatura es 25.5°C. El índice de inflación es del 2.5%."     


In [46]:
texto = "El precio es $19.99. La temperatura es 25.5°C. El índice de inflación es del 2.5%."
patron6 = r'\b\d+\.\d+\b'

numeros_decimales = re.findall(patron6, texto)

print("Numeros decimales:", numeros_decimales)

Numeros decimales: ['19.99', '25.5', '2.5']


7. Validar un nombre de usuario.
Descripción: Verificar si una cadena representa un nombre de usuario válido, que contiene solo letras minúsculas, números y guiones bajos (_).
Probad con la siguiente lista de usuarios:
lista_usuarios = ["juan_doe123", "lola_12", "Aurora_23", "12marta_lopez"]

In [48]:
lista_usuarios = ["juan_doe123", "lola_12", "Aurora_23", "12marta_lopez"]

patron7 = r"^[a-z0-9_]+$"


for el in lista_usuarios:
    if re.findall(patron7, el):
        print(el)
    else:
        print("No es valido")


juan_doe123
lola_12
12marta_lopez


8. Encontrar todas las fechas en formato "dd/mm/aaaa" en un texto.
Descripción: Encontrar todas las fechas válidas en formato "dd/mm/aaaa" presentes en una cadena de texto.
Probad con el siguiente string:
texto = "La fecha límite es el 31/12/2022. Hoy es 01/01/2023. Cumpleaños: 15/05/1990."


In [51]:
texto = "La fecha límite es el 31/12/2022. Hoy es 01/01/2023. Cumpleaños: 15/05/1990."

patron8 = "\d{2}/\d{2}/\d{4}"

fechas = re.findall(patron8, texto)

print("Las fechas  son: ", fechas)

Las fechas  son:  ['31/12/2022', '01/01/2023', '15/05/1990']


9. Remover caracteres especiales.
Descripción: Dada una cadena de texto, remover cualquier carácter especial, como signos de puntuación y símbolos.
Probad con el siguiente string:
texto = '¡Hola, cómo estás? ¿Todo bien?'


In [53]:
texto = '¡Hola, cómo estás? ¿Todo bien?'

patron9 = r'[^a-zA-Z0-9\sáéíóúÁÉÍÓÚüÜ]'

cadena = re.sub(patron9, "", texto)

print(cadena)

Hola cómo estás Todo bien


10. BONUS: Enmascarar información personal.
Descripción: Dada una cadena de texto que contiene información personal, como nombres y direcciones, enmascarar esta información reemplazándola con asteriscos (*).
Probad con este string:
texto = 'El nombre del cliente es John Doe y su dirección es 123 Main Street.'

In [None]:
texto = 'El nombre del cliente es John Doe y su dirección es 123 Main Street.'

patron10 = 

patron11 = 

cadena_informacion = re.sub(patron10, "*", texto)

print(cadena_informacion)