# Expresiones regulares

1. Validar un número de teléfono.

* Descripción: Verificar si una cadena representa un número de teléfono válido en el formato (XXX) XXX-XXXX.
*   Probad para cada uno de los teléfonos que tenemos en la siguiente lista:

    ```python
    telefonos = ["(123) 456-7890", "178 1890-733", "(555) 238-1987", "(123) 4560-7890", "(ABC) 098-1111"]
    ```

In [4]:
import re

In [17]:
telefonos = ["(123) 456-7890", "178 1890-733", "(555) 238-1987", "(123) 4560-7890", "(ABC) 098-1111"]
patron = r"[(]\d{3}[)]\s\d{3}-\d{4}"

for n in telefonos:
    if re.fullmatch(patron, n):
        print("El número es válido")
    else:
        print("No coincide")


El número es válido
No coincide
El número es válido
No coincide
No coincide



2. Buscar todas las direcciones de correo electrónico en un texto.

* Descripción: Encontrar todas las direcciones de correo electrónico presentes en una cadena de texto.
*   Probad con el siguiente _string_:

    ```python
    texto = "Mi correo es user@example.com. Contacta conmigo en john.doe@email.com"
    ```

In [26]:
texto = "Mi correo es user@example.com. Contacta conmigo en john.doe@email.com"
patron = r"\b\w*@\w*\b\.\w*\b"

correo = re.findall(patron, texto)

for c in correo:
    print(c)

user@example.com
doe@email.com


3. Validar un código postal.

* Descripción: Verificar si una cadena representa un código postal válido de 5 dígitos.
*   Probad para cada uno de los códigos postales que tenemos en la siguiente lista:

    ```python
    codigos_postales = ["12345", "190037", "78409", "986449", "19305"]
    ```

In [18]:
codigos_postales = ["12345", "190037", "78409", "986449", "19305"]
patron = r"\d{5}"

for n in codigos_postales:
    if re.fullmatch(patron, n):
        print("El número es válido")
    else:
        print("No coincide")

El número es válido
No coincide
El número es válido
No coincide
El número es válido


4. Encontrar todas las palabras que comienzan con una vocal en un texto.

* Descripción: Encontrar todas las palabras en un texto que comienzan con una vocal (a, e, i, o, u).
*   Probad con el siguiente _string_:

    ```python
    texto = "El perro está ladrando. Ana tiene una manzana. La casa es grande."
    ```

In [35]:
texto = "El perro está ladrando. Ana tiene una manzana. La casa es grande."
patron = r"\b[aeiouAEIOUáéíóúÁÉÍÓÚ]\w*\b"

resultado = re.findall(patron, texto)
print(resultado)

['El', 'está', 'Ana', 'una', 'es']


5. Extraer todos los hashtags de un texto.

* Descripción: Extraer todos los hashtags (#) presentes en una cadena de texto.
*   Probad con el siguiente _string_:

    ```python
    texto = "Me encanta el #deporte. #FelizViernes a todos. Estoy en la conferencia #Tech2022."
    ```

In [36]:
texto = "Me encanta el #deporte. #FelizViernes a todos. Estoy en la conferencia #Tech2022."
patron = r"#\w*\b"
hastagh = re.findall(patron, texto)

for h in hastagh:
    print(h)

#deporte
#FelizViernes
#Tech2022


6. Buscar todos los números decimales en una cadena de texto.

* Descripción: Encontrar todos los números decimales presentes en una cadena de texto.
*   Probad con el siguiente _string_:

    ```python
    texto = "El precio es $19.99. La temperatura es 25.5°C. El índice de inflación es del 2.5%."     
    ```

In [40]:
texto = "El precio es $19.99. La temperatura es 25.5°C. El índice de inflación es del 2.5%." 
patron = r"\d+\.\d+"
decimal = re.findall(patron, texto)

for d in decimal:
    print(d)

19.99
25.5
2.5


7. Validar un nombre de usuario.

* Descripción: Verificar si una cadena representa un nombre de usuario válido, que contiene solo letras minúsculas, números y guiones bajos (\_).
*   Probad con la siguiente lista de usuarios:

    ```python
    lista_usuarios = ["juan_doe123", "lola_12", "Aurora_23", "12marta_lopez"]
    ```

In [43]:
lista_usuarios = ["juan_doe123", "lola_12", "Aurora_23", "12marta_lopez"]

for u in lista_usuarios:
    if re.match(r"^[a-z_][a-z0-9_]*$", u):
        print(u)


juan_doe123
lola_12


8. Encontrar todas las fechas en formato "dd/mm/aaaa" en un texto.
   * Descripción: Encontrar todas las fechas válidas en formato "dd/mm/aaaa" presentes en una cadena de texto.
   *   Probad con el siguiente _string_:

       ```python
       texto = "La fecha límite es el 31/12/2022. Hoy es 01/01/2023. Cumpleaños: 15/05/1990."
       ```

In [22]:
texto = "La fecha límite es el 31/12/2022. Hoy es 01/01/2023. Cumpleaños: 15/05/1990."
patron = r"\d{2}/\d{2}/\d{4}"

fechas = re.findall(patron, texto)

for fecha in fechas:
    print(fecha)

31/12/2022
01/01/2023
15/05/1990


9. Remover caracteres especiales.

* Descripción: Dada una cadena de texto, remover cualquier carácter especial, como signos de puntuación y símbolos.
*   Probad con el siguiente _string_:

    ```python
    texto = '¡Hola, cómo estás? ¿Todo bien?'
    ```

In [46]:
texto = '¡Hola, cómo estás? ¿Todo bien?'
texto_limpio = re.sub(r'[^a-zA-Záéíóúz0-9\s]', '', texto)
print(texto_limpio)

Hola cómo estás Todo bien


10. BONUS: Enmascarar información personal.
    * Descripción: Dada una cadena de texto que contiene información personal, como nombres y direcciones, enmascarar esta información reemplazándola con asteriscos (`*`).
    *   Probad con este _string_:

        ```python
        texto = 'El nombre del cliente es John Doe y su dirección es 123 Main Street.'
        ```

In [49]:
texto = 'El nombre del cliente es John Doe y su dirección es 123 Main Street.'

# Enmascarar nombres después de "nombre del cliente es"
texto_enmascarado = re.sub(
    r'(?<=nombre del cliente es )([A-Z][a-z]*(?:\s[A-Z][a-z]*)*)',
    lambda x: '*' * len(x.group()),
    texto
)

# Enmascarar dirección después de "dirección es"
texto_enmascarado = re.sub(
    r'(?<=dirección es )([\w\s\d]+)',
    lambda x: '*' * len(x.group()),
    texto_enmascarado
)

print(texto_enmascarado)

El nombre del cliente es ******** y su dirección es ***************.
