<a href="https://colab.research.google.com/github/gabrielawad/talleresGoogleColab/blob/main/Taller_22_expresiones_regulares.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## «*He aprendido a no intentar convencer a nadie. El trabajo de convencer es una falta de respeto, es un intento de colonización del otro*».
### [José Saramago](https://es.wikipedia.org/wiki/Jos%C3%A9_Saramago)

# Taller 22 expresiones regulares en Python

Los objetivos de este taller son:

* Comprender qué son las expresiones regulares y su importancia en el procesamiento de texto.

* Aprender la sintaxis básica de las expresiones regulares en Python.

* Practicar la aplicación de expresiones regulares en la manipulación y búsqueda de texto.

* Familiarizarse con herramientas y recursos para trabajar eficientemente con expresiones regulares.

## Definición y conceptos básicos

Las **expresiones regulares** (*regex* o *regexp*) son secuencias de caracteres que definen un patrón de búsqueda.

Estos patrones se utilizan para encontrar cadenas de texto que coincidan con ciertos criterios dentro de un texto más grande.

Los patrones de búsqueda pueden incluir caracteres literales (como letras y números) y metacaracteres (que representan clases de caracteres, repeticiones, posiciones en el texto, y otros más).

## Información adicional y herramientas online para trabajar con expresiones regulares

Información adicional:

[W3Schools](https://www.w3schools.com/python/python_regex.asp)

Herramientas online:

* [Regex101](https://regex101.com/)
* [Regexr](https://regexr.com/)

# Sintaxis básica de las expresiones regulares en Python

## Caracteres literales y metacaracteres

Los caracteres literales representan sus mismos valores en una expresión regular.

Caracteres literales: a, b, 123, y similares.

Los metacaracteres son caracteres con un significado especial en expresiones regulares.

Metacaracteres: cualquier carácter (excepto nueva línea), * (0 o más repeticiones), + (1 o más repeticiones), ? (0 o 1 repetición).


In [1]:
# Importar la librería requerida
import re

# Crear una cadena de texto de referencia
texto = "Python es genial!"

# Ejemplo de caracteres literales
# 'es' coincide con los caracteres literales 'es'
coincidencias_0 = re.findall(r'es', texto)

# Resultado: ['es']
print(coincidencias_0)

# Ejemplo de metacaracteres
# \w+ coincide con una o más ocurrencias de cualquier carácter alfanumérico
coincidencias_1 = re.findall(r'Py\w+n', texto)

# Resultado: ['Python']
print(coincidencias_1)

['es']
['Python']


## Clases de caracteres y cuantificadores:

Las clases de caracteres permiten especificar un conjunto de caracteres que coinciden con uno cualquiera de ellos.

Los cuantificadores se utilizan para especificar la cantidad de veces que se debe repetir un carácter o un conjunto de caracteres.

Ejemplo:

Clases de caracteres:
* [A-Z] (cualquier letra mayúscula)
* [a-z] (cualquier letra minúscula)
* [0-9] (cualquier dígito
* [aeiou] (cualquier vocal)

Cuantificadores:
* {m} (exactamente m repeticiones)
* {m, n} (entre m y n repeticiones)
* {m,} (al menos m repeticiones)
* {,n} (hasta n repeticiones)

In [9]:
# Importar la librería requerida
import re

# Ejemplo de clases de caracteres y cuantificadores
texto = "La contraseña es 123456"

# Coincide con exactamente seis dígitos
coincidencias_2 = re.findall(r'\d{6}', texto)

# Resultado: ['123456']
print(coincidencias_2)

['123456']


## Grupos de captura y grupos sin captura:

Los grupos de captura permiten extraer partes específicas de una cadena coincidente.

Los grupos sin captura agrupan subexpresiones sin realizar capturas.

Ejemplo:

Grupo de captura:
* (\w+) (captura una palabra)
* (\d{3}) (captura un número de tres dígitos)

Grupo sin captura:
* (?:\w+) (agrupa una palabra sin captura)
* (?:\d{3}) (agrupa un número de tres dígitos sin captura)

In [15]:
# Importar la librería requerida
import re

# Ejemplo de grupos con captura
numero_telefono = "El número de teléfono es 555-1234567"

# Dos grupos de captura para el código de área y el número
patron_0 = r'(\d{3})-(\d{7})'

# Encontrar todas las coincidencias
coincidencias_3 = re.findall(patron_0, numero_telefono)

# Resultado: [('555', '1234567')]
print(coincidencias_3)

# Ejemplo de grupos sin captura
texto = "Este es un ejemplo de expresión regular"

# Grupo sin captura para "un" seguido de una palabra
patron_1 = r'(?:un\s)(\w+)'

# Encontrar todas las coincidencias
coincidencias_4 = re.findall(patron_1, texto)

# Resultado: ['ejemplo']
print(coincidencias_4)

[('555', '1234567')]
['ejemplo']


## Uso de caracteres especiales como \b, ^, $,

Los caracteres especiales tienen un significado especial en expresiones regulares y se utilizan para representar ciertas posiciones en el texto, como el inicio o el final de una línea, límites de palabra.

Ejemplo:

* ^: coincide con el inicio de una cadena o línea.
* $: coincide con el final de una cadena o línea.
* \b: límite de palabra

In [16]:
# Importar la librería requerida
import re

# Ejemplo de uso de caracteres especiales:
texto = "Python es un lenguaje de programación. Python es poderoso"

# Coincide solo si la cadena comienza con 'Python'
patron_inicio = r'^Python'

# Coincide solo si la cadena termina con 'poderoso'
patron_final = r'poderoso$'

 # Coincide solo con la palabra 'Python' como una palabra completa
patron_palabra = r'\bPython\b'

# Buscar el inicio de la cadena
inicio = re.findall(patron_inicio, texto)
print("Coincidencias al inicio:", inicio)

# Buscar el final de la cadena
final = re.findall(patron_final, texto)
print("Coincidencias al final:", final)

# Buscar la palabra 'Python' como una palabra completa
palabra = re.findall(patron_palabra, texto)
print("Coincidencias de palabra completa:", palabra)

Coincidencias al inicio: ['Python']
Coincidencias al final: ['poderoso']
Coincidencias de palabra completa: ['Python', 'Python']


# Librería *re*

La librería ***re*** de Python proporciona funciones para trabajar con expresiones regulares.

## re.match(patrón, cadena)

Esta función intenta hacer coincidir el patrón especificado al principio de la cadena. Si hay una coincidencia, devuelve un objeto de coincidencia; de lo contrario, devuelve *None*.

In [17]:
# Importar la librería requerida
import re

# Crear una cadena de texto de referencia
cadena = "Python es un lenguaje de programación"

# Crear un patrón de referencia
patrón = r'Python'

# Buscar el patrón en la cadena
resultado = re.match(patrón, cadena)

# Mostrar el resultado
if resultado:
    print("Se encontró una coincidencia:", resultado.group())
else:
    print("No se encontró ninguna coincidencia")

Se encontró una coincidencia: Python


## re.search(patrón, cadena)

Esta función busca en toda la cadena una coincidencia con el patrón especificado. Si se encuentra una coincidencia, devuelve **un** objeto de coincidencia; de lo contrario, devuelve *None*.

In [18]:
# Importar la librería requerida
import re

# Crear una cadena de texto de referencia
cadena = "Python es un lenguaje de programación"

# Crear un patrón de referencia
patrón = r'lenguaje'

# Buscar el patrón en la cadena
resultado = re.search(patrón, cadena)

# Mostrar el resultado
if resultado:
    print("Se encontró una coincidencia:", resultado.group())
else:
    print("No se encontró ninguna coincidencia")

Se encontró una coincidencia: lenguaje


## re.findall(patrón, cadena)

Esta función encuentra todas las coincidencias del patrón en la cadena y devuelve **una lista** de todas las coincidencias.

In [19]:
# Importar la librería requerida
import re

# Crear una cadena de texto de referencia
cadena = "Python es un lenguaje de programación. Python es poderoso"

# Crear un patrón de referencia
patrón = r'Python'

# Buscar el patrón en la cadena
resultado = re.findall(patrón, cadena)

# Mostrar el resultado
print("Coincidencias encontradas:", resultado)

Coincidencias encontradas: ['Python', 'Python']


## re.sub(patrón, reemplazo, cadena)

Esta función busca todas las coincidencias del patrón en la cadena y las **reemplaza** con el texto especificado en el argumento de reemplazo.

In [21]:
# Importar la librería requerida
import re

# Crear una cadena de texto de referencia
cadena = "Python es un lenguaje de programación"

# Crear un patrón de referencia
patrón = r'lenguaje'

# Reemplazar el patrón en la cadena
reemplazo = "idioma"

# Buscar el patrón en la cadena
resultado = re.sub(patrón, reemplazo, cadena)

# Mostrar el resultado
print("Cadena modificada:", resultado)

Cadena modificada: Python es un idioma de programación


## Ejemplos de usos de expresiones regulares

### Validación de formatos de datos

Verificación de números de teléfono, direcciones de correo electrónico, códigos postales.

In [23]:
# Importar la librería requerida
import re

def verificar_texto(texto):
    """Verifica la presencia de números de teléfono, direcciones de correo
    electrónico y códigos postales en un texto.

    Args:
        texto (str): El texto en el que se buscarán los patrones.

    Returns:
        tuple: Una tupla que contiene listas de números de teléfono,
        direcciones de correo electrónico  códigos postales encontrados en el
        texto, respectivamente.
    """
    # Patrón para verificar números de teléfono
    patron_telefono = r'\b\d{3}-\d{3}-\d{4}\b'

    # Patrón para verificar direcciones de correo electrónico
    patron_correo = r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b'

    # Patrón para verificar códigos postales (formato de 5 dígitos)
    patron_codigo_postal = r'\b\d{5}\b'

    # Buscar números de teléfono en el texto
    telefonos = re.findall(patron_telefono, texto)

    # Buscar direcciones de correo electrónico en el texto
    correos = re.findall(patron_correo, texto)

    # Buscar códigos postales en el texto
    codigos_postales = re.findall(patron_codigo_postal, texto)

    return telefonos, correos, codigos_postales

# Texto de ejemplo para verificar
texto_ejemplo = """
Mi número de teléfono es 123-456-7890 y mi correo es ejemplo@gmail.com.
Vivo en la calle 1234 y mi código postal es 12345.
Puedes llamarme al 555-123-4567 o escribirme a otroejemplo@hotmail.com.
"""

# Verificar el texto de ejemplo
telefonos, correos, codigos_postales = verificar_texto(texto_ejemplo)

# Mostrar los resultados
print("Números de teléfono encontrados:", telefonos)
print("Direcciones de correo electrónico encontradas:", correos)
print("Códigos postales encontrados:", codigos_postales)

Números de teléfono encontrados: ['123-456-7890', '555-123-4567']
Direcciones de correo electrónico encontradas: ['ejemplo@gmail.com', 'otroejemplo@hotmail.com']
Códigos postales encontrados: ['12345']


### Búsqueda de patrones específicos en un texto

Encontrar palabras clave, fechas, direcciones.

In [24]:
# Importar la librería requerida
import re

def encontrar_informacion(texto):
    """Encuentra palabras clave, fechas y direcciones en un texto.

    Args:
        texto (str): El texto en el que se buscarán los patrones.

    Returns:
        tuple: Una tupla que contiene listas de palabras clave, fechas y
        direcciones encontradas en el texto, respectivamente.
    """
    # Patrón para buscar palabras clave (ejemplo: "importante", "urgente",
    # "importante", etc.)
    patron_palabra_clave = r'\b(importante|urgente|crítico)\b'

    # Patrón para buscar fechas en formato dd/mm/yyyy
    patron_fecha = r'\b(\d{1,2}/\d{1,2}/\d{4})\b'

    # Patrón para buscar direcciones (ejemplo: "calle 123", "avenida principal",
    # "plaza central", etc.)
    patron_direccion = r'\b(calle|avenida|plaza)\s[A-Za-z]+\s\d+\b'

    # Buscar palabras clave en el texto
    palabras_clave = re.findall(patron_palabra_clave, texto)

    # Buscar fechas en el texto
    fechas = re.findall(patron_fecha, texto)

    # Buscar direcciones en el texto
    direcciones = re.findall(patron_direccion, texto)

    return palabras_clave, fechas, direcciones

# Texto de ejemplo para verificar
texto_ejemplo = """
La reunión es muy importante y urgente. Se llevará a cabo el 15/02/2024 en la
calle principal 123. No olvides traer el informe crítico. La dirección es
avenida central 456. Nos vemos allí.
"""

# Encontrar información en el texto de ejemplo
palabras_clave, fechas, direcciones = encontrar_informacion(texto_ejemplo)

# Mostrar los resultados
print("Palabras clave encontradas:", palabras_clave)
print("Fechas encontradas:", fechas)
print("Direcciones encontradas:", direcciones)

Palabras clave encontradas: ['importante', 'urgente', 'crítico']
Fechas encontradas: ['15/02/2024']
Direcciones encontradas: ['calle', 'avenida']


### Filtrado y limpieza de datos en conjuntos de texto grandes

In [34]:
# Importar la librería requerida
import re

def limpiar_texto(texto):
    """Filtra y limpia un texto eliminando caracteres no deseados y
    palabras comunes.

    Args:
        texto (str): El texto que se va a limpiar.

    Returns:
        str: El texto limpio.
    """
    # Convertir todo el texto a minúsculas
    texto = texto.lower()

    # Eliminar caracteres no alfabéticos excepto espacios
    texto = re.sub(r'[^a-z\s]', '', texto)

    # Eliminar palabras comunes que no aportan significado
    palabras_inutiles = {'el', 'la', 'los', 'las', 'un', 'una', 'unos', 'unas',
                         'de', 'del', 'al', 'con', 'para', 'por', 'sobre',
                         'entre', 'hacia'}

    # Dividir el texto en palabras
    palabras = texto.split()

    # Crear una lista para almacenar las palabras filtradas
    palabras_filtradas = []

    # Filtrar palabras comunes
    for palabra in palabras:
        if palabra not in palabras_inutiles:
          palabras_filtradas.append(palabra)

    # Reconstruir el texto limpio
    texto_limpio = ' '.join(palabras_filtradas)

    return texto_limpio

# Texto de ejemplo
texto_ejemplo = """
En un lugar de la Mancha, de cuyo nombre no quiero acordarme, no ha mucho tiempo
 que vivía un hidalgo de los de lanza en astillero, adarga antigua, rocín flaco
  y galgo corredor.
"""

# Limpiar el texto de ejemplo
texto_limpio = limpiar_texto(texto_ejemplo)

# Mostrar el texto limpio
print("Texto limpio:")
print(texto_limpio)


Texto limpio:
en lugar mancha cuyo nombre no quiero acordarme no ha mucho tiempo que viva hidalgo lanza en astillero adarga antigua rocn flaco y galgo corredor


# Ejercicios

## Ejercicio 00

Validación de dirección de correo electrónico. Diseñar un programa que valide si una cadena ingresada por el usuario es una dirección de correo electrónico válida o no. La dirección de correo electrónico válida debe seguir el formato estándar de "usuario@dominio.com".

   *Texto de referencia:* "Por favor, envíe su solicitud a john.doe@example.com. Asegúrese de incluir su nombre completo y número de teléfono en el cuerpo del correo electrónico."

In [15]:
import re

def validar_correo(correo):
    """
    Valida si una dirección de correo electrónico es válida utilizando una expresión regular.

    Args:
        correo (str): La dirección de correo electrónico a validar.

    Returns:
        bool: True si la dirección de correo electrónico es válida, False de lo contrario.
    """
    # Patrón de expresión regular para validar la dirección de correo electrónico
    patron = r'^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}\.[a-zA-Z]{2,}$'
    # Utilizamos re.match para verificar si la cadena coincide con el patrón
    if re.match(patron, correo):
        return True
    else:
        return False

# Solicitar al usuario que ingrese una dirección de correo electrónico
direccion_correo = input("Ingrese una dirección de correo electrónico: ")

# Validar la dirección de correo electrónico ingresada por el usuario
if validar_correo(direccion_correo):
    print("La dirección de correo electrónico es válida.")
else:
    print("La dirección de correo electrónico no es válida.")

La dirección de correo electrónico no es válida.


## Ejercicio 01

Extracción de números de teléfono. Escribir un programa que extraiga todos los números de teléfono válidos de un texto dado. Los números de teléfono válidos deben seguir el formato XXX-XXX-XXXX.

   *Texto de referencia:* "Puede comunicarse con nuestro servicio al cliente llamando al 555-123-4567. También puede enviar un mensaje de texto al número 555-987-6543 para obtener ayuda rápida."




In [16]:
import re

def extraer_numeros_telefono(texto):
    """
    Extrae números de teléfono en formato XXX-XXX-XXXX del texto proporcionado.

    Args:
        texto (str): El texto del cual se deben extraer los números de teléfono.

    Returns:
        list: Una lista de números de teléfono encontrados en el texto.
    """

    # Patrón de expresión regular para extraer números de teléfono en formato XXX-XXX-XXXX
    patron = r'\b\d{3}-\d{3}-\d{4}\b'
    # Utilizamos re.findall para encontrar todas las coincidencias en el texto
    numeros_telefono = re.findall(patron, texto)
    return numeros_telefono

# Texto de referencia
texto_referencia = "Puede comunicarse con nuestro servicio al cliente llamando al 555-123-4567. También puede enviar un mensaje de texto al número 555-987-6543 para obtener ayuda rápida."

# Extraer números de teléfono del texto de referencia
numeros_telefono_encontrados = extraer_numeros_telefono(texto_referencia)

# Imprimir los números de teléfono encontrados
print("Números de teléfono encontrados:")
for numero in numeros_telefono_encontrados:
    print(numero)


Números de teléfono encontrados:
555-123-4567
555-987-6543


## Ejercicio 02

Búsqueda de fechas. Desarrolle un programa que identifique y extraiga todas las fechas válidas en un texto dado. Las fechas válidas deben estar en formato "DD/MM/AAAA".

   *Texto de referencia:* "La reunión está programada para el 15/02/2024. Por favor, confirme su asistencia antes de esa fecha. Recuerde que el plazo para enviar el informe es el 28/02/2024."

In [17]:
import re

def extraer_fechas(texto):
    """
    Extrae fechas en formato DD/MM/YYYY del texto proporcionado utilizando expresiones regulares.

    Args:
        texto (str): El texto del cual se deben extraer las fechas.

    Returns:
        list: Una lista de fechas en formato DD/MM/YYYY encontradas en el texto.
    """

    # Patrón de expresión regular para extraer fechas en formato DD/MM/AAAA
    patron = r'\b\d{2}/\d{2}/\d{4}\b'
    # Utilizamos re.findall para encontrar todas las coincidencias en el texto
    fechas = re.findall(patron, texto)
    return fechas

# Texto de referencia
texto_referencia = "La reunión está programada para el 15/02/2024. Por favor, confirme su asistencia antes de esa fecha. Recuerde que el plazo para enviar el informe es el 28/02/2024."

# Extraer fechas del texto de referencia
fechas_encontradas = extraer_fechas(texto_referencia)

# Imprimir las fechas encontradas
print("Fechas encontradas:")
for fecha in fechas_encontradas:
    print(fecha)


Fechas encontradas:
15/02/2024
28/02/2024


## Ejercicio 03

Validación de contraseñas seguras. Cree un programa que valide si una contraseña ingresada por el usuario es segura o no. Una contraseña segura debe tener al menos ocho caracteres de longitud y contener al menos una letra mayúscula, una letra minúscula, un número y un carácter especial.

   *Texto de referencia:* "Su contraseña debe tener al menos 10 caracteres de longitud y contener al menos una letra mayúscula, una letra minúscula, un número y un carácter especial. Por favor, elija una contraseña segura."

In [20]:
import re

def validar_contrasena(contrasena):
    """
    Valida si una contraseña cumple con los siguientes requisitos:
    - Tiene una longitud mínima de 8 caracteres.
    - Contiene al menos una letra mayúscula.
    - Contiene al menos una letra minúscula.
    - Contiene al menos un número.
    - Contiene al menos un carácter especial.
    
    Args:
        contrasena (str): La contraseña a validar.
    
    Returns:
        bool: True si la contraseña cumple con los requisitos, False en caso contrario.
    """
    # Verificar la longitud de la contraseña
    if len(contrasena) < 8:
        return False
    
    # Verificar si contiene al menos una letra mayúscula
    if not re.search("[A-Z]", contrasena):
        return False
    
    # Verificar si contiene al menos una letra minúscula
    if not re.search("[a-z]", contrasena):
        return False
    
    # Verificar si contiene al menos un número
    if not re.search("[0-9]", contrasena):
        return False
    
    # Verificar si contiene al menos un carácter especial
    if not re.search("[!@#$%^&*()-+]", contrasena):
        return False
    
    return True

# Texto de referencia
texto_referencia = "Su contraseña debe tener al menos 10 caracteres de longitud y contener al menos una letra mayúscula, una letra minúscula, un número y un carácter especial. Por favor, elija una contraseña segura."

# Solicitar al usuario que ingrese una contraseña
contrasena_ingresada = input("Ingrese su contraseña: ")

# Validar la contraseña ingresada por el usuario
if validar_contrasena(contrasena_ingresada):
    print("La contraseña es segura.")
else:
    print("La contraseña no cumple con los criterios de seguridad.")


La contraseña es segura.


## Ejercicio 04

Extracción de URLs. Escriba un programa que extraiga todas las URLs válidas de un texto dado. Las URLs válidas deben comenzar con "http://" o "https://".

   *Texto de referencia:* "Visite nuestro sitio web en https://www.ejemplo.com para obtener más información sobre nuestros productos y servicios. También puede seguirnos en Twitter en https://twitter.com/ejemplo."

In [None]:
import re

def extraer_urls(texto):
    """
    Extrae URLs válidas del texto proporcionado utilizando expresiones regulares.

    Args:
        texto (str): El texto del cual se deben extraer las URLs.

    Returns:
        list: Una lista de URLs válidas encontradas en el texto.
    """

    # Patrón de expresión regular para extraer URLs válidas
    patron = r'https?://\S+'
    # Utilizamos re.findall para encontrar todas las coincidencias en el texto
    urls = re.findall(patron, texto)
    return urls

# Texto de referencia
texto_referencia = "Visite nuestro sitio web en https://www.ejemplo.com para obtener más información sobre nuestros productos y servicios. También puede seguirnos en Twitter en https://twitter.com/ejemplo."

# Extraer URLs del texto de referencia
urls_encontradas = extraer_urls(texto_referencia)

# Imprimir las URLs encontradas
print("URLs encontradas:")
for url in urls_encontradas:
    print(url)


## Ejercicio 05

Conteo de palabras. Diseñe un programa que cuente cuántas veces aparece una palabra específica en un texto dado. La búsqueda no debe diferenciar mayúsculas ni minúsculas. Es decir que «casa»
y «Casa» deben ser consideradas la misma palabra.

  *Texto de referencia:* "La conferencia comenzará a las nueve de la mañana. Por favor, llegue temprano para registrarse. La duración de cada sesión será de una hora."

In [None]:
def contar_palabra(texto, palabra_buscada):
    """
    Cuenta el número de veces que una palabra aparece en un texto.

    Args:
        texto (str): El texto en el que se buscará la palabra.
        palabra_buscada (str): La palabra que se desea contar.

    Returns:
        int: El número de veces que la palabra aparece en el texto.
    """
    # Convertir el texto y la palabra buscada a minúsculas para evitar la diferenciación de mayúsculas y minúsculas
    texto = texto.lower()
    palabra_buscada = palabra_buscada.lower()
    # Dividir el texto en palabras utilizando split()
    palabras = texto.split()
    # Inicializar el contador de apariciones de la palabra buscada
    contador = 0
    # Iterar sobre cada palabra en el texto
    for palabra in palabras:
        # Si la palabra coincide con la palabra buscada, aumentar el contador
        if palabra == palabra_buscada:
            contador += 1
    return contador

# Texto de referencia
texto_referencia = "La conferencia comenzará a las nueve de la mañana. Por favor, llegue temprano para registrarse. La duración de cada sesión será de una hora."

# Palabra a buscar
palabra_buscada = "mañana"

# Contar cuántas veces aparece la palabra buscada en el texto
apariciones = contar_palabra(texto_referencia, palabra_buscada)

# Imprimir el resultado
print(f"La palabra '{palabra_buscada}' aparece {apariciones} veces en el texto.")


## Ejercicio 06

Reemplazo de palabras. Cree un programa que reemplace todas las ocurrencias de una palabra específica por otra en un texto dado. El usuario debe ingresar la palabra a buscar y la palabra de reemplazo.

   *Texto de referencia:* "La comida vegetariana es una excelente opción para mantenerse saludable. Por favor, asegúrese de incluir una variedad de vegetales en su dieta diaria."

In [None]:
def reemplazar_palabra(texto, palabra_buscada, palabra_reemplazo):
    """
    Reemplaza todas las ocurrencias de una palabra en un texto con otra palabra.

    Args:
        texto (str): El texto en el que se realizará el reemplazo.
        palabra_buscada (str): La palabra que se desea reemplazar.
        palabra_reemplazo (str): La palabra que se utilizará como reemplazo.

    Returns:
        str: El texto modificado con las palabras reemplazadas.
    """
    texto_modificado = texto.replace(palabra_buscada, palabra_reemplazo)
    return texto_modificado

# Texto de referencia
texto_referencia = "La comida vegetariana es una excelente opción para mantenerse saludable. Por favor, asegúrese de incluir una variedad de vegetales en su dieta diaria."

# Solicitar al usuario que ingrese la palabra a buscar y la palabra de reemplazo
palabra_buscada = input("Ingrese la palabra a buscar: ")
palabra_reemplazo = input("Ingrese la palabra de reemplazo: ")

# Reemplazar todas las ocurrencias de la palabra buscada por la palabra de reemplazo en el texto de referencia
texto_modificado = reemplazar_palabra(texto_referencia, palabra_buscada, palabra_reemplazo)

# Imprimir el texto modificado
print("Texto modificado:")
print(texto_modificado)


## Ejercicio 07

Validación de código postal. Desarrolle un programa que valide si un código postal ingresado por el usuario es válido o no. El código postal válido debe tener un formato específico, como "XXXXX" o "XXXXX-XXXX".

   *Texto de referencia:* "Nuestra dirección es 12345 Main Street, Anytown, USA. El código postal es 54321-6789. Asegúrese de incluir el código postal correcto al completar el formulario."

In [None]:
import re

def validar_codigo_postal(codigo_postal):
    """
    Valida un código postal utilizando una expresión regular.

    Args:
        codigo_postal (str): El código postal a validar.

    Returns:
        bool: True si el código postal es válido, False en caso contrario.
    """
    # Patrón de expresión regular para validar el código postal
    patron = r'^\d{5}(-\d{4})?$'
    # Utilizamos re.match para verificar si la cadena coincide con el patrón
    if re.match(patron, codigo_postal):
        return True
    else:
        return False

# Texto de referencia
texto_referencia = "Nuestra dirección es 12345 Main Street, Anytown, USA. El código postal es 54321-6789. Asegúrese de incluir el código postal correcto al completar el formulario."

# Extraer códigos postales del texto de referencia
codigos_postales_encontrados = re.findall(r'\b\d{5}(?:-\d{4})?\b', texto_referencia)

# Imprimir los códigos postales encontrados
print("Códigos postales encontrados:")
for cp in codigos_postales_encontrados:
    if validar_codigo_postal(cp):
        print(cp + " es un código postal válido.")
    else:
        print(cp + " no es un código postal válido.")


## Ejercicio 08

Extracción de direcciones IP. Escriba un programa que extraiga todas las direcciones IP válidas de un texto dado. Las direcciones IP válidas deben seguir el formato "XXX.XXX.XXX.XXX", donde cada parte puede tener uno, dos o tres dígitos.

   *Texto de referencia:* "La dirección IP de nuestro servidor es 192.168.1.1. Asegúrese de configurar correctamente la dirección IP en su dispositivo para accedera la red”

In [None]:
import re

def extraer_direcciones_ip(texto):
    """
    Extrae direcciones IP válidas del texto dado.

    Args:
        texto (str): El texto en el que buscar direcciones IP.

    Returns:
        list: Una lista de direcciones IP válidas encontradas en el texto.
    """

    # Patrón de expresión regular para extraer direcciones IP válidas
    patron = r'\b(?:\d{1,3}\.){3}\d{1,3}\b'
    # Utilizamos re.findall para encontrar todas las coincidencias en el texto
    direcciones_ip = re.findall(patron, texto)
    return direcciones_ip

# Texto de referencia
texto_referencia = "La dirección IP de nuestro servidor es 192.168.1.1. Asegúrese de configurar correctamente la dirección IP en su dispositivo para acceder a la red."

# Extraer direcciones IP del texto de referencia
direcciones_ip_encontradas = extraer_direcciones_ip(texto_referencia)

# Imprimir las direcciones IP encontradas
print("Direcciones IP encontradas:")
for ip in direcciones_ip_encontradas:
    print(ip)


## Ejercicio 09

Búsqueda de hashtags. Diseñe un programa que identifique y extraiga todos los hashtags de un texto dado. Los hashtags deben comenzar con el símbolo "#" y pueden contener letras, números y guiones bajos.

Texto de referencia: "Únase a la conversación en las redes sociales utilizando el hashtag #ejemplo. Comparta sus experiencias y obtenga actualizaciones sobre nuestros últimos productos y promociones."

In [None]:
import re

def extraer_hashtags(texto):
    """
    Extrae hashtags de un texto dado.

    Parámetros:
    texto (str): El texto del cual extraer los hashtags.

    Returns:
    list: Una lista de hashtags encontrados en el texto.
    """
    
    # Patrón de expresión regular para extraer hashtags
    patron = r'#\w+'
    # Utilizamos re.findall para encontrar todas las coincidencias en el texto
    hashtags = re.findall(patron, texto)
    return hashtags

# Texto de referencia
texto_referencia = "Únase a la conversación en las redes sociales utilizando el hashtag #ejemplo. Comparta sus experiencias y obtenga actualizaciones sobre nuestros últimos productos y promociones."

# Extraer hashtags del texto de referencia
hashtags_encontrados = extraer_hashtags(texto_referencia)

# Imprimir los hashtags encontrados
print("Hashtags encontrados:")
for hashtag in hashtags_encontrados:
    print(hashtag)
