## «*He aprendido a no intentar convencer a nadie. El trabajo de convencer es una falta de respeto, es un intento de colonización del otro*».
### [José Saramago](https://es.wikipedia.org/wiki/Jos%C3%A9_Saramago)

# Taller 01 expresiones regulares en Python

Los objetivos de este taller son:

* Comprender qué son las expresiones regulares y su importancia en el procesamiento de texto.

* Aprender la sintaxis básica de las expresiones regulares en Python.

* Practicar la aplicación de expresiones regulares en la manipulación y búsqueda de texto.

* Familiarizarse con herramientas y recursos para trabajar eficientemente con expresiones regulares.

## Definición y conceptos básicos

Las **expresiones regulares** (*regex* o *regexp*) son secuencias de caracteres que definen un patrón de búsqueda.

Estos patrones se utilizan para encontrar cadenas de texto que coincidan con ciertos criterios dentro de un texto más grande.

Los patrones de búsqueda pueden incluir caracteres literales (como letras y números) y metacaracteres (que representan clases de caracteres, repeticiones, posiciones en el texto, y otros más).

## Información adicional y herramientas online para trabajar con expresiones regulares

Información adicional:

* [re — Regular expression operations](https://docs.python.org/3/library/re.html)

* [W3Schools](https://www.w3schools.com/python/python_regex.asp)

Herramientas online:

* [Regex101](https://regex101.com/)
* [Regexr](https://regexr.com/)

# Sintaxis básica de las expresiones regulares en Python

## Caracteres literales y metacaracteres

Los caracteres literales representan sus mismos valores en una expresión regular.

Caracteres literales: a, b, 123, y similares.

Los metacaracteres son caracteres con un significado especial en expresiones regulares.

Metacaracteres: cualquier carácter (excepto nueva línea), * (0 o más repeticiones), + (1 o más repeticiones), ? (0 o 1 repetición).


In [1]:
# Importar la librería requerida
import re

# Crear una cadena de texto de referencia
texto = "Python es genial!"

# Ejemplo de caracteres literales
# 'es' coincide con los caracteres literales 'es'
coincidencias_0 = re.findall(r'es', texto)

# Resultado: ['es']
print(coincidencias_0)

# Ejemplo de metacaracteres
# \w+ coincide con una o más ocurrencias de cualquier carácter alfanumérico
coincidencias_1 = re.findall(r'Py\w+n', texto)

# Resultado: ['Python']
print(coincidencias_1)

['es']
['Python']


## Clases de caracteres y cuantificadores:

Las clases de caracteres permiten especificar un conjunto de caracteres que coinciden con uno cualquiera de ellos.

Los cuantificadores se utilizan para especificar la cantidad de veces que se debe repetir un carácter o un conjunto de caracteres.

Ejemplo:

Clases de caracteres:
* [A-Z] (cualquier letra mayúscula)
* [a-z] (cualquier letra minúscula)
* [0-9] (cualquier dígito)
* [aeiou] (cualquier vocal)

Cuantificadores:
* {m} (exactamente m repeticiones)
* {m, n} (entre m y n repeticiones)
* {m,} (al menos m repeticiones)
* {,n} (hasta n repeticiones)

In [2]:
# Importar la librería requerida
import re

# Ejemplo de clases de caracteres y cuantificadores
texto = "La contraseña es 123456"

# Coincide con exactamente seis dígitos
coincidencias_2 = re.findall(r'\d{6}', texto)

# Resultado: ['123456']
print(coincidencias_2)

['123456']


## Grupos de captura y grupos sin captura:

Los grupos de captura permiten extraer partes específicas de una cadena coincidente.

Los grupos sin captura agrupan subexpresiones sin realizar capturas.

Ejemplo:

Grupo de captura:
* (\w+) (captura una palabra)
* (\d{3}) (captura un número de tres dígitos)

Grupo sin captura:
* (?:\w+) (agrupa una palabra sin captura)
* (?:\d{3}) (agrupa un número de tres dígitos sin captura)

In [3]:
# Importar la librería requerida
import re

# Ejemplo de grupos con captura
numero_telefono = "El número de teléfono es 555-1234567"

# Dos grupos de captura para el código de área y el número
patron_0 = r'(\d{3})-(\d{7})'

# Encontrar todas las coincidencias
coincidencias_3 = re.findall(patron_0, numero_telefono)

# Resultado: [('555', '1234567')]
print(coincidencias_3)

# Ejemplo de grupos sin captura
texto = "Este es un ejemplo de expresión regular"

# Grupo sin captura para "un" seguido de una palabra
patron_1 = r'(?:un\s)(\w+)'

# Encontrar todas las coincidencias
coincidencias_4 = re.findall(patron_1, texto)

# Resultado: ['ejemplo']
print(coincidencias_4)

[('555', '1234567')]
['ejemplo']


## Uso de caracteres especiales como \b, ^, $,

Los caracteres especiales tienen un significado especial en expresiones regulares y se utilizan para representar ciertas posiciones en el texto, como el inicio o el final de una línea, límites de palabra.

Ejemplo:

* ^: coincide con el inicio de una cadena o línea.
* $: coincide con el final de una cadena o línea.
* \b: límite de palabra

In [None]:
# Importar la librería requerida
import re

# Ejemplo de uso de caracteres especiales:
texto = "Python es un lenguaje de programación. Python es poderoso"

# Coincide solo si la cadena comienza con 'Python'
patron_inicio = r'^Python'

# Coincide solo si la cadena termina con 'poderoso'
patron_final = r'poderoso$'

 # Coincide solo con la palabra 'Python' como una palabra completa
patron_palabra = r'\bPython\b'

# Buscar el inicio de la cadena
inicio = re.findall(patron_inicio, texto)
print("Coincidencias al inicio:", inicio)

# Buscar el final de la cadena
final = re.findall(patron_final, texto)
print("Coincidencias al final:", final)

# Buscar la palabra 'Python' como una palabra completa
palabra = re.findall(patron_palabra, texto)
print("Coincidencias de palabra completa:", palabra)

# Librería *re*

La librería ***re*** de Python proporciona funciones para trabajar con expresiones regulares.

## re.match(patron, cadena)

Esta función intenta hacer coincidir el patrón especificado al principio de la cadena. Si hay una coincidencia, devuelve un objeto de coincidencia; de lo contrario, devuelve *None*.

In [None]:
# Importar la librería requerida
import re

# Crear una cadena de texto de referencia
cadena = "Python es un lenguaje de programación"

# Crear un patrón de referencia
patron = r'Python'

# Buscar el patrón en la cadena
resultado = re.match(patron, cadena)

# Mostrar el resultado
if resultado:
    print("Se encontró una coincidencia:", resultado.group())
else:
    print("No se encontró ninguna coincidencia")

## re.search(patron, cadena)

Esta función busca en toda la cadena una coincidencia con el patrón especificado. Si se encuentra una coincidencia, devuelve **un** objeto de coincidencia; de lo contrario, devuelve *None*.

In [None]:
# Importar la librería requerida
import re

# Crear una cadena de texto de referencia
cadena = "Python es un lenguaje de programación"

# Crear un patrón de referencia
patron = r'lenguaje'

# Buscar el patrón en la cadena
resultado = re.search(patron, cadena)

# Mostrar el resultado
if resultado:
    print("Se encontró una coincidencia:", resultado.group())
else:
    print("No se encontró ninguna coincidencia")

## re.findall(patron, cadena)

Esta función encuentra todas las coincidencias del patrón en la cadena y devuelve **una lista** de todas las coincidencias.

In [None]:
# Importar la librería requerida
import re

# Crear una cadena de texto de referencia
cadena = "Python es un lenguaje de programación. Python es poderoso"

# Crear un patrón de referencia
patron = r'Python'

# Buscar el patrón en la cadena
resultado = re.findall(patron, cadena)

# Mostrar el resultado
print("Coincidencias encontradas:", resultado)

## re.sub(patron, reemplazo, cadena)

Esta función busca todas las coincidencias del patrón en la cadena y las **reemplaza** con el texto especificado en el argumento de reemplazo.

In [4]:
# Importar la librería requerida
import re

# Crear una cadena de texto de referencia
cadena = "Python es un lenguaje de programación"

# Crear un patrón de referencia
patron = r'lenguaje'

# Reemplazar el patrón en la cadena
reemplazo = "idioma"

# Buscar el patrón en la cadena
resultado = re.sub(patron, reemplazo, cadena)

# Mostrar el resultado
print("Cadena modificada:", resultado)

Cadena modificada: Python es un idioma de programación


## Ejemplos de usos de expresiones regulares

### Validación de formatos de datos

Verificación de números de teléfono, direcciones de correo electrónico, códigos postales.

In [6]:
# Importar la librería requerida
import re

def verificar_texto(texto):
    """Verifica la presencia de números de teléfono, direcciones de correo
    electrónico y códigos postales en un texto.

    Args:
        texto (str): El texto en el que se buscarán los patrones.

    Returns:
        tuple: Una tupla que contiene listas de números de teléfono,
        direcciones de correo electrónico  códigos postales encontrados en el
        texto, respectivamente.
    """
    # Patrón para verificar números de teléfono
    patron_telefono = r'\b\d{3}-\d{3}-\d{4}\b'

    # Patrón para verificar direcciones de correo electrónico
    patron_correo = r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b'

    # Patrón para verificar códigos postales (formato de 5 dígitos)
    patron_codigo_postal = r'\b\d{5}\b'

    # Buscar números de teléfono en el texto
    telefonos = re.findall(patron_telefono, texto)

    # Buscar direcciones de correo electrónico en el texto
    correos = re.findall(patron_correo, texto)

    # Buscar códigos postales en el texto
    codigos_postales = re.findall(patron_codigo_postal, texto)

    return telefonos, correos, codigos_postales

# Texto de ejemplo para verificar
texto_ejemplo = """
Mi número de teléfono es 123-456-7890 y mi correo es ejemplo@gmail.com.
Vivo en la calle 1234 y mi código postal es 12345.
Puedes llamarme al 555-123-4567 o escribirme a otroejemplo@hotmail.com.
"""

# Verificar el texto de ejemplo
telefonos, correos, codigos_postales = verificar_texto(texto_ejemplo)

# Mostrar los resultados
print("Números de teléfono encontrados:", telefonos)
print("Direcciones de correo electrónico encontradas:", correos)
print("Códigos postales encontrados:", codigos_postales)

Números de teléfono encontrados: ['123-456-7890', '555-123-4567']
Direcciones de correo electrónico encontradas: ['ejemplo@gmail.com', 'otroejemplo@hotmail.com']
Códigos postales encontrados: ['12345']


### Búsqueda de patrones específicos en un texto

Encontrar palabras clave, fechas, direcciones.

In [5]:
# Importar la librería requerida
import re

def encontrar_informacion(texto):
    """Encuentra palabras clave, fechas y direcciones en un texto.

    Args:
        texto (str): El texto en el que se buscarán los patrones.

    Returns:
        tuple: Una tupla que contiene listas de palabras clave, fechas y
        direcciones encontradas en el texto, respectivamente.
    """
    # Patrón para buscar palabras clave (ejemplo: "importante", "urgente",
    # "importante", etc.)
    patron_palabra_clave = r'\b(importante|urgente|crítico)\b'

    # Patrón para buscar fechas en formato dd/mm/yyyy
    patron_fecha = r'\b(\d{1,2}/\d{1,2}/\d{4})\b'

    # Patrón para buscar direcciones (ejemplo: "calle 123", "avenida principal",
    # "plaza central", etc.)
    patron_direccion = r'\b(calle|avenida|plaza)\s[A-Za-z]+\s\d+\b'

    # Buscar palabras clave en el texto
    palabras_clave = re.findall(patron_palabra_clave, texto)

    # Buscar fechas en el texto
    fechas = re.findall(patron_fecha, texto)

    # Buscar direcciones en el texto
    direcciones = re.findall(patron_direccion, texto)

    return palabras_clave, fechas, direcciones

# Texto de ejemplo para verificar
texto_ejemplo = """
La reunión es muy importante y urgente. Se llevará a cabo el 15/02/2024 en la
calle principal 123. No olvides traer el informe crítico. La dirección es
avenida central 456. Nos vemos allí.
"""

# Encontrar información en el texto de ejemplo
palabras_clave, fechas, direcciones = encontrar_informacion(texto_ejemplo)

# Mostrar los resultados
print("Palabras clave encontradas:", palabras_clave)
print("Fechas encontradas:", fechas)
print("Direcciones encontradas:", direcciones)

Palabras clave encontradas: ['importante', 'urgente', 'crítico']
Fechas encontradas: ['15/02/2024']
Direcciones encontradas: ['calle', 'avenida']


### Filtrado y limpieza de datos en conjuntos de texto grandes

In [7]:
# Importar la librería requerida
import re

def limpiar_texto(texto):
    """Filtra y limpia un texto eliminando caracteres no deseados y
    palabras comunes.

    Args:
        texto (str): El texto que se va a limpiar.

    Returns:
        str: El texto limpio.
    """
    # Convertir todo el texto a minúsculas
    texto = texto.lower()

    # Eliminar caracteres no alfabéticos excepto espacios
    texto = re.sub(r'[^a-z\s]', '', texto)

    # Eliminar palabras comunes que no aportan significado
    palabras_inutiles = {'el', 'la', 'los', 'las', 'un', 'una', 'unos', 'unas',
                         'de', 'del', 'al', 'con', 'para', 'por', 'sobre',
                         'entre', 'hacia'}

    # Dividir el texto en palabras
    palabras = texto.split()

    # Crear una lista para almacenar las palabras filtradas
    palabras_filtradas = []

    # Filtrar palabras comunes
    for palabra in palabras:
        if palabra not in palabras_inutiles:
          palabras_filtradas.append(palabra)

    # Reconstruir el texto limpio
    texto_limpio = ' '.join(palabras_filtradas)

    return texto_limpio

# Texto de ejemplo
texto_ejemplo = """
En un lugar de la Mancha, de cuyo nombre no quiero acordarme, no ha mucho tiempo
 que vivía un hidalgo de los de lanza en astillero, adarga antigua, rocín flaco
  y galgo corredor.
"""

# Limpiar el texto de ejemplo
texto_limpio = limpiar_texto(texto_ejemplo)

# Mostrar el texto limpio
print("Texto limpio:")
print(texto_limpio)


Texto limpio:
en lugar mancha cuyo nombre no quiero acordarme no ha mucho tiempo que viva hidalgo lanza en astillero adarga antigua rocn flaco y galgo corredor


# Ejercicios

## Ejercicio 00

Validación de dirección de correo electrónico. Diseñar un programa que valide si una cadena ingresada por el usuario es una dirección de correo electrónico válida o no. La dirección de correo electrónico válida debe seguir el formato estándar de "usuario@dominio.com".

   *Texto de referencia:* "Por favor, envíe su solicitud a john.doe@example.com. Asegúrese de incluir su nombre completo y número de teléfono en el cuerpo del correo electrónico."

In [23]:
# Resuelva en esta celda el ejercicio
import re
def verificar_correo(correo):
  """
  Verificar si una direccion de correo electronico es valida

  Args:
    correo (str): Direccion de correo electronico a validar

  Returns:
    bool: si el correo es valido o no
  """
  patron = r"^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$"
  return re.match(patron, correo) is not None

verificar_correo(input())

Bienvenido al validador de correos electrónicos.
Ingrese una dirección de correo electrónico para validar: angel
'angel' no es una dirección de correo electrónico válida.

Extrayendo y validando direcciones de correo electrónico en el texto de referencia...
Direcciones de correo válidas encontradas:
 - john.doe@example.com


## Ejercicio 01

Extracción de números de teléfono. Escribir un programa que extraiga todos los números de teléfono válidos de un texto dado. Los números de teléfono válidos deben seguir el formato XXX-XXX-XXXX.

   *Texto de referencia:* "Puede comunicarse con nuestro servicio al cliente llamando al 555-123-4567. También puede enviar un mensaje de texto al número 555-987-6543 para obtener ayuda rápida."




In [25]:
# Resuelva en esta celda el ejercicio
import re
def extraer_telefonos(texto):
  """Extrae todos los numeros de telefono de una cadena de texto

  Args:
    texto (str): Cadena de texto de la que se extraen los telefonos

  Returns:
    (list): Lista que contiene todos los numeros de telefono
  """
  patron_telefono = r'\b\d{3}-\d{3}-\d{4}\b'
  return re.findall(patron_telefono, texto)

print(extraer_telefonos(input()))


 "Puede comunicarse con nuestro servicio al cliente llamando al 555-123-4567. También puede enviar un mensaje de texto al número 555-987-6543 para obtener ayuda rápida."
['555-123-4567', '555-987-6543']


## Ejercicio 02

Búsqueda de fechas. Desarrolle un programa que identifique y extraiga todas las fechas válidas en un texto dado. Las fechas válidas deben estar en formato "DD/MM/AAAA".

   *Texto de referencia:* "La reunión está programada para el 15/02/2024. Por favor, confirme su asistencia antes de esa fecha. Recuerde que el plazo para enviar el informe es el 28/02/2024."

In [38]:
# Resuelva en esta celda el ejercicio
import re
import datetime
def extraer_fechas(texto):
  """ Extrae las fechas de una cadena string

  Args:
    texto (str): Cadena de texto de la cual extraer las fechas

  Returns:
    (list): Lista de objetos datetime con las fechas
  """
  patron_fecha = r'\b(\d{1,2}/\d{1,2}/\d{4})\b'
  fechas = re.findall(patron_fecha, texto)
  fechas_datetime = []
  for fecha in fechas:
    fechas_datetime.append(datetime.datetime.strptime(fecha, "%d/%m/%Y"))
  return fechas_datetime

print(extraer_fechas(input()))

"La reunión está programada para el 15/02/2024. Por favor, confirme su asistencia antes de esa fecha. Recuerde que el plazo para enviar el informe es el 28/02/2024."
[datetime.datetime(2024, 2, 15, 0, 0), datetime.datetime(2024, 2, 28, 0, 0)]


## Ejercicio 03

Validación de contraseñas seguras. Cree un programa que valide si una contraseña ingresada por el usuario es segura o no. Una contraseña segura debe tener al menos ocho caracteres de longitud y contener al menos una letra mayúscula, una letra minúscula, un número y un carácter especial.

   *Texto de referencia:* "Su contraseña debe tener al menos 10 caracteres de longitud y contener al menos una letra mayúscula, una letra minúscula, un número y un carácter especial. Por favor, elija una contraseña segura."

In [46]:
def validar_contraseña(contraseña):
    """ Valida si una contraseña es correcta
      Args:
        contraseña: Contraseña a validar

      Returns:
        (bool): Si la contraseña cumple las politicas
    """

    patron = r"^(?=.*[a-z])(?=.*[A-Z])(?=.*\d)(?=.*[@$!#%*?&])[A-Za-z\d@$!%*#?&]{8,}$"
    return re.match(patron, contraseña) is not None

print(validar_contraseña(input()))


Anorak2801#
True


## Ejercicio 04

Extracción de URLs. Escriba un programa que extraiga todas las URLs válidas de un texto dado. Las URLs válidas deben comenzar con "http://" o "https://".

   *Texto de referencia:* "Visite nuestro sitio web en https://www.ejemplo.com para obtener más información sobre nuestros productos y servicios. También puede seguirnos en Twitter en https://twitter.com/ejemplo."

In [52]:
import re

def extraer_urls(texto):
    """Extraer urls de un texto
    Args:
        texto: Cadena de str de la cual extraer todos los urls
    Returns:
        list: Lista con los urls extraidos del texto
    """
    patron = r'\bhttps?:\/\/(?:www\.)?[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}(?:\/[^\s]*)?\b'
    return re.findall(patron, texto)
print(extraer_urls(input()))

Visite nuestro sitio web en https://www.ejemplo.com para obtener más información sobre nuestros productos y servicios. También puede seguirnos en Twitter en https://twitter.com/ejemplo.
['https://www.ejemplo.com', 'https://twitter.com/ejemplo']


## Ejercicio 05

Conteo de palabras. Diseñe un programa que cuente cuántas veces aparece una palabra específica en un texto dado. La búsqueda no debe diferenciar mayúsculas ni minúsculas. Es decir que «casa»
y «Casa» deben ser consideradas la misma palabra.

  *Texto de referencia:* "La conferencia comenzará a las nueve de la mañana. Por favor, llegue temprano para registrarse. La duración de cada sesión será de una hora."

In [56]:
import re

def contar_palabra_especifica(texto, palabra_buscada):
    """Contar la cantidad de veces que se repite una palabra en un texto
    Args:
        texto(str): Texto en el que se va a hacer la busqueda
        palabra_buscada(str): Palabra que se va a buscar en el texto
    Returns:
        int: Cantidad de veces que se repite la palabra
    """
    palabras = re.findall(r'\b\w+\b', texto.lower())
    palabra_buscada = palabra_buscada.lower()
    return palabras.count(palabra_buscada)

texto_usuario = input("Ingrese el texto: ")
palabra = input("Ingrese la palabra que desea buscar: ")

print(contar_palabra_especifica(texto_usuario, palabra))

Ingrese el texto: La conferencia comenzará a las nueve de la mañana. Por favor, llegue temprano para registrarse. La duración de cada sesión será de una hora.
Ingrese la palabra que desea buscar: la
3


## Ejercicio 06

Reemplazo de palabras. Cree un programa que reemplace todas las ocurrencias de una palabra específica por otra en un texto dado. El usuario debe ingresar la palabra a buscar y la palabra de reemplazo.

   *Texto de referencia:* "La comida vegetariana es una excelente opción para mantenerse saludable. Por favor, asegúrese de incluir una variedad de vegetales en su dieta diaria."

In [60]:
import re

texto = input("Ingrese el texto en el que desea reemplazar: ")
busqueda = input("Ingrese la palabra que se va a reemplazar: ")
reemplazo = input("Ingrese la palabra con la que se va a reemplazar:")
print(re.sub(busqueda, reemplazo, texto.lower()))

Ingrese el texto en el que desea reemplazar: La comida vegetariana es una excelente opción para mantenerse saludable. Por favor, asegúrese de incluir una variedad de vegetales en su dieta diaria
Ingrese la palabra que se va a reemplazar: vegetales
Ingrese la palabra con la que se va a reemplazar:carne
la comida vegetariana es una excelente opción para mantenerse saludable. por favor, asegúrese de incluir una variedad de carne en su dieta diaria


## Ejercicio 07

Validación de código postal. Desarrolle un programa que valide si un código postal ingresado por el usuario es válido o no. El código postal válido debe tener un formato específico, como "XXXXX" o "XXXXX-XXXX".

   *Texto de referencia:* "Nuestra dirección es 12345 Main Street, Anytown, USA. El código postal es 54321-6789. Asegúrese de incluir el código postal correcto al completar el formulario."

In [82]:
import re

def validar_codigo_postal(codigo_postal):
    """Valida si un código postal tiene un formato válido.

    Formato válido: "XXXXX" o "XXXXX-XXXX"

    Args:
        codigo_postal (str): El código postal a validar.

    Returns:
        bool: True si es válido, False si no.
    """
    # Expresión regular para el formato de código postal
    patron = r"^\d{5}(-\d{4})?$"
    return bool(re.match(patron, codigo_postal))

# Solicitar código postal al usuario
codigo_postal = input("Ingrese el código postal: ")

# Validar el código postal
if validar_codigo_postal(codigo_postal):
    print("El código postal es válido.")
else:
    print("El código postal no es válido. Debe ser del formato 'XXXXX' o 'XXXXX-XXXX'.")

Ingrese el código postal: 54321-6789
El código postal es válido.


## Ejercicio 08

Extracción de direcciones IP. Escriba un programa que extraiga todas las direcciones IP válidas de un texto dado. Las direcciones IP válidas deben seguir el formato "XXX.XXX.XXX.XXX", donde cada parte puede tener uno, dos o tres dígitos.

   *Texto de referencia:* "La dirección IP de nuestro servidor es 192.168.1.1. Asegúrese de configurar correctamente la dirección IP en su dispositivo para accedera la red”

In [75]:
import re

def extraer_ips(texto):
    """Extrae todas las direcciones ip de un texto
    Args:
        texto (str): Texto a extraer las direcciones ip
    Returns:
        list: Lista de las direcciones ip
    """
    patron = r'\b(?:\d{1,3}\.){3}\d{1,3}\b'
    return re.findall(patron, texto)

print(extraer_ips(input()))

192.168.0.119 uwgduywgdwd
['192.168.0.119']


## Ejercicio 09

Búsqueda de hashtags. Diseñe un programa que identifique y extraiga todos los hashtags de un texto dado. Los hashtags deben comenzar con el símbolo "#" y pueden contener letras, números y guiones bajos.

Texto de referencia: "Únase a la conversación en las redes sociales utilizando el hashtag #ejemplo. Comparta sus experiencias y obtenga actualizaciones sobre nuestros últimos productos y promociones."

In [76]:
import re

def extraer_hashtags(texto):
    """Extrae todos los hashtags de un texto.

    Args:
        texto (str): El texto del que se extraerán los hashtags.

    Returns:
        list: Lista de hashtags encontrados.
    """
    # Expresión regular para hashtags
    patron = r"#\w+"
    return re.findall(patron, texto)

# Ejemplo de uso
texto_usuario = input("Ingrese el texto: ")
hashtags = extraer_hashtags(texto_usuario)

print("Hashtags encontrados:")
print(hashtags)


Ingrese el texto: Únase a la conversación en las redes sociales utilizando el hashtag #ejemplo. Comparta sus experiencias y obtenga actualizaciones sobre nuestros últimos productos y promociones.
Hashtags encontrados:
['#ejemplo']
