# Tutorial de prompting efectivos para expresiones regulares 

### Concepto
Las expresiones regulares, también conocidas como regex o regexp, son patrones de búsqueda utilizados para encontrar, validar o manipular cadenas de texto de manera eficiente. En Python, el módulo 're' proporciona funciones y métodos para trabajar con expresiones regulares.

### ¿Por qué usar Expresiones Regulares?
Permiten realizar búsquedas, extracciones y validaciones eficientes en cadenas de texto. Son útiles para manipular y transformar texto, analizar archivos de log, realizar web scraping, validar formularios y automatizar tareas de edición de texto. Con su capacidad para definir patrones específicos, las expresiones regulares facilitan la manipulación y análisis de datos de manera precisa y eficaz en una variedad de aplicaciones de programación y procesamiento de información.

### Sintaxis básica

Caracteres literales:
- $ abc $ : Coincide con la secuencia 'abc'.
Metacaracteres:
- $ . $ : Cualquier carácter excepto nueva línea.
- $ * $ : Cero o más repeticiones del carácter anterior.
- $ + $ : Una o más repeticiones del carácter anterior.
- $ ? $ : Cero o una repetición del carácter anterior.
-  ^  : Coincide al principio de la cadena.
-  $  : Coincide al final de la cadena.

Conjunto de caracteres:
-  [aeiou] : Coincide con cualquier vocal.

Secuencia de escape:
-  \d  : Cualquier dígito.
- \w : Cualquier carácter alfanumérico.
- \s : Cualquier espacio en blanco.



### Documentación oficial de Python de expresiones regulares
- https://docs.python.org/es/3/howto/regex.html

### Ejemplo:
- Leyendo archivo de texto 

In [1]:
# LEER
fichero=open("retext.txt","r", encoding="utf-8")
leer=fichero.read()
fichero.close()
print(leer)

Este es un texto variado con múltiples tipos de datos para practicar expresiones regulares:

Conoce tu futura universidad junto a tus familiares y amigos
disfruta esta gran experiencia molinera en la mejor universidad del Perú en Ciencias Agrícolas.

Más información: https://admision.lamolina.edu.pe/talleres
Informes WhatsApp: 937413951 / 978585632

Direcciones de correo electrónico:
usuario1@example.com, correo.123@dominio.co, correo@empresa.org,
otrocorreo@email.com, usuario_sin_arroba.com, correo_erroneo@.com,
email_valido@subdominio.net, direccion@dominio.com.mx,
correo@dominio.invalido, correo_con_simbolos@dominio.co.uk,
correo123@email.com, ejemplodecorreo@gmail.com

Números de teléfono sin guión:
943854789, 945384284, 934857643, 943284768, 953287366

Números de teléfono con guión:
 

URLs:
https://www.facebook.com, http://youtube.com, https://discord.com/
https://chat.openai.com/, https://visualstudio.microsoft.com/es/
https://open.spotify.com/intl-es

Fechas:
15/03/2023, 2023-0

- Contar las veces que aparece @ en el texto y buscar las lineas que lo contiene:

In [3]:
import re
text = open("retext.txt")
i=0
for linea in text:
    linea = linea.rstrip()
    x= re.findall('@',linea)
    if len(x) > 0:
        i += len(x)  ##i = i + len(x)
        #print(x) 
print(i)
text.close()

texto = open("retext.txt")
for linea in texto:
    linea = linea.rstrip()
    x = re.findall('.+@.+', linea)
    if len(x) > 0:
        print(linea)
        print(x)

11
usuario1@example.com, correo.123@dominio.co, correo@empresa.org,
['usuario1@example.com, correo.123@dominio.co, correo@empresa.org,']
otrocorreo@email.com, usuario_sin_arroba.com, correo_erroneo@.com,
['otrocorreo@email.com, usuario_sin_arroba.com, correo_erroneo@.com,']
email_valido@subdominio.net, direccion@dominio.com.mx,
['email_valido@subdominio.net, direccion@dominio.com.mx,']
correo@dominio.invalido, correo_con_simbolos@dominio.co.uk,
['correo@dominio.invalido, correo_con_simbolos@dominio.co.uk,']
correo123@email.com, ejemplodecorreo@gmail.com
['correo123@email.com, ejemplodecorreo@gmail.com']


- Contar el número de espacios en blanco en el texto:

In [2]:
import re
text = open("retext.txt")
i=0
for linea in text:
    linea = linea.rstrip()
    x= re.findall(' ',linea)
    if len(x) > 0:
        i += len(x)  ##i = i + len(x)
        #print(x) 
print(i)
text.close()

93


- Busca líneas en el texto que contiene 'https'

In [5]:
text = open("retext.txt")
for linea in text:
    linea = linea.rstrip()
    if linea.find('https')>= 0:
        print(linea)


MÃ¡s informaciÃ³n: https://admision.lamolina.edu.pe/talleres
https://www.facebook.com, http://youtube.com, https://discord.com/
https://chat.openai.com/, https://visualstudio.microsoft.com/es/
https://open.spotify.com/intl-es
