<h1><center><span style="color:blue;">Guía de Prompting para expresiones regulares en ChatGPT</span></center></h1>

---
## __Elaborado por:__
- 
- 
- 

---

## Introducción

Este manual busca que el usuario lleve tareas de Expresiones regulares a través del uso de técnicas de Prompt, específicamente usando el modelo de lenguaje largo CHATGPT

Para iniciar, vamos a conocer la respuesta a tres preguntas simples, pero esenciales:

**¿Qué son las Expresiones regulares?**

**¿Qué son los PROMPTS?**

Un prompt es una instrucción, pregunta o un texto que se utiliza para interactuar con sistemas de inteligencia artificial. Podríamos decir que es como un comando, con el que vas a pedirle a este sistema que realice una tarea concreta.
Las peticiones las harás a través de los prompts, que son los que utilizas para comunicarte con este sistema de IA.
Cuando se lo escribes, la inteligencia artificial analizará lo escrito en el prompt, y generará un contenido acorde a lo que le hayas pedido en este. Por lo tanto, es muy importante que te asegures de incluir todo lo que quieres de la manera que quieras.

**¿Por qué son importantes los PROMPTS para trabajar con la CHAT GPT?**

Al escribir tus indicaciones, ten en cuenta que CHATGPT está tratando de adivinar lo que debería seguir. Por lo tanto, es importante proporcionar instrucciones claras y ejemplos útiles. De esta manera, puedes ayudar a CHATGPT a entender el contexto y lograr la mejor finalización posible.

La calidad de el resultado que obtienes de una IA depende de tu prompt, depende de lo que hayas incluido en él. Por lo tanto, son el bien más importante para los usuarios que interactúan con estos automatismos digitales, ya que de ellos depende que el resultado sea acorde con lo que quieren o no.

## A. Sintaxis Básica de Expresiones Regulares

Antes de sumergirnos en técnicas avanzadas de "prompting", asegurémonos de tener una comprensión sólida de las expresiones regulares en sí. Aquí hay algunos conceptos clave:

- **Coincidencias básicas:** Representan caracteres específicos.

| Regex   | Descripción |
|:-------:|:------------|
| .       | Coincide con cualquier caracter, excepto con nueva linea |
| \d      | Coincide con cualquier dígito (0-9) |
| \D      | Coincide con cualquier caracter que no sea un dígito (0-9) |
| \w      | Coincide con cualquier caracter de palabra (a-z, A-Z, 0-9, _) |
| \W      | Coincide con cualquier caracter que no es de palabra |
| \s      | Coincide con espacios de cualquier tipo. (espacio, tab, nueva linea) |
| \S      | Coincide con cualquier carácter que no sea un espacio |


In [40]:
#Ejemplo en código: Coincidencia dígitos
import re

texto = " inserte @21_  texto" #texto de ejemplo
n = 0 
for linea in texto:
    if re.search("\d", linea): 
        print(linea) 
        n = n+1
        
print("El número de coincidencias es:",n)

2
1
El número de coincidencias es: 2


In [38]:
#Ejemplo en código: Coincidencia espacios en blanco
import re
texto = " inserte 21@_  texto aquí" #cualquier texto
n = 0
for linea in texto:
    if re.search("\s", linea): 
        n = n+1
        
print("El número de coincidencias es:",n)

El número de coincidencias es: 5


- **Límites:** Especifican la posición en el texto.

| Regex | Descripción |
|:-----:|:------------|
| ^     | Representa el principio de una línea de texto |
| $     | Representa el final de una línea de texto |
| \b    | Coincide con el límite de palabra |
| \B    | No coincide con el límite de palabra |

- **Cuantificadores:** Especifican la cantidad de veces que un elemento puede aparecer.

| Regex | Descripción |
|:-----:|:------------|
| ?     | Coincide con el elemento anterior 0 o 1 vez
| *     | Coincide con el elemento anterior 0 o más veces
| *?    | Empata con el elemento anterior cero o más veces, pero el menor número de veces que sea posible
| +     | Coincide con el elemento anterior una o más veces
| *?    | Empata con el elemento anterior cero o más veces, pero el menor número de veces que sea posible.
| ??    | Empata con el elemento anterior cero o una vez, pero el menor número de veces que sea posible.

- __Grupos y conjuntos de caracteres:__ Representan conjuntos de caracteres (por ejemplo, [0-9] para dígitos). Utilizar paréntesis para agrupar y capturar partes de la expresión.

| Regex | Descripción |
|:-----:|:------------|
| ( )    | Grupo
|[ ]    | Caracteres dentro de los brackets |
|[^  ]   | Caracteres que no están dentro de los brackets |
|{ }     | Número exacto |

# B. ¡Empecemos a crear consultas efectivas de expresiones regulares!

### 1. Elaboremos nuestras expresiones regulares
**PASO 1: Importamos el módulo *re***  
Hay que asegurarnos de importar el módulo “re” antes de iniciar nuestros scripts en Notebook. El módulo “re”, nos proporcionará las funciones para empezar a trabajar con las expresiones regulares.



In [1]:
import re

**PASO 2: Creamos nuestra expresión regular**  
Hay que definir la expresión regular que queremos usar. Podemos hacerlo en conjunto con los strings a extraer la información:

In [6]:
# Por ejemplo, para extraer fechas en formato dd/mm/yyyy
regex = r'(\d{2})/(\d{2})/(\d{4})'
string = "La fecha de hoy es 04/12/2023."

**PASO 3: Aplicamos las funciones predefinidas del módulo *re***  
Existen una serie de funciones predefinidas que nos ayudarán. Todas estas funciones se encuentran en un módulo llamado “*re*” (El cual fue importado en el Paso 1). En el capítulo A de este manual, hemos conocido con más detalle la aplicación de cada una de estas funciones.

In [7]:
#re.sub(regex,string)
#re.split(regex,string)
#re.search(regex,string)

**PASO 4: Codificamos el formato de los resultados buscados**    
Si nuestra expresión regular tiene grupos de captura (Regex encerrados en paréntesis en la función aplicada), podemos acceder a ellos utilizando el método group() del objeto de coincidencia.

In [10]:
resultado = re.search(regex, string)

if resultado:
    print("Día:", resultado.group(1))
    print("Mes:", resultado.group(2))
    print("Año:", resultado.group(3))
else:
    print("No hay coincidencias.")

Día: 04
Mes: 12
Año: 2023


### 2. ¡Empecemos a crear consultas efectivas de expresiones regulares en CHAT GPT!

Poemos usar ChatGPT o cualquier MLL para mejorar nuestras expresiones regulares, obtener ideas sobre cómo manejar casos específicos o incluso generar expresiones regulares más complejas.

**Paso 1: Definir un objetivo claro**  
Antes de empezar, debemos tener claro el objetivo de nuestra expresión regular.

**Paso 2: Iniciamos nuestra conversación con la MLL**  
Usa una pregunta específica para obtener información relevante. Por ejemplo:

In [12]:
#"¿Puedes proporcionar ejemplos de expresiones regulares para extraer direcciones de correo electrónico en un texto?"

**Paso 3: Analizar la Respuesta de ChatGPT**  
ChatGPT proporcionará ejemplos y explicaciones que podrían ayudarte a entender cómo construir tu expresión regular. Presta atención a los patrones sugeridos y cómo manejar diferentes casos.

**Paso 4: Construir tu Expresión Regular**  
Basándote en las sugerencias de ChatGPT, comienza a construir tu expresión regular. Asegúrate de tener en cuenta casos especiales y bordes.

**Paso 5: Probar tu Expresión Regular**  
Usa un entorno de desarrollo de Python o herramientas en línea para probar tu expresión regular con ejemplos de texto. Ajusta según sea necesario.

**Paso 6: Implementar en tu Aplicación**  
Integra tu expresión regular en tu aplicación o script de Python.

**Paso 7: Refinar y Optimizar**  
Si encuentras casos que tu expresión regular no maneja correctamente, refínala. Puedes repetir los pasos 3-6 para mejorar y optimizar tu expresión regular.

**Paso 8: Documentar tu Expresión Regular**  
Asegúrate de documentar tu expresión regular para que otros desarrolladores puedan entender su propósito y cómo usarla.

**Paso 9: Mantenimiento Continuo**  
Las expresiones regulares pueden necesitar ajustes con el tiempo. A medida que evoluciona tu aplicación o cambian los requisitos, revisa y actualiza según sea necesario.

### <center>¡Recuerda que mientras más específica sea tu pregunta a ChatGPT, mejores respuestas obtendrás!

## Ejemplos de Prompts para utilizar Expresiones Regulares (Regex)

### Ubicamos correos educativos

"Proporcióname un código en Python que utilice expresiones regulares para encontrar y mostrar todas las direcciones de correo electrónico que terminen en '.edu' en el archivo 'mbox-short.txt' disponible en el enlace 'http://www.py4inf.com/code/mbox-short.txt', utilizando una expresión regular sin importar mayusculas o minusculas."

In [2]:
import re
import urllib.request

# Descargar el contenido del archivo mbox-short.txt desde el enlace
url = "http://www.py4inf.com/code/mbox-short.txt"
response = urllib.request.urlopen(url)
data = response.read().decode("utf-8")

# Utilizar una expresión regular insensible a mayúsculas y minúsculas para encontrar direcciones de correo electrónico que terminen en ".edu"
pattern = r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[Ee][Dd][Uu]\b'
matches = re.findall(pattern, data, flags=re.IGNORECASE)

# Imprimir las direcciones encontradas
for match in matches:
    print(match)

200801051412.m05ECIaH010327@nakamura.uits.iupui.edu
louis@media.berkeley.edu
200801042308.m04N8v6O008125@nakamura.uits.iupui.edu
louis@media.berkeley.edu
louis@media.berkeley.edu
louis@media.berkeley.edu
zqian@umich.edu
200801042109.m04L92hb007923@nakamura.uits.iupui.edu
zqian@umich.edu
zqian@umich.edu
zqian@umich.edu
rjlowe@iupui.edu
200801042044.m04Kiem3007881@nakamura.uits.iupui.edu
rjlowe@iupui.edu
rjlowe@iupui.edu
rjlowe@iupui.edu
zqian@umich.edu
200801042001.m04K1cO0007738@nakamura.uits.iupui.edu
zqian@umich.edu
zqian@umich.edu
zqian@umich.edu
zqian@umich.edu
rjlowe@iupui.edu
200801041948.m04JmdwO007705@nakamura.uits.iupui.edu
rjlowe@iupui.edu
rjlowe@iupui.edu
rjlowe@iupui.edu
cwen@iupui.edu
200801041635.m04GZQGZ007313@nakamura.uits.iupui.edu
cwen@iupui.edu
cwen@iupui.edu
cwen@iupui.edu
hu2@iupui.edu
cwen@iupui.edu
200801041633.m04GX6eG007292@nakamura.uits.iupui.edu
cwen@iupui.edu
cwen@iupui.edu
cwen@iupui.edu
hu2@iupui.edu
gsilver@umich.edu
200801041611.m04GB1Lb007221@nakamura.u