# Guideline for Prompt engineering

## Introducción (o ¿Qué es el procesamiento del lenguaje natural?)

En este momento, el procesamiento del lenguaje natural (PLN o NLP) es una de las áreas más populares de la inteligencia artificial (IA) gracias a aplicaciones como generadores de texto que:

* componen ensayos coherentes
* chatbots que engañan a las personas haciéndoles creer que son sensibles
* programas de conversión de texto a imagen que producen imágenes fotorrealistas

En los últimos modelos de IA están desbloqueando áreas en las que el texto es abundante.

### ¿Qué es el procesamiento del lenguaje natural? 

El procesamiento del lenguaje natural es la disciplina que busca construir máquinas que puedan manipular el lenguaje humano (o datos que se asemejan al lenguaje humano) en la forma en que se escribe, se habla y se organiza. 

Evolucionó a partir de la lingüística computacional, que utiliza la informática para comprender los principios del lenguaje, pero en lugar de desarrollar marcos teóricos, el NLP es una disciplina de ingeniería que busca desarrollar tecnología para realizar tareas útiles. 

El NLP se puede dividir en dos subcampos superpuestos: 

* comprensión del lenguaje natural, que se centra en el análisis semántico o la determinación del significado previsto del texto, y 
* generación del lenguaje natural, que se centra en la generación de texto por una máquina. 

Nota: El NLP está separado del reconocimiento de voz, pero a menudo se usa junto con él, que busca analizar el lenguaje hablado en palabras, convirtiendo el sonido en texto y viceversa (ver, por ejmeplo: https://medium.com/@kbdhunga/summarizing-youtube-videos-using-openai-whisper-gpt-3-5690c9a57b78).

### ¿Por qué es importante el NLP?

Porque hoy día los agentes más sofisticados, como GPT-3, que recientemente se abrió para aplicaciones comerciales, pueden generar prosa sofisticada sobre una amplia variedad de temas, así como potentes chatbots capaces de mantener conversaciones coherentes. 

Google utiliza el NLP para mejorar los resultados de sus motores de búsqueda y redes sociales como Facebook la utilizan para detectar y filtrar el discurso de odio.

El NLP es cada vez más sofisticado y será difícil dar seguimiento.

### ¿Para qué se utiliza el procesamiento del lenguaje natural (PLN)?

* El análisis de sentimientos es el proceso de clasificar la intención emocional del texto.

<img src="Sentiment.png" alt="Sentiment" width="800" height="400">

* La clasificación de toxicidad es una rama del análisis de sentimientos donde el objetivo no es sólo clasificar la intención hostil sino también clasificar categorías particulares como amenazas, insultos, obscenidades y odio hacia ciertas identidades.
* La traducción automática automatiza la traducción entre diferentes idiomas.
* El reconocimiento de entidades tiene como objetivo extraer entidades en un fragmento de texto en categorías predefinidas, como nombres personales, organizaciones, ubicaciones y cantidades.
<img src="Entity.png" alt="Sentiment" width="400" height="300">

* La detección de spam es un problema de clasificación binaria frecuente en PNL, donde el propósito es clasificar los correos electrónicos como spam o no.
* Los modelos de corrección de errores gramaticales codifican reglas gramaticales para corregir la gramática dentro del texto.
* El modelado de temas es una tarea de minería de textos no supervisada que toma un corpus de documentos y descubre temas abstractos dentro de ese corpus.
* La generación de texto, más formalmente conocida como generación de lenguaje natural, produce texto similar al texto escrito por humanos.
* La recuperación de información encuentra los documentos que son más relevantes para una consulta. Este es un problema al que se enfrenta todo sistema de búsqueda y recomendación.
<img src="Information.png" alt="Sentiment" width="400" height="300">

* El resumen es la tarea de acortar el texto para resaltar la información más relevante.
* La respuesta a preguntas consiste en responder preguntas planteadas por humanos en un lenguaje natural.

## Principales técnicas de procesamiento del lenguaje natural (PNL)
La mayoría de las tareas de NLP pueden modelarse mediante una docena de técnicas generales. Es útil pensar en estas técnicas en dos categorías: métodos tradicionales de aprendizaje automático y métodos de aprendizaje profundo.

### Técnicas tradicionales de PLN de aprendizaje automático:

* La regresión logística es un algoritmo de clasificación supervisado que tiene como objetivo predecir la probabilidad de que ocurra un evento en función de alguna entrada. En PNL, los modelos de regresión logística se pueden aplicar para resolver problemas como el análisis de sentimientos, la detección de spam y la clasificación de toxicidad.
* Naive Bayes es un algoritmo de clasificación supervisado que encuentra la distribución de probabilidad condicional P (etiqueta | texto) utilizando la fórmula de Bayes.

Por ejemplo:
<img src="Tree.png" alt="Sentiment" width="600" height="300">

### Deep learning NLP Techniques: 

Algunos modelos populares son:
* BERT y sus amigos Muppet: muchos modelos de aprendizaje profundo para PNL llevan el nombre de personajes de los Muppet, incluidos ELMo, BERT, Big BIRD, ERNIE, Kermit, Grover, RoBERTa y Rosita. La mayoría de estos modelos son buenos para proporcionar incorporaciones contextuales y una representación mejorada del conocimiento.
* Generative Pre-Trained Transformer 3 (GPT-3) es un modelo de 175 mil millones de parámetros que puede escribir prosa original con fluidez equivalente a la humana en respuesta a una solicitud de entrada. El modelo se basa en la arquitectura del transformador. La versión anterior, GPT-2, es de código abierto. Microsoft adquirió una licencia exclusiva para acceder al modelo subyacente de GPT-3 de su desarrollador OpenAI, pero otros usuarios pueden interactuar con él a través de una interfaz de programación de aplicaciones (API). Varios grupos, incluidos EleutherAI y Meta, han publicado interpretaciones de código abierto de GPT-3.

### ¿En qué esta basado el NLP?

* Aprendizaje Profundo: Aprendizaje a partir de ejemplos etiquetados mediante el uso varias capas de redes neuronales.

<img src="NNR.png" alt="NNR" width="400" height="300">

### Algunos antecedentes

<img src="Antecedentes.png" alt="Antecedentes" width="1000" height="600">

### Transformers

Una estructura que permite procesar toda la secuencia de entrada simultáneamente. Trabajo de Ashish Vaswani , et al, (2017).


<img src="Transformers.png" alt="Transformers" width="600" height="600">

### LLMs y el diseño de Prompts

#### Concepto clave: Text-to-Action es la capacidad de convertir el lenguaje natural en acciones automatizadas.

### Word embeddings

Es un método utilizado en el NLP para representar palabras o documentos como vectores numéricos. 

Estos vectores capturan el significado y las relaciones entre palabras. 

Facilitan la generación de lenguaje y el análisis de sentimiento.

Al asignar valores numéricos a palabras sobre la base de sus similitudes semánticas, la técnica ayuda a los modelos de redes neuronales a comprender el contexto de forma más eficiente.

<img src="WordEmbeddings.png" alt="WordEmbeddings" width="1100" height="300">

### See: https://projector.tensorflow.org/


## Diseño de promts

* Usaremos el modelo chatGPT de OpenAI, que se llama GPT 3.5 Turbo
* Profundizaremos en más detalles sobre el formato y las entradas del chat
* See: https://www.deeplearning.ai/courses/


## Herramientas

<img src="Tools.png" alt="Tools" width="600" height="500">

### Ideas generales del Chat GPT 4 y GPT 4o

En el desarrollo de grandes modelos de lenguaje (LLM), ha habido en términos generales dos tipos de LLM: LLM básicos (base LLM) y LLM ajustados por instrucción (instruction-tuned LLM). 

* Un base LLM ha sido entrenado para predecir la siguiente palabra basándose en datos de entrenamiento de texto, a menudo entrenado con una gran cantidad de datos de Internet y otras fuentes para determinar cuál es la siguiente palabra más probable a seguir. Por ejemplo, "había una vez un unicornio", ¿pueden completar esto?, ¿puede predecir la siguiente palabra?, digamos "que vivía en un bosque mágico con todos los amigos unicornios"

* Un instruction-tuned LLM ha sido capacitado para seguir instrucciones. Por ejemplo, si le preguntará ¿cuál es la capital de Francia?, la respuesta es "la capital de Francia es París". Es decir, está afinado con entradas y salidas que son instrucciones

Entonces, cuando utilicemos un instruction-tuned LLM piensa en darle instrucciones a otra persona, digamos a alguien que sea inteligente pero que no conozca los detalles de su tarea. 

Entonces, cuando un LLM no funciona, a veces es porque las instrucciones no fueron lo suficientemente claras.

<img src="LLM.png" alt="Sentiment" width="600" height="500">

# Temperatura o cómo ser un Stochastic Parrot no es tan malo

* Estos modelos de lenguaje tienen un parámetro llamado "temperatura" que nos permitirá cambiar el tipo de variedad de las respuestas del modelo.

* Podemos pensar en la temperatura como el grado de exploración o el tipo de aleatoriedad del modelo.

* A temperaturas más altas, los resultados del modelo son más aleatorios. 

* Es posible pensar que a temperaturas más altas el asistente se distrae más pero tal vez sea más creativo.

* Por ejemplo: 

<img src="Temperature.png" alt="Temperature" width="400" height="300">

## ¿Cómo puede ayudarte el uso de Chat GPT en tu día a día?

Sigue estos pincipios (o aprende a diseñar un Prompt efectivo (Prompt engineering))

1. Escribe instrucciones claras y específicas y
2. Dale tiempo al modelo para pensar.

#### 1. Escribe instrucciones claras y específicas. 

* Expresa lo que quiere que haga un modelo proporcionando instrucciones que sean lo más claras y específicas posible. Esto guiará el modelo hacia el resultado deseado y reducirá la posibilidad de que obtengas respuestas irrelevantes o incorrectas.
* No confundas escribir un mensaje claro con escribir un mensaje breve, porque en muchos casos, los mensajes más largos en realidad brindan más claridad y contexto para el modelo, lo que en realidad puede conducir a resultados más detallados y relevantes.

Algunas estrategías: 

* Utiliza delimitadores para indicar claramente distintas partes de la entrada.

text = "Debe expresar lo que quiere que haga un modelo proporcionando instrucciones que sean lo más claras y específicas posible. Esto guiará el modelo hacia el resultado deseado y reducirá las posibilidades de recibir respuestas irrelevantes o incorrectas. No confunda escribir un mensaje claro con escribir un mensaje breve. En muchos casos, las indicaciones más largas brindan más claridad y contexto para el modelo, lo que puede conducir a resultados más detallados y relevantes."

prompt = "
Resume el texto delimitado por triples comillas en una sola frase.
"""{text}""" "

* Pide un resultado estructurado. Para facilitar el análisis de los resultados del modelo, puede resultar útil solicitar un resultado estructurado como HTML, JSON o una lista de Python.

promt = "Genera una lista de tres títulos de libros inventados junto con sus autores y géneros. Proporciónalos en formato JSON con las siguientes claves: book_id, título, autor, género."

* Utiliza delimitadores + Pide un resultado estructurado.

prompt = Resume el texto delimitado por comillas en no más de 2 párrafos. Genera una lista las autoridades o funcionarias públicas mencionadas. Identifica fechas o periodos que se mencionen. "{text}"

text = https://www.argentina.gob.ar/noticias/se-pone-en-marcha-el-regimen-de-promocion-del-empleo-registrado 

* Solicta al modelo que verifique si se cumplen las condiciones. Entonces, si la tarea hace suposiciones que no necesariamente se cumplen, entonces podemos decirle al modelo que verifique estas suposiciones primero. Y luego, si no están satisfechas, que lo indique y detenga el proceso antes de intentar completar la tarea por completo.

text = "¡Preparar una taza de té es fácil! Primero, necesitas poner un poco de agua a hervir. Mientras eso sucede, toma una taza y ponle una bolsita de té. Una vez que el agua esté lo suficientemente caliente, simplemente viértela sobre la bolsita de té. Déjalo reposar un rato para que el té se repose. Después de unos minutos, saca la bolsita de té. Si quieres puedes añadir un poco de azúcar o leche al gusto. ¡Y eso es! Tienes una deliciosa taza de té para disfrutar."

promt = "Se le proporcionará un texto delimitado por comillas triples. Si el texto contiene una secuencia de instrucciones, vuelva a escribir esas instrucciones en el siguiente formato:

Paso 1 - ...
Paso 2 - ...
…
Paso N - ...

Si el texto no contiene una secuencia de instrucciones, simplemente escriba "No se proporcionaron pasos"."

* Proporciona ejemplos de ejecuciones exitosas de la tarea que desea realizar antes de pedirle al modelo que realice la tarea real que desea que realice.

promt = Se te proporcionará un texto de un dialogo, si no es el caso, responde “no es un dialogo”. Tu tarea es responder con un estilo coherente lo siguiente “{text}”

text = "

<Niño> : Enséñame sobre la paciencia.

< Abuelo> : El río que labra el valle más profundo brota de un modesto manantial; la sinfonía más grandiosa se origina a partir de una sola nota; el tapiz más intrincado comienza con un hilo solitario.

<Niño> : Enséñame sobre la resiliencia.

"

prompt = Tu tarea es ayudar a un equipo de marketing a crear una descripción de un sitio web minorista de un producto basado en una ficha técnica.
Escribe una descripción del producto basada en la información prevista en las especificaciones técnicas incluidas en la imagen que te proporcionaré.
Utiliza como máximo 50 palabras.

text = https://www.ejemplos.co/ficha-tecnica/ 

<img src="Ficha.png" alt="Ficha" width="400" height="300">

#### Dale tiempo al modelo para pensar. 

Si un modelo comete errores de razonamiento al apresurarse a llegar a una conclusión incorrecta, debe intentar replantear la consulta para solicitar una cadena o serie de razonamientos relevantes antes de que el modelo proporcione su respuesta final. 

Otra forma de pensar en esto es que si le asignas a un modelo una tarea que es demasiado compleja para que la realice en un corto período de tiempo o en una pequeña cantidad de palabras, es posible que haga una suposición que probablemente sea incorrecta--esto también le pasaría a una persona--. 

Si le pide a alguien que complete una pregunta matemática compleja sin tiempo para resolver la respuesta primero, es probable que también cometa un error. 

Entonces, en estas situaciones, puede indicarle al modelo que piense más en un problema, lo que significa que dedica más esfuerzo computacional a la tarea.

* Especifica los pasos necesarios para completar una tarea.


* Instruye al modelo para que encuentre su propia solución antes de apresurarse a llegar a una conclusión. 

A veces obtenemos mejores resultados cuando instruimos explícitamente a los modelos a razonar su propia solución antes de llegar a una conclusión. 

### Limitaciones

* Aunque el modelo GPT 3.5 y GPT 4 ha estado expuesto a una gran cantidad de conocimiento durante su proceso de entrenamiento, no ha memorizado perfectamente la información que ve y, por lo tanto, no conoce muy bien los límites de su conocimiento. 

* Esto significa que puede intentar responder preguntas sobre temas oscuros y puede inventar cosas que parecen plausibles pero que en realidad no son ciertas. 

* A estas ideas fabricadas las llamamos alucinaciones.

* Una estrategía para reducir las alucinaciones, en el caso de que desee que el modelo genere respuestas basadas en un texto, es pedirle que primero encuentre cualquier cita relevante del texto o proporcionarle la fuente donde consultar (esto lo veremos más adelante).

prompt = f"""
Tell me about AeroGlide UltraSlim Smart Toothbrush by Boie
"""

## Un ejemplo más y algunas recomendaciones

* Quizás me hayas oído decir que cuando entreno un modelo de aprendizaje automático, casi nunca funciona la primera vez. 

* Las probabilidades de que funcione la primera vez son quizás bajas, pero no importa si la primera indicación funciona, lo que más importa es el proceso para llegar a las indicaciones que funcionan para su aplicación.

* Esta también es la razón por la que recomiendo no prestar tanta atención a los artículos de Internet que dicen "Los 30 promts perfectos para ..." 

* Probablemente no existe un promt perfecto para todo.

Ejemplo:

fact_sheet_chair = """
OVERVIEW
- Part of a beautiful family of mid-century inspired office furniture, 
including filing cabinets, desks, bookcases, meeting tables, and more.
- Several options of shell color and base finishes.
- Available with plastic back and front upholstery (SWC-100) 
or full upholstery (SWC-110) in 10 fabric and 6 leather options.
- Base finish options are: stainless steel, matte black, 
gloss white, or chrome.
- Chair is available with or without armrests.
- Suitable for home or business settings.
- Qualified for contract use.

CONSTRUCTION
- 5-wheel plastic coated aluminum base.
- Pneumatic chair adjust for easy raise/lower action.

DIMENSIONS
- WIDTH 53 CM | 20.87”
- DEPTH 51 CM | 20.08”
- HEIGHT 80 CM | 31.50”
- SEAT HEIGHT 44 CM | 17.32”
- SEAT DEPTH 41 CM | 16.14”

OPTIONS
- Soft or hard-floor caster options.
- Two choices of seat foam densities: 
 medium (1.8 lb/ft3) or high (2.8 lb/ft3)
- Armless or 8 position PU armrests 

MATERIALS
SHELL BASE GLIDER
- Cast Aluminum with modified nylon PA6/PA66 coating.
- Shell thickness: 10 mm.
SEAT
- HD36 foam

COUNTRY OF ORIGIN
- Italy
"""

PROMT_1 = " Tu tarea es ayudar a un equipo de marketing a crear una
descripción de un sitio web minorista de un producto basado
en una ficha técnica.

Escribe una descripción del producto basada en la información
prevista en las especificaciones técnicas delimitadas por
triples comillas.

Las especificaciones técnicas son las siguientes "{fact_sheet_chair}" "

PROMT_2 = " Tu tarea es ayudar a un equipo de marketing a crear una
descripción de un sitio web minorista de un producto basado
en una ficha técnica.

Escribe una descripción del producto basada en la información
prevista en las especificaciones técnicas delimitadas por
triples comillas.

Utilice como máximo 50 palabras.

Las especificaciones técnicas son las siguientes "{fact_sheet_chair}" "

## Iterar

Cuando se entrena un modelo de aprendizaje automático casi nunca funciona la primera vez. 

En general, cuando programamos una serie de indicaciones, las probabilidades de que nuestro código funcione la primera vez son quizás un bajas, pero conforme revisamos e iteramos, al final, nuestro código funcionará.

Como dijimos, esto aplica a los promts--así que no presten tanta atención a los artículos de Internet que dicen que tienen los 30 promts más efectivos, etc., ya que probablemente no existe un prompt perfecto para todos.

### El proceso iterativo

1. Intenta una vez.
2. Analiza en que casos o donde los resultados no proporcionan los resultados deseados.
3. Clarifica las instrucciones o dale más tiempo al modelo para pensar.
4. Refina tu prompt con algunos ejemplos.

<img src="Iterate.png" alt="Iterate" width="400" height="300">

## Resumir

Resumir un texto centrándose en temas específicos.

text = "Compré este peluche de panda para el cumpleaños de mi hija, a quien le encanta y lo lleva a todas partes. Es suave y súper lindo, y su cara tiene una mirada amigable. Aunque es un poco pequeño para lo que pagué. Creo que puede haber otras opciones más grandes por el mismo precio. Llegó un día antes de lo esperado, así que pude jugar con él antes de dárselo."

prompt_1 = "Tu tarea es generar un breve resumen de una reseña de producto de un sitio de comercio electrónico.
Resuma la siguiente reseña, delimitada por triples comillas. Emplea un máximo de 30 palabras. Revisión: """{text}"""."

prompt_2 = "Tu tarea es generar un breve resumen de una reseña de producto de un sitio de comercio electrónico para enviar comentarios al departamento responsable de determinar el precio del producto.
Resuma la siguiente reseña, delimitada por triples comillas. Emplea un máximo de 30 palabras y centrate en cualquier aspecto que sea relevante para el precio y el valor percibido. Revisión: """{text}"""."

## Transformar

* Los LLM son muy buenos para transformar su entrada a un formato diferente, como ingresar un fragmento de texto en un idioma y transformarlo o traducirlo a un idioma diferente, o ayudar con correcciones ortográficas y gramaticales. 

* Es posible tomar como entrada un fragmento de texto que puede no ser correcto gramaticamente y arreglarlo un poco.

text = "El éxito de cualquier política puvlica no solo recae en su planeación y en ponerla en march, sino también, depende que tanto la sociedad cre y confía en la capacidad del govierno para diseñar las estrategías que garanticen el bienestar de la población por encima de los intereses de un partido o de un grupo."

prompt_1 = "Revisa y corrige este texto: "{text}"."

prompt_2 = "Revisa y corrige el siguiente texto. Hazlo más convincente. Asegúrese de que siga la guía de estilo APA y esté dirigido a un lector especializado en economía. Texto: "{text}"."

* Podemos transformar formatos como HTML y generar un JSON.

* Pero más interesante, podemos transformar el tono. La redacción puede variar según la audiencia prevista y ChatGPT puede producir diferentes tonos.

prompt_1 = "Traduce el siguiente texto al español tanto en su forma formal como informal: '¿Te gustaría pedir una almohada?'"

promot_2 = "Traduce el siguiente texto en un tono coloquial a una carta en tono comercial: "Amigo, soy Juan, mira las especificaciones de esta lámpara de pie"."

## Expandir e inferir

* Expandir es la tarea de tomar un fragmento de texto más corto, como un conjunto de instrucciones o una lista de temas, y hacer que el LLM genere un fragmento de texto más largo, como un correo electrónico o un ensayo sobre algún tema (más adelante regresaremos a este punto).

* Hay algunos usos excelentes de esto: utilizar un LLM como compañero en una lluvia de ideas. 

* Pero también hay algunos casos de uso problemáticos de esto: generar una gran cantidad de spam. 

* Por lo tanto, úsalo de manera responsable y de una manera que ayude a las personas.

* Un uso importante es inferir:

review = "Compré el celular y llegó en perfecto estado, cero rayones y batería al 99%. El único detalle es que es fabricado en EUA, entonces no cuenta con la charola de sim, fue un problema poderle poner mi línea ya que tuve que contratar un plan de Telcel (solo así te dan la eSIM) y eso implica un gasto mensual más, además de que tardé unos 4 días en poder hacer todo el trámite, tampoco es compatible con otras compañías como Dalefon (tenía otra línea de esta compañía que tampoco pude activar en este cel). Llegó con cable usb genérico"

prompt = "Eres un asistente de IA de servicio al cliente. Tu tarea es enviar una respuesta por correo electrónico a un cliente valioso. Dado el comentario del cliente delimitado por comillas, genera una respuesta para agradecer al cliente por su reseña. Asume que el sentimiento es negativo, por lo tanto discúlpate y sugiere que se comuniquen con el servicio de atención al cliente. Asegúrese de utilizar detalles específicos de la revisión. Escribe en un tono conciso y profesional. Firma el correo electrónico como "Agente de cliente de AI". Comentario del cliente: "{review}"."

prompt = Eres un analista de inversiones en México que esta preparando una nota informativa. Tu tarea es analizar el reporte financiero de una empresa mexicana. Tu tarea es identificar el nombre de al compañía, el país o los países donde tiene operaciones y listar el valor de las ventas en cada mercado. Responde en un tono profesional. Considera que tu audiencia es un grupo de expertos financieros. "{report}"

report = https://s22.q4cdn.com/604986553/files/doc_financials/2024/q2/2t24.pdf 


Sources:
* https://www.deeplearning.ai/resources/natural-language-processing/
* https://www.deeplearning.ai/short-courses/


## Implementemos un GPT - Personalizado

* Sólo disponible con la opción de pago.

* Instrucciones: Creando a "Examinator"

1. Un chat que te ayude a preparar tus exámenes
2. Crear un logo
3. Rol y objetivo: “El objetivo de Examinator es hacer un examen de opción múltiple sobre el documento que te suba. Será un examen de 20 preguntas con 4 opciones por cada preguntas. Una de las opciones será la correcta y las otras 3 serán falsas. El examen debe ser de nivel difícil, es decir, que las respuestas se parezcan entre sí para que la persona tenga que pensar bien la respuesta. Las preguntas pueden ser largas o cortas, eso no es relevante. El tono del examen debe ser educativo, formal y profesional. Haz sólo una pregunta a la vez, espera a que responda e indiques si es correcto o incorrecto y después continúa con la siguiente pregunta. Inicia el examen diciendo: “Que inicien los juegos del hambre” ”


### Usando una tecnología de Google:

* https://notebooklm.google.com/?original_referer=https:%2F%2Ft.co%23&pli=1
