![title](./images/logo_nao_digital.png)

# 2 Conocimientos sobre mejores prácticas de prompt engineering

## 1. Objetivo

Tras exponer los principios de los modelos generativos de lenguaje, el equipo de *SmartMedia* realizó un segundo reporte interno de investigación con el objetivo de conocer los principios y técnicas para optimizar el diseño de prompt y con ello obtener mejores resultados a las preguntas de interés y que será un documento de apoyo para el proceso de prompt engineering.

# 2 Mejores prácticas en la construcción de prompts

## 2.1 Estructura de los prompts

Cómo hemos visto, los resultados de un prompt se ven fuertemente afectados por la información que se especifica en su estructura y las tareas con las que los modelos LLM pueden ayudarnos son amplias. En términos generales, podemos pensar que el diseño de un prompt puede contener los siguentes elementos:

* **Instrucción:** tarea específica que queremos que el modelo nos ayude a llevar a cabo,
* **Contexto:** se refiere a información externa o adicional que podemos añadir para que el modelo tenga mayores elementos para darnos una respuesta adecuada,
* **Datos de entrada:** se refiere a la pregunta de entrada en la que queremos encontrar una respuesta,
* **Formato de salida:** se refiere a la forma en la que esperamos la respuesta, por ejemplo a través de inciso, listas, párrafos de cierto longitud y demás.

Cabe destacar que los elementos anteriores son opcionales en el diseño de un prompt, pero son una buena estructura a seguir para obtener respuestas más informativas a nuestras preguntas.

## 2.2 Principios generales a seguir en el diseño de Prompts

A continuación se resumen algunos de los principios de diseño recomendados por empresas como [OpenAI](https://help.openai.com/en/articles/6654000-best-practices-for-prompt-engineering-with-openai-api#h_1951f30f08)
 y [DeepLearning.ai](https://www.deeplearning.ai/short-courses/chatgpt-prompt-engineering-for-developers/)


a) Colocar instrucciones al inicio del prompt.

**Menos efectivo** ❌
```
Quiero que analices el texto: {... algún texto ...}.
Crea un resumen a partir del mismo.
```

**Mejor** ✅:
```
Resume el texto a continuación:

Texto: """
{... algún texto ...}
"""


b) Usar signos específicos para establecer una separación entre las instrucciones y el contexto del prompt.

**Menos efectivo** ❌
```
Resume el texto a continuación como una lista de incisos de los puntos más importantes.

{... algún texto ...}
```

**Mejor** ✅:
```
Resume el texto a continuación como una lista de incisos de los puntos más importantes.

Texto: """
{... algún texto ...}
"""
```

c) Ser específicos y descriptivos acerca de
 * contexto, 
 * tipo de formato y la longitud su texto de salida que se espera, 
 * el estilo en que se desea recibir la información, y 
 * toda los detalles relevantes para resolver el problema.

**Menos efectivo** ❌
```
Crea un texto sobre inteligencia artificial. 
```

**Mejor** ✅:
```
Escribe un texto de dos párrafos acerca de la importancia de la inteligencia artificial en el desarollo de la tecnología en los últimos 20 años. La redacción del texto deberá seguir un estilo informal y entendible para un público sin conocimientos tecnológicos.
```

d) Si se desea obtener un formato de salida específico, este se puede especificar a través del nombre de la extension deseada (JSON, CSV, HTML y demás) o bien con ejemplos de como se espera recibir.

**Menos efectivo** ❌
```
Inventa equipos de beisbol con sus nombres, apodos, estados donde se ubican y cantidad de títulos ganados. 
```

**Mejor** ✅:
```
Genera una lista de tres equipos de baseball inventados junto con sus nombres, apodos, estados donde se ubican y cantidad de títulos ganados.
Proporciónalos en formato JSON con las siguiente estructura: 
team_id, name, nickname, num_titles.
```

e) Usar descripciones precisas en el diseño del prompt, evitando terminos vagos e imprecisos:

**Menos efectivo** ❌
```
Crea un resumen corto del siguiente texto: 
```

**Mejor** ✅:
```
Crea un resumen de 50 palabras del siguiente texto: 
```


f) En lugar de solo decir qué no hacer, mejor especificar que si se debe hacer en su lugar.

**Menos efectivo** ❌
```
Crea un texto sobre inteligencia artificial que no sea demasiado largo.
```

**Mejor** ✅:
```
Crea un texto sobre inteligencia artificial usando con un máximo de 5 párrafos de largo.
```

g) Espeficia uno por uno a los pasos necesarias para llevar a cabo una tarea

**Menos efectivo** ❌
```
Traduce un resumen el siguiente texto al ingles, francés y alemán, dando los resultados en una tabla:

Texto:
"""{... algun texto..}"""
```

**Mejor** ✅:
```
Realiza las siguientes acciones:

A. Crea un resumen del siguiente texto delimitado por comillas.
B. Crea una traducción del texto resumido a los idiomas ingles, francés y alemán,
C. Crea una tabla en formato CSV, en donde una columna tenga el idioma de la traducción realizada y la otra tenga el texto traducido. Esta deberá tener los nombres translation_idiom y traslated_text para cada uno de los campos descritos.

Texto:
"""{... algun texto..}"""
```

h) Pidele al modelo que revise si ciertas condiciones se cumplen para generar un resultado.

**Menos efectivo** ❌
```
Dime si el siguiente texto corresponde a un conjunto instrucciones:

¡Hacer una taza de té es fácil! Primero, necesitas conseguir algo de agua hirviendo. 
Mientras eso sucede, toma una taza y pon una bolsa de té en ella.
Una vez que el agua está lo suficientemente caliente, solo viértelo sobre la bolsita de té.
Déjalo reposar un poco para que el té se remoje. Después de unos minutos, saca la bolsita de té.
Ahora la taza de té está lista para disfrutar.
```

**Mejor** ✅:
```
Se le proporcionará texto delimitado por comillas triples. Si éste contiene una secuencia de instrucciones, vuelva a escribir esas instrucciones en el siguiente formato:

Paso 1 - ...

Paso 2 - ...

...

Paso N - ...

Si el texto no contiene una secuencia de instrucciones, entonces simplemente escriba "No se proporcionan pasos."

Texto:
"""¡Hacer una taza de té es fácil! Primero, necesitas conseguir algo de agua hirviendo. 
Mientras eso sucede, toma una taza y pon una bolsa de té en ella.
Una vez que el agua está lo suficientemente caliente, solo viértelo sobre la bolsita de té.
Déjalo reposar un poco para que el té se remoje. Después de unos minutos, saca la bolsita de té.
Ahora la taza de té está lista para disfrutar."""
```

## 2.3 Técnicas avanzadas en Prompt Engineering I

A continuación se resumen algunas de las técnicas y metodologías recomendadas en el diseño óptimos de prompts para obtener resultados más informativos.

A. **Zero Shot Prompting:** ésta técnica se refiere a que un modelo puuede generar una respuesta adecuada cuando no se le provee un prompt que no necesariamente fue parte de su conjunto de entrenamiento. En el siguiente ejemplo se logra una clasificación del sentimiento de una oración que fue inventada al redactar el presente reporte:

*Prompt Ejemplo*
```
Clasifica el texto en positivo, neutral o negativo:

Texto: La inteligencia artificial tiene beneficios potenciales para el desarrollo humano.

Clasificación:
```

B. **Few Shot Prompting:** ésta técnica se refiere a que el modelo es guiado a una respuesta a partir de ejemplos, sin necesariamente proveer una instrucción explícita de la acción que debe realizar. 
Veamos esto con el siguiente ejemplo:

*Prompt Ejemplo*
```
Texto: La bebida de naranja es sensacional

Clasificación: Positivo

Texto: Los gatos son animales pequeños.

Clasificación: Neutro

Texto: La actitud del comentarista es nefasta

Clasificación: Negativo

Texto: La lista de reproducción del gimnasio hoy fue terrible

Clasificación:
```

C. **Role Prompting:** ésta técnica se refiere a que le especifiquemos al modelo que actue como una persona con ciertas capacidades de interés para el problema que queremos resolver. Este tipo de técnica es útil para recibir retroalimentación por ejemplo de áreas especializadas sobre un texto en redacción, por ejemplo código con errores, guía tecnica o críticas y mejoras en redacciones o bien para recibir lluvias de ideas.

*Prompt Ejemplo*
```
Actua como un experto en temas de inteligencia artificial y en divulgación científica.
Explícame como funciona un red neuronal.
```

D. **Iterative Prompting:** se refiere a perfeccionar los resultados de experimentación en el diseños de los prompts, para 1) probar una idea de prompt, 2) analizar los resultados, 3) corregir los posibles errores y rediseñar los prompts para corregir los posibles errores que el modelo haya tenido, indicandole como corregirlos o estableciendo nuevas restricciones a las tareas, formatos o mayor amplitud en nuestras descripciones.

La iteración puede optimizar los resultados, pero usualmente requiere cierto nivel de expertise en técnicas de prompt engineering e invertir grandes cantidades de tiempo hasta obtener resultados satisfactorios.

**Figura 1: Iterative prompting**

![title](./images/iterative_prompting.png)

## 2.4 Técnicas avanzadas en Prompt Engineering II

En esta segunda parte se resumen algunas técnicas más avanzadas de prompt engineerig.

E. **Chain-of-Thought:** ésta técnica se refiere, a alto nivel, a presentar ejemplos en el prompt, de una forma similar a como se hace en *Few Shots Prompting*, en los cuales se presente un razonamiento de inferencia para que el modelo pueda inferir del mismo y con ello extrapolar el proceso a nuevos output.

**Figura 2: Chain-of-Thought**

![title](./images/cot.png)

Para mayor referencia consultar el artículo [J. Wei et al. *Chain-of-Thought Prompting Elicits Reasoning in Large Language Models*. CoRR.abs/2201.11903. 2023](https://arxiv.org/abs/2201.11903)

E. **Self-Consistency:** Es un enfoque que simplemente le pide a un modelo el mismo aviso varias veces y toma el resultado que se repite con mayor volumen como la respuesta final
**Figura 3: Self-Consistency**

![title](./images/self_consistency.png)

Para mayor referencia consultar el artículo [X. Wang et al. *Self-Consistency Improves Chain of Thought Reasoning in Language Models*. arXiv. pre-print. 2022](https://arxiv.org/abs/2201.11903)

E. **Generated-Knowledge:** en esencia trata de incluir una serie de ejemplos donde hay un "razonamiento" para extraer conocimiento de determinadas situaciones, de forma que el modelo pueda abstraer este proceso par contestar preguntas complejas basadas en dicho generación de conocomiento nuevas.

**Figura 4: Generated-Knowledge**

![title](./images/generated_knowledge.png)

Se recomienda consultar el artículo [J. Liu et al. *Generated Knowledge Prompting for Commonsense Reasoning*. arXiv. 2110.08387v3. 2022](https://arxiv.org/abs/2201.11903)

E. **Otras técnicas:** Dado que los modelos LLM son de introducción reciente, la forma de mejorar los prompts es un campo activo de investigación actualmente y muchas técnicas se continuan desarrollando al día de hoy. Dos artículos que reflejan el estado del arte al respecto son 1) [J. White. *A Prompt Pattern Catalog to Enhance Prompt Engineering with ChatGPT*. arXiv. pre-print. 2023.](https://arxiv.org/abs/2302.11382), y [J. Kaddour et. al. (2023). Challenges and Applications of Large Language Models. arXiv:2307.10169](https://arxiv.org/abs/2307.10169)

## 3. Entregables

En esta sección se describen los entregables de la segunda etapa quue consisten en un script de conversación entre el usuario y el ChatBot basado en un LLM, o bien el script de conversación y captura de pantalla de la imagen generada en un archivo en formato específico. Para ello se deberán emplear aplicaciones que usen modelos generativos como ChatGPT, Bard o DALL-E según corresponda

Al respecto del caso de prueba de *SmartMedia*:

**Texto a Texto**

A. Diseña scripts de texto con prompts que permitan conocer:

    1) una lista de todos los equipos de baseball de los estados unidos, considerando el nombre del equipo, el apodo del mismo, año de fundación y el nombre de sus respectivas mascotas. En caso que de no se pueda determinar alguno de estar valor, se deberá usar el valor "desconocido" para indicarlo.
   
    2) se deberá proporcionar lo anterior como output del prompt el un formato .csv, es decir, el resultado del prompt que genere dicha tabla se deberá salvar en un archivo de texto y salvar con el formato baseball_usa_pets.csv, con el nombre correspondiente de cada columna. 

B. Diseña scripts de texto con prompts que permitan, desde el punto de vista de un experto en marketing para equipos deportivos profesionales, saber:

    1) ¿cuáles son los puntos en que los accionistas se deberían enfocar para emprender el relanzamiento de la imagen del equipo de los osos de Montana?,
   
    2) La lista de acciones concretas que se recomienda, según el experto, para relanzar la marca considerando considerando que se quiere volver a apuntarlas la presenciar del club medios digitales que se estimen relevantes,

    3) En complemento, se deberá incluir una lista de 15 nuevos slogan para asociar con la mascota Monty, incentivando la imagen de la familia, el compañerismo, la fraternidad y evitando menciones a temas polémicos como uso de alcohol y otras drogas. Tales slogan pueden estar inspirados en los de otros equipos de baseball u otros deportes colectivos, además estar traducidos al inglés, español, francés y alemán, que son las lenguas principales de los fanáticos del equipo.

En cada caso, el script de conversación, junto con los outputs de cada chatbot deberá guardarse en un archivo .txt con el formato (conversacion_i.txt donde i es la letra de inciso asociado). Adicionalmente se deberá adjuntar capturar de pantalla en formato .png donde se aprecia el cuerpo de las conversaciones generadas por los ChatBots, se pueden usar numeraciones sucesivas sin son muchas fotos, ejemplo: evidencia_1_conversacion_i.png, evidencia_2_conversacion_i.png, ..., evidencia_5_conversacion_i.png
