<a href="https://colab.research.google.com/github/amos-fernandes/machine-learning-bairesdev-dio/blob/dev/Mentoria_DIO_Linguagem_Natural_e_Prompts.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Prompting, Extraindo a Polpa da Fruta

*Me. Guilherme D. F. Silva, Machine Learning Engineer at [BairesDev](https://www.bairesdev.com)*.

*PhD. Henrique P. Gomide, Machine Learning Engineer at [BairesDev](https://www.bairesdev.com)*.

<br>

Como utilizar diferentes t√©cnicas de prompting para melhorar a performance de LLMs e permitir que elas solucionem problemas mais complexos.

---

Importando bibliotecas e acessando a API [Groq](https://console.groq.com).

In [None]:
import json
import requests

from google.colab import userdata

In [None]:
GROQ_KEY = userdata.get("GROQ_KEY")

API_URL = 'https://api.groq.com/openai/v1/chat/completions'
headers = {
    'Authorization': f'Bearer {GROQ_KEY}',
    'Content-Type': 'application/json'
}

---

Um prompt √© uma instru√ß√£o textual usada para guiar um modelo de linguagem (LLM) a gerar uma resposta.

**Tipos de Prompts:**
- User Prompt: Mensagem do usu√°rio que solicita uma a√ß√£o ou resposta da IA.
    - Ex.: "Explique a teoria da evolu√ß√£o."

- System Prompt: Instru√ß√µes definidas pelo desenvolvedor para orientar o comportamento do modelo.
    - Ex.: "Seja educado e objetivo nas respostas."

In [None]:
user_prompt = "Escreva uma estrofe para um poema."
system_prompt = "Voc√™ √© um cozinheiro que adora falar sobre pizzas."

data = {
    "model": "llama-3.2-3b-preview",
    "messages": [{"role": "user", "content": user_prompt},
                 {"role": "system", "content": system_prompt}],
    "max_tokens": 500
}

response = requests.post(API_URL, headers=headers, json=data)
result = response.json()
print(result["choices"][0]["message"]["content"])

Em fornos quentes e cheios de magia,
Dois elementos se encontram juntos no cielo,
Massa de trigo e fermento, a fus√£o perfeita,
Encostada a queijo molhado, meu cora√ß√£o est√° a bater para a pizza deliciosa.


In [None]:
user_prompt = "Escreva uma estrofe para um poema."
system_prompt = "Voc√™ √© um matem√°tico."

data = {
    "model": "llama-3.2-3b-preview",
    "messages": [{"role": "user", "content": user_prompt},
                 {"role": "system", "content": system_prompt}],
    "max_tokens": 500
}

response = requests.post(API_URL, headers=headers, json=data)
result = response.json()
print(result["choices"][0]["message"]["content"])

Em n√∫mero e figuras, encontro harmonia,
Um mundo de matem√°tica, infinito e vasto,
Simetria e cor, num toque de l√≥gica,
Um universo de pureza, onde a raz√£o √© a chave.


In [None]:
user_prompt = "Escreva uma estrofe para um poema."
system_prompt = "Voc√™ √© um camelo e est√° em busca de um oasis."

data = {
    "model": "llama-3.2-3b-preview",
    "messages": [{"role": "user", "content": user_prompt},
                 {"role": "system", "content": system_prompt}],
    "max_tokens": 500
}

response = requests.post(API_URL, headers=headers, json=data)
result = response.json()
print(result["choices"][0]["message"]["content"])

"No deserto quente, eu sigo a jornada,
Com passos lentos, e olhos que observam a tarde,
A busca por um sonho, um ref√∫gio do calor,
Um oasis que me leve, em um lugar fresco e mais calmo."


# Como melhorar o desempenho de um modelo usando Prompts?

## Primeiro Problema - Investigando G√≠rias

O que acontece se apenas pedirmos o significado de uma g√≠ria?

In [None]:
prompt = "Como um grande conhecedor das g√≠rias brasileiras, me informe qual √© o significado da g√≠ria chinelagem"

data = {
    "model": "llama-3.2-3b-preview",
    "messages": [{"role": "user", "content": prompt}],
    "max_tokens": 500
}

response = requests.post(API_URL, headers=headers, json=data)
result = response.json()
print(result["choices"][0]["message"]["content"])

Ol√°! √â um prazer estar aqui para ajud√°-lo a explorar a rica paleta de g√≠rias brasileiras.

A g√≠ria "chinelagem" √© um termo que se refere a uma combina√ß√£o de roupas francesas em tons claros e cores vibrantes, frequentemente combinadas com cal√ßas de jog Tin e sapatos de madeira ou marfil. No entanto, para mim, essa combina√ß√£o n√£o faz mais frente para ser definida como chinelagem, ap√≥s pesquisas por meu conhecimento. Isso ocorre que um termo de chinelagem, trata-se de uma combina√ß√£o de chinelas de cor e tecido mais espec√≠fico.


## Formata√ß√£o de Sa√≠da

Tamb√©m √© poss√≠vel formatar a sa√≠da do modelo para que seja como no formato JSON. Para isso, basta solicitarmos ao modelo.

In [None]:
prompt = (
    "Me diga o significado das 3 seguintes g√≠rias brasileiras: chinelagem, "
    " cusco e bochincho. Por favor, formate a sa√≠da em JSON."
)

data = {
    "model": "llama-3.2-3b-preview",
    "messages": [{"role": "user", "content": prompt}],
    "max_tokens": 500
}

response = requests.post(API_URL, headers=headers, json=data)
result = response.json()
print(result["choices"][0]["message"]["content"])

Aqui est√£o os significados das 3 g√≠rias brasileiras pedidas em formato JSON:

```json
{
  "chinelagem": "Chinelagem √© uma g√≠ria brasileira usado para descrever uma pessoa que √© considerada pregui√ßosa, indolente ou desinteressada em atividades.";
  "cusco": "Cusco √© uma g√≠ria brasileira usado para se referir a comida, especialmente refei√ß√µes assadas ou cozidas no forno.";
  "bochincho": "Bochincho √© uma g√≠ria brasileira usado para descrever um grupo de pessoas que est√£o paradas ou se movendo lentamente, muitas vezes de forma desorganizada ou sem prop√≥sito espec√≠fico."
}
```

Espero que isso tenha ajudado! Se tiver mais alguma pergunta, sinta-se √† vontade para perguntar.


Quando apenas pedimos uma resposta ao modelo, isso √© conhecido como zero-shot prompting. Ou seja, o modelo tenta "acertar com 0 consultas" a exemplos, usando apenas o conhecimento j√° internalizado na rede neural.

No entanto, se providenciarmos ao modelo alguns exemplos (Few-Shot Prompting), ele pode entender melhor a nossa consulta e tamb√©m podemos guiar o seu racioc√≠nio.

**Zero-Shot Prompting:**
- Defini√ß√£o: O modelo responde sem exemplos anteriores.
- Exemplo:
    - Input: "Traduza 'gato' para ingl√™s."

**Few-Shot Prompting:**
- Defini√ß√£o: Inclui alguns exemplos no prompt para orientar o modelo.
- Exemplo:
    - Input: "Traduza as palavras seguintes."
    - Exemplos: "gato ‚Üí cat", "cachorro ‚Üí dog".
    - Nova palavra: "p√°ssaro ‚Üí ?"
    - **5-Shot Prompting:** Extens√£o do few-shot, com 5 exemplos fornecidos.
- Import√¢ncia: Contexto mais rico melhora a precis√£o.

In [None]:
prompt = (
    "Me diga o significado de uma g√≠ria brasileira, siga os exemplos. "
    "Se voc√™ n√£o souber o significado da g√≠ria, diga que n√£o sabe, como nos exemplos.\n"
    "Exemplo #1: 'Ancinho' -> 'Eu n√£o sei o significado desta g√≠ria'\n"
    "Exemplo #2: 'Abestado' -> 'Bobo, tolo, lesado'\n"
    "Exemplo #3: 'Sair vazado' -> 'Eu n√£o sei o significado desta g√≠ria'\n"
    "Exemplo #4: 'Firmeza' -> 'Pessoa ou algo positivo'\n"
    "Exemplo #5: 'Crush' -> 'Eu n√£o sei o significado desta g√≠ria'\n"
    "Agora, me diga qual √© o significado da g√≠ria: bochincho'"
)

data = {
    "model": "llama-3.2-3b-preview",
    "messages": [{"role": "user", "content": prompt}],
    "max_tokens": 500,
    "temperature": 0.0,
}

response = requests.post(API_URL, headers=headers, json=data)
result = response.json()
print(result["choices"][0]["message"]["content"])

A g√≠ria "bochincho" √© um termo que se refere a uma pessoa que √© considerada muito chata ou ins√≠pida. √â como se essa pessoa estivesse "bochinhando" ou perdendo tempo de forma muito lenta e sem interesse.

Exemplo: "Eu n√£o sei por que ele est√° t√£o chato, ele √© um bochincho!"

√â importante notar que o significado de g√≠rias pode variar dependendo do contexto e da regi√£o, mas em geral, "bochincho" √© usado para descrever algu√©m que √© muito chato ou sem interesse.


In [None]:
prompt = "Como um grande conhecedor das g√≠rias brasileiras, me informe sucintamente qual √© o significado da g√≠ria: purla"

data = {
    "model": "llama-3.2-3b-preview",
    "messages": [{"role": "user", "content": prompt}],
    "max_tokens": 500
}

response = requests.post(API_URL, headers=headers, json=data)
result = response.json()
print(result["choices"][0]["message"]["content"])

Ol√°!

Eu posso informar sobre a g√≠ria "purla". √â uma g√≠ria que vem do ingl√™s "purl", que significa "rodar" ou "lugar de muita atividade". No Brasil, a g√≠ria "purla" √© usada para se referir a um lugar de diver√ß√µes, espet√°culos ou festivais, como um circo, um show, um clube noturno, entre outros.

Al√©m disso, a g√≠ria pode ser usada para expressar que existe uma turba ou multid√£o no local onde est√° se referindo.

 √â um termo coloquial e informal, n√£o √© amplamente usado no dia a dia, na vida corrente.


In [None]:
prompt = (
    "Me diga o significado de uma g√≠ria brasileira, siga os exemplos. "
    "Se voc√™ n√£o souber o significado da g√≠ria, diga que n√£o sabe, como nos exemplos.\n"
    "Exemplo #1: 'Ancinho' -> 'Eu n√£o sei o significado desta g√≠ria'\n"
    "Exemplo #2: 'Abestado' -> 'Bobo, tolo, lesado'\n"
    "Exemplo #3: 'Sair vazado' -> 'Eu n√£o sei o significado desta g√≠ria'\n"
    "Exemplo #4: 'Firmeza' -> 'Pessoa ou algo positivo'\n"
    "Exemplo #5: 'Crush' -> 'Eu n√£o sei o significado desta g√≠ria'\n"
    "Agora, me diga qual √© o significado da g√≠ria: purla'"
)

data = {
    "model": "llama-3.2-3b-preview",
    "messages": [{"role": "user", "content": prompt}],
    "max_tokens": 500,
    "temperature": 0.1,
}

response = requests.post(API_URL, headers=headers, json=data)
result = response.json()
print(result["choices"][0]["message"]["content"])

A g√≠ria "purla" √© um termo que pode ter diferentes significados dependendo do contexto em que √© usado. No entanto, √© comum associar "purla" a algo ou algu√©m que √© considerado muito bonito ou atraente.

Por exemplo, se algu√©m disser "Essa pessoa √© uma purla!", provavelmente estar√° expressando admira√ß√£o ou admira√ß√£o por sua beleza ou charme.

√â importante notar que o significado de "purla" pode variar dependendo da regi√£o ou do contexto em que √© usado, e pode n√£o ser amplamente reconhecido ou aceito por todos.


## Retrieval Augmented Generation (RAG):

T√©cnica que combina modelos de linguagem com bases de dados externas.
- Como Funciona:
    - Entrada: O prompt √© enviado para o sistema.
    - Recupera√ß√£o: O modelo busca informa√ß√µes relevantes em uma base externa.
    - Unifica√ß√£o: O prompt √© unificado √†s informa√ß√µes recuperadas e enviado √† LLM.
    - Gera√ß√£o: Responde com base na consulta e no contexto recuperado.
- Exemplo:
    - Prompt: "Qual a hist√≥ria da Torre Eiffel?"
    - Embedding: Transforma o prompt em um array de n√∫meros representando cada palavra.
    - "Qual a hist√≥ria da Torre Eiffel?" ‚Üí [302, 14, 14912, 30, 3124, 12499]
    - Busca na base de dados por vetores semelhantes ao vetor de prompt.
    - Decodifica o vetor mais semelhante e o apresenta como contexto para o prompt.
    - Resposta: "A Torre Eiffel foi constru√≠da em 1889 para a Exposi√ß√£o Universal."
- Import√¢ncia: Respostas mais precisas e baseadas em fatos, reduz alucina√ß√µes.


**Nossa base de dados de g√≠rias para o nosso RAG:**

https://conteudo.sesc-rs.com.br/girias-gauchas-quantos-destes-termos-voce-conhece

https://pt.wikipedia.org/wiki/Dialeto_ga%C3%BAcho

https://www.dicionarioinformal.com.br/bochincho


In [None]:
context = (
    """Cusco: Cachorro sem ra√ßa definida
    Resume c√£o pequeno, vira-lata. Sin√¥nimo de guaipeca. A palavra √© usada sozinha ou em express√µes populares como frio de renguear cusco (frio insuport√°vel) ou mais perdido que cusco em tiroteio.
    "Amiga, adotei um cusquinho t√£o lindo."

    Esgualepado: Sem movimento, cansado, exausto
    Define uma pessoa, animal ou objeto que est√° em condi√ß√µes prec√°rias, cansado, mal cuidado ou danificado. S√£o sin√¥nimos: arrebentado, esfarrapado, esgotado, etc.
    "T√¥ toda esgualepada, ainda bem que hoje √© sexta-feira!"

    Lagartear: Deitar, sentar
    Mais do que o significado formal, no Sul "lagartear" de verdade √© curtir a pregui√ßa no sol, especialmente em dias de inverno. Depois do almo√ßo, √© uma √≥tima pedida. Se tiver uma bergamota junto, melhor ainda.

    Bochincho: G√≠ria de ga√∫cho. Bebedeira, desordem, briga, bagun√ßa, baile popular; arrasta-p√©
    Em muitas peleias no bochincho, aprendi a n√£o pelear com mulher casada
    """
)
prompt = "Usando o contexto apresentado, me diga o que significa a g√≠ria bochincho."

data = {
    "model": "llama-3.2-3b-preview",
    "messages": [
        {"role": "system", "content": context},
        {"role": "user", "content": prompt}
    ],
    "max_tokens": 500
}

response = requests.post(API_URL, headers=headers, json=data)
result = response.json()
print(result["choices"][0]["message"]["content"])

A g√≠ria "bochincho" √© um termo usado principalmente no Sul do Brasil. Segundo o contexto apresentado, ela remete a uma situa√ß√£o de:

- Bebedeira
- Desordem
- Briga
- Baile popular
- Arrasta-p√©

Em outras palavras, quando mencionado o bochincho, est√° se referindo a uma situa√ß√£o animada, com muitas pessoas, bebidas, m√∫sica e talvez briga ou bagun√ßa.


In [None]:
messages = [
    {"role": "user", "content": "Usando o contexto apresentado, me diga o que significa a g√≠ria bochincho."},
    {"role": "assistant", "content": """De acordo com o contexto apresentado, a g√≠ria "bochincho" refere-se a:

        - G√≠ria de ga√∫cho
        - Bebedeira, desordem, briga, bagun√ßa, baile popular; arrasta-p√©

        Em outras palavras, "bochincho" √© um termo popular que descreve uma situa√ß√£o de caos, atividade social excessiva, dan√ßa, m√∫sica, festa ou briga.
    """},
    {"role": "user", "content": "Me diga o significado das 3 seguintes g√≠rias brasileiras: chinelagem, "
    " cusco e bochincho. Por favor, formate a sa√≠da em JSON."}
]

data = {
    "model": "llama-3.2-3b-preview",
    "messages": messages,
    "max_tokens": 500
}

response = requests.post(API_URL, headers=headers, json=data)
result = response.json()
print(result["choices"][0]["message"]["content"])

Aqui est√£o os significados das 3 g√≠rias brasileiras solicitadas, formatados em JSON:

```
[
  {
    "G√≠ria": "chinelagem",
    "Significado": "Dance folcl√≥rica t√≠pica da Amaz√¥nia, especialmente realizada no estado do Par√°"
  },
  {
    "G√≠ria": "cusco",
    "Significado": "Alcanfora ou alcaparra"
  },
  {
    "G√≠ria": "bochincho",
    "Significado": "Bebedeira, desordem, briga, bagun√ßa, baile popular"
  }
]
```

Espero que isso esteja de acordo com suas necessidades.


# Segundo Problema - Chain-of-Thought (CoT)

Chain-of-Thought √© uma t√©cnica que encoraja o modelo a "pensar em voz alta" antes de responder.
- Como Funciona:
    - Prompt: "Quantas ma√ß√£s restam se voc√™ comeu 2 de 5?"
    - Resposta com Chain-of-Thought:
        1. "Eu tinha 5 ma√ß√£s."
        2. "Comi 2 ma√ß√£s."
        3. "Agora restam 3 ma√ß√£s."
        4. Resposta Final: 3.
- Import√¢ncia: Melhora a precis√£o em tarefas complexas pela divis√£o de um problema maior em problemas menores.

In [None]:
prompt = (
    "Se um trem viaja a 60 km/h durante 2 horas e ainda precisa de meia hora para terminar a viagem, qual √© a dist√¢ncia entre a origem e o destino?"
)

data = {
    "model": "llama-3.2-3b-preview",
    "messages": [{"role": "user", "content": prompt}],
    "max_tokens": 500
}

response = requests.post(API_URL, headers=headers, json=data)
result = response.json()
print(result["choices"][0]["message"]["content"])

Para resolver esse problema, precisamos calcular a dist√¢ncia percorrida pelo trem durante as primeiras 2 horas e acrescentar a dist√¢ncia percorrida nos √∫ltimos 30 minutos.

Em 1 hora, o trem viaja 60 km. Portanto, em 2 horas, ele viaja 60 km/h + 60 km/h = 120 km.

Al√©m disso, we constatamos que 1 dia tem 24 horas.

No decorrer de 2 horas, a velocidade do trem √© de 60km/h. Logo, em 30 minutos ou (1/2 hora), ele viaja (1/2) x 60km/h.


In [None]:
prompt = (
    "Resolva o seguinte problema de matem√°tica passo a passo:\n"
    "Se um trem viaja a 60 km/h durante 2 horas e ainda precisa de meia hora para terminar a viagem, qual √© a dist√¢ncia entre a origem e o destino?"
)

data = {
    "model": "llama-3.2-3b-preview",
    "messages": [{"role": "user", "content": prompt}],
    "max_tokens": 500
}

response = requests.post(API_URL, headers=headers, json=data)
result = response.json()
print(result["choices"][0]["message"]["content"])

Vamos resolver o problema passo a passo:

**Passo 1: Calcule a dist√¢ncia percorrida pelo trem nos 2 primeiros horas**

Dist√¢ncia = Velocidade x Tempo

Dist√¢ncia = 60 km/h x 2 horas

Dist√¢ncia = 120 km

**Passo 2: Calcule a taxa do trem ap√≥s a segunda hora**

Velocidade fixa √© de 60 km/h, ent√£o a taxa ap√≥s a segunda hora permanece a mesma.

**Passo 3: Calcule a dist√¢ncia restante para o destino**

A meia hora √© igual a 0,5 hora. Para calcular a dist√¢ncia restante, usamos a f√≥rmula:

Dist√¢ncia = Velocidade x Tempo

Dist√¢ncia = 60 km/h x 0,5 horas

Dist√¢ncia = 30 km

**Passo 4: Calcule a dist√¢ncia total entre o in√≠cio e o destino**

Dist√¢ncia total = Dist√¢ncia percorrida + Dist√¢ncia restante

Dist√¢ncia total = 120 km + 30 km

Dist√¢ncia total = 150 km

**Resposta final:**

A dist√¢ncia entre a origem e o destino √© de 150 km.


# Concluindo

Quanto mais espec√≠ficos e detalhistas formos em nossos prompts, mais conhecimento j√° existente no modelo conseguiremos trazer √† tona. As t√©cnicas de prompt engineering ajudam o modelo a apresentar seu verdadeiro n√≠vel de conhecimento. Logo, extra√≠mos a polpa da fruta ü•ù.