In [None]:
# Copyright 2023 Google LLC
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

# Boas pr√°ticas para a cria√ß√£o de prompts

<table align="left">
  <td>
    <a href="https://colab.research.google.com/github/GoogleCloudPlatform/generative-ai/blob/main/language/intro_palm_api.ipynb">
      <img src="https://cloud.google.com/ml-engine/images/colab-logo-32px.png" alt="Colab logo"> Execute no Colab
    </a>
  </td>
  <td>
    <a href="https://github.com/GoogleCloudPlatform/generative-ai/blob/main/language/intro_palm_api.ipynb">
      <img src="https://cloud.google.com/ml-engine/images/github-logo-32px.png" alt="GitHub logo">
      Veja no GitHub
    </a>
  </td>
  <td>
    <a href="https://console.cloud.google.com/vertex-ai/workbench/deploy-notebook?download_url=https://raw.githubusercontent.com/GoogleCloudPlatform/generative-ai/blob/main/language/intro_palm_api.ipynb">
      <img src="https://lh3.googleusercontent.com/UiNooY4LUgW_oTvpsNhPpQzsstV5W8F7rYgxgGBD85cWJoLmrOzhVs_ksK_vgx40SHs7jCqkTkCk=e14-rj-sc0xffffff-h130-w32" alt="Vertex AI logo">
      Execute no Vertex AI Workbench
    </a>
  </td>
</table>

## Vis√£o geral

Este notebook aborda os fundamentos de design de prompts, incluindo algumas pr√°ticas recomendadas.

Saiba mais sobre o design de prompt na [documenta√ß√£o oficial](https://cloud.google.com/vertex-ai/docs/generative-ai/text/text-overview).

### Objetivo

Neste notebook, voc√™ aprender√° as pr√°ticas recomendadas sobre o design de prompts -- como projetar prompts para melhorar a qualidade de suas respostas.

Este notebook abrange as seguintes pr√°ticas recomendadas para engenharia imediata:

- Ser conciso
- Seja espec√≠fico e com um texto bem definido
- Pe√ßa uma tarefa de cada vez
- Transforme tarefas generativas em tarefas de classifica√ß√£o
- Melhore a qualidade da resposta incluindo exemplos

### Custos
Este tutorial usa os seguintes componentes de Google Cloud:

* Vertex AI Studio

Saiba mais sobre poss√≠veis custos envolvidos [pre√ßos da Vertex AI](https://cloud.google.com/vertex-ai/pricing),
e use a [Calculadora de pre√ßos](https://cloud.google.com/products/calculator/)
para gerar uma estimativa de custo com base no uso projetado.

## Primeiros Passos

### Instalando os SDK da Vertex AI

In [None]:
!pip install google-cloud-aiplatform --upgrade --user

**Somente Colab:** Descomente a c√©lula a seguir para reiniciar o kernel ou use o bot√£o para reiniciar o kernel.

In [None]:
# # Reinicia automaticamente o kernel ap√≥s as instala√ß√µes para que seu ambiente possa acessar os novos pacotes
# import IPython

# app = IPython.Application.instance()
# app.kernel.do_shutdown(True)

### Autenticando seu ambiente de notebook
* Se voc√™ estiver usando o **Colab** para executar este notebook, descomente a c√©lula abaixo e continue.
* Se voc√™ estiver usando o **Vertex AI Workbench**, confira as instru√ß√µes de configura√ß√£o [aqui](../setup-env/README.md).

In [None]:
# from google.colab import auth
# auth.authenticate_user()

### Importando as bibliotecas necess√°rias

**Somente Colab:** Descomente a c√©lula a seguir para realizar o processo adequado de inicializa√ß√£o da SDK da Vertex AI.  

In [None]:
# import vertexai

# PROJECT_ID = "[seu-project-id]"  # @param {type:"string"}
# vertexai.init(project=PROJECT_ID, location="us-central1")

In [None]:
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '3' 

import warnings
warnings.simplefilter("ignore", UserWarning)

from vertexai.language_models import TextGenerationModel

#### Carregando o modelo `text-bison`

In [None]:
generation_model = TextGenerationModel.from_pretrained("text-bison@001")

## Boas pr√°ticas de design de prompts

A engenharia de prompt trata de como projetar seus prompts para que a resposta seja o que voc√™ realmente esperava ver.

A ideia de usar prompts "desagrad√°veis" √© minimizar o ru√≠do em seu prompt para reduzir a possibilidade de o LLM interpretar mal a inten√ß√£o do prompt. Abaixo est√£o algumas diretrizes sobre como projetar prompts "desagrad√°veis".

Nesta se√ß√£o, voc√™ abordar√° as seguintes pr√°ticas recomendadas quando a engenharia solicitar:

* Ser conciso
* Seja espec√≠fico e com texto bem definido
* Pe√ßa uma tarefa de cada vez
* Melhore a qualidade da resposta incluindo exemplos
* Transforme tarefas generativas em tarefas de classifica√ß√£o para melhorar a seguran√ßa

### Seja conciso

üõë N√£o recomendado. O prompt abaixo √© desnecessariamente detalhado.

In [None]:
prompt = "Que nomes voc√™ acha que seriam interessantes para uma floricultura que se especializa mais em buqu√™s de flores secas do que frescas? Muit√≠ssimo brigado!"

print(generation_model.predict(prompt=prompt, max_output_tokens=256).text)

‚úÖ Recomendado. O prompt abaixo √© direto ao ponto e conciso.

In [None]:
prompt = "Sugira cinco nomes para uma floricultura que vende buqu√™s de flores secas"

print(generation_model.predict(prompt=prompt, max_output_tokens=256).text)

### Seja espec√≠fico e escreva textos bem definidos

Suponha que voc√™ queira pensar em maneiras criativas de descrever a Terra.

üõë N√£o recomendado. O prompt abaixo √© muito gen√©rico.

In [None]:
prompt = "Fale-me sobre a Terra"

print(generation_model.predict(prompt=prompt, max_output_tokens=256).text)

‚úÖ Recomendado. O prompt abaixo √© espec√≠fico e bem definido.

In [None]:
prompt = "Gere uma lista de motivos que fazem a Terra ser √∫nica comparada √† outros planetas"

print(generation_model.predict(prompt=prompt, max_output_tokens=256).text)

### Pe√ßa uma tarefa de cada vez

üõë N√£o recomendado. O prompt abaixo tem duas partes para a pergunta que pode ser feita separadamente.

In [None]:
prompt = "Qual √© a melhor forma para ferver √°gua e por que o c√©u √© azul?"

print(generation_model.predict(prompt=prompt, max_output_tokens=256).text)

‚úÖ Recomendado. Os prompts abaixo solicitam uma tarefa por vez.

In [None]:
prompt = "Qual √© a melhor forma para ferver √°gua?"

print(generation_model.predict(prompt=prompt, max_output_tokens=256).text)

In [None]:
prompt = "Por que o c√©u √© azul?"

print(generation_model.predict(prompt=prompt, max_output_tokens=256).text)

### Cuidado com as alucina√ß√µes

Embora os LLMs tenham sido treinados em uma grande quantidade de dados, eles podem gerar textos contendo declara√ß√µes n√£o fundamentadas na verdade ou na realidade; essas respostas do LLM s√£o frequentemente chamadas de "alucina√ß√µes" devido √†s suas capacidades limitadas de memoriza√ß√£o. Observe que simplesmente solicitar que o LLM forne√ßa uma cita√ß√£o n√£o √© uma solu√ß√£o para esse problema, pois h√° inst√¢ncias de LLMs que fornecem cita√ß√µes falsas ou imprecisas. 

Lidar com alucina√ß√µes √© um desafio fundamental dos LLMs e uma √°rea de pesquisa em andamento, por isso √© importante estar ciente de que os LLMs podem parecer dar a voc√™ declara√ß√µes confiantes e corretas que, na verdade, s√£o incorretas.

Observe que, se voc√™ pretende usar LLMs para os casos de uso criativo, alucinar pode ser bastante √∫til.

Tente o prompt como o abaixo repetidamente. Voc√™ pode notar que √†s vezes ele dir√° com confian√ßa, mas imprecisamente, "O primeiro elefante a visitar a lua foi Luna".

In [None]:
prompt = "Quem foi o primeiro elefante a visitar a lua?"

print(generation_model.predict(prompt=prompt, max_output_tokens=256).text)

### Transforme tarefas generativas em tarefas de classifica√ß√£o para reduzir a variabilidade de sa√≠da

#### Tarefas generativas levam a uma maior variabilidade de sa√≠da

O prompt abaixo resulta em uma resposta aberta, √∫til para brainstorming, mas a resposta √© altamente vari√°vel.

In [None]:
prompt = "Sou um estudante de ensino m√©dio. Recomende-me atividades de programa√ß√£o para melhorar meus skills"

print(generation_model.predict(prompt=prompt, max_output_tokens=256).text)

#### Tarefas de classifica√ß√£o reduzem a variabilidade de sa√≠da

O prompt abaixo resulta em uma escolha e pode ser √∫til se voc√™ quiser que a sa√≠da seja mais f√°cil de controlar.

In [None]:
prompt = """Sou um estudante de ensino m√©dio. Quais destas atividades voc√™ recomenda e porqu√™:
a) Aprender Python
b) Aprender Javascript
c) Aprender Fortran
"""

print(generation_model.predict(prompt=prompt, max_output_tokens=256).text)

### Melhore a qualidade da resposta incluindo exemplos

Outra maneira de melhorar a qualidade da resposta √© adicionar exemplos em seu prompt. O LLM aprende no contexto dos exemplos sobre como responder. Normalmente, um a cinco exemplos (shots) s√£o suficientes para melhorar a qualidade das respostas. Incluir muitos exemplos pode fazer com que o modelo ajuste demais os dados e reduza a qualidade das respostas.

Semelhante ao treinamento de modelo cl√°ssico, a qualidade e a distribui√ß√£o dos exemplos s√£o muito importantes. Escolha exemplos representativos dos cen√°rios que voc√™ precisa que o modelo aprenda e mantenha a distribui√ß√£o dos exemplos (por exemplo, n√∫mero de exemplos por classe no caso de classifica√ß√£o) alinhada com sua distribui√ß√£o real.

#### Zero-shot prompt

Abaixo est√° um exemplo de prompt zero-shot, onde voc√™ n√£o fornece nenhum exemplo para o LLM dentro do pr√≥prio prompt.

In [None]:
prompt = """Decida se um Tweet apresenta um sentimento positivo, negativo ou neutro.

Tweet: Eu amei os seus videos mais recentes no YouTube!
Sentimento: 
"""

print(generation_model.predict(prompt=prompt, max_output_tokens=256).text)

#### One-shot prompt

Abaixo est√° um exemplo one-shot, onde voc√™ fornece um exemplo para o LLM dentro do prompt para fornecer alguma orienta√ß√£o sobre o tipo de resposta que voc√™ deseja.

In [None]:
prompt = """Decida se um Tweet apresenta um sentimento positivo, negativo ou neutro.

Tweet: Eu amei os seus videos mais recentes no YouTube!
Sentimento: positivo

Tweet: Foi dif√≠cil. Super chato üò†
Sentimento:
"""

print(generation_model.predict(prompt=prompt, max_output_tokens=256).text)

#### Few-shot prompt

Abaixo est√° um exemplo de few-shot, onde voc√™ fornece um exemplo para o LLM dentro do prompt para dar alguma orienta√ß√£o sobre o tipo de resposta que voc√™ deseja.

In [None]:
prompt = """Decida se um Tweet apresenta um sentimento positivo, negativo ou neutro.

Tweet: Eu amei os seus videos mais recentes no YouTube!
Sentimento: positivo

Tweet: Foi dif√≠cil. Super chato üò†
Sentimento: negativo

Tweet: Uma coisa me surpreendeu neste video - Ele foi realmente original. Ele n√£o foi o mesmo velho conte√∫do reciclado. Assista - voc√™ n√£o se arrepender√°.
Sentimento:
"""

print(generation_model.predict(prompt=prompt, max_output_tokens=256).text)

#### Escolhendo entre os m√©todos zero-shot, one-shot ou few-shot

Qual t√©cnica de prompt usar depender√° exclusivamente do seu objetivo. Os prompts zero-shot s√£o mais abertos e podem fornecer respostas criativas, enquanto os prompts one-shot e few-shot ensinam o modelo a se comportar para que voc√™ possa obter respostas mais previs√≠veis que sejam consistentes com os exemplos fornecidos.