<a href="https://colab.research.google.com/github/JhonnyLimachi/Sigmoidal/blob/main/79_Prompt_Engineering.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<img alt="Colaboratory logo" width="15%" src="https://raw.githubusercontent.com/carlosfab/escola-data-science/master/img/novo_logo_bg_claro.png">

# Prompt Engineering

Bem-vindo ao curso **Prompt Engineering**! Neste curso, você mergulhará na arte da engenharia de prompts, uma habilidade essencial para aprimorar o uso de modelos de linguagem avançados, como o GPT-3.5, em suas tarefas de ciência de dados.

<center><img src="https://i.guim.co.uk/img/media/6bc60b720f2288e8b8153dc04e8b079b4a7a9dd6/0_93_4276_2566/master/4276.jpg?width=465&dpr=1&s=none" height="300px"></center>


A engenharia de prompts envolve a criação estratégica de instruções ou sugestões de entrada para modelos de linguagem, visando obter resultados mais precisos e relevantes. Você aprenderá a ajustar os prompts para se alinhar melhor aos seus objetivos, explorando técnicas como o uso de tokens especiais, controle de temperatura e contextualização para gerar saídas mais personalizadas.

Durante o curso, abordaremos exemplos práticos, estudos de caso e exercícios hands-on que simulam situações do cotidiano de um cientista de dados. Ao final, você estará pronto para aplicar efetivamente a engenharia de prompts em seus projetos, elevando a qualidade e relevância das respostas geradas por modelos de linguagem avançados.

Prepare-se para dominar a habilidade de engenharia de prompts e elevar suas capacidades como cientista de dados. Vamos começar esta jornada de aprendizado transformadora!

Ao longo deste curso, usaremos o modelo `gpt-3.5-turbo`, e o endpoint Chat Completions.


# Aula 01 - Outline
## Large Language Models

`Large Language Models` (LLMs), ou Modelos de Linguagem de Grande Escala, são uma classe de modelos de inteligência artificial (IA) projetados para entender e gerar linguagem humana de maneira avançada. Esses modelos são treinados em enormes conjuntos de dados textuais para aprender padrões linguísticos, estruturas gramaticais, relações semânticas e até mesmo conhecimento factual sobre o mundo.

Os LLMs são alimentados por redes neurais profundas, especificamente modelos de atenção, que permitem que eles compreendam o contexto e as relações entre palavras e frases em um texto. Isso lhes confere a capacidade de realizar uma variedade de tarefas relacionadas à linguagem natural, como:

* Geração de Texto: Os LLMs podem criar textos coesos, que variam desde parágrafos explicativos até histórias completas, com base em um prompt ou contexto inicial.

* Tradução: Eles podem traduzir texto de uma língua para outra, mantendo o significado e a fluência.

* Resposta a Perguntas: LLMs podem responder perguntas formuladas em linguagem natural, com base em informações contidas nos dados de treinamento.

* Sumarização Automática: Eles podem criar resumos concisos de textos longos, capturando os pontos principais.

* Classificação de Texto: LLMs podem classificar textos em categorias pré-definidas, como análise de sentimento, detecção de spam, etc.

* Geração de Código: Alguns LLMs são capazes de gerar código de programação com base em descrições em linguagem natural.

* Assistência a Escrita: Eles podem sugerir palavras, frases ou até mesmo completar parágrafos para auxiliar na redação.

* Diálogo e Interação: LLMs podem manter conversas coerentes e contextualizadas, proporcionando interações mais naturais.

LLMs têm evoluído consideravelmente em tamanho e capacidade ao longo dos anos. Modelos como GPT-3 têm trilhões de parâmetros, o que lhes permite lidar com tarefas complexas e gerar saídas que frequentemente se assemelham ao estilo humano de comunicação. Esses modelos têm uma ampla gama de aplicações em pesquisa, negócios, educação e muito mais, revolucionando a maneira como a IA interage com e compreende a linguagem humana.

## Tipos de Large Language Models

`Base LLM (Large Language Model)`

Um Base LLM, ou Modelo de Linguagem de Base, é um modelo de inteligência artificial que aprende a linguagem humana a partir de enormes quantidades de texto. Ele pode responder a perguntas, gerar texto e realizar várias tarefas relacionadas à linguagem com base no que aprendeu. No entanto, ele precisa de um prompt (uma instrução ou pergunta) para entender o que você deseja que ele faça.

`Instruction Tuned LLM (Large Language Model com Ajuste de Instrução)`

Um Instruction Tuned LLM, ou Modelo de Linguagem de Grande Escala com Ajuste de Instrução, é um tipo de LLM que pode ser direcionado com instruções específicas. Isso significa que, além do prompt, você pode incluir instruções detalhadas para orientar o modelo em direção às respostas desejadas. Isso torna o modelo mais preciso e alinhado com o que você precisa.

Em resumo, a diferença entre um Base LLM e um Instruction Tuned LLM está na capacidade de fornecer instruções detalhadas para o último, permitindo maior controle sobre suas respostas. Enquanto o Base LLM precisa de prompts genéricos, o Instruction Tuned LLM responde melhor a instruções específicas, tornando-o mais eficaz para tarefas específicas e resultados mais direcionados.

Neste curso, vamos focar em `Instruction Tuned LLMs`, como o Chat GPT.

In [2]:
!pip install openai -q

[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m320.7/320.7 kB[0m [31m6.2 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m75.6/75.6 kB[0m [31m5.5 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m77.9/77.9 kB[0m [31m5.6 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m58.3/58.3 kB[0m [31m6.7 MB/s[0m eta [36m0:00:00[0m
[?25h

In [3]:
import os
import openai

openai.api_key = "insira-aqui-sua-chave"

def get_completion(prompt, model="gpt-3.5-turbo"):
    messages = [{"role": "user", "content": prompt}]
    response = openai.ChatCompletion.create(
        model=model,
        messages=messages,
        temperature=0, # this is the degree of randomness of the model's output
    )
    return response.choices[0].message["content"]

## Princípios de Prompting
- **Princípio 1:  Escreva instruções claras e específicas**
- **Princípio 2: Dê tempo para o modelo "pensar"”**

### Táticas

#### Tática 1: Use delimitadores para indicar claramente partes distintas da entrada
- Delimitadores podem ser qualquer coisa, como: ```, """, < >, `<tag> </tag>`, `:`

In [11]:
fact_sheet_chair = """
VISÃO GERAL
- Parte de uma bela família de móveis de escritório inspirados no design
das décadas de 1950, incluindo arquivos, mesas, estantes, mesas de reunião e mais.
- Várias opções de cor para a carcaça e acabamentos da base.
- Disponível com estofamento frontal e traseiro em plástico (SWC-100)
ou estofamento completo (SWC-110) em 10 opções de tecido e 6 opções de couro.
- Opções de acabamento da base: aço inoxidável, preto fosco,
branco brilhante ou cromado.
- A cadeira está disponível com ou sem apoios de braços.
- Adequada para configurações residenciais ou comerciais.
- Qualificada para uso em contratos.

CONSTRUÇÃO
- Base de alumínio com 5 rodízios revestidos de plástico.
- Ajuste pneumático da altura da cadeira para fácil elevação/rebaixamento.

DIMENSÕES
- LARGURA 53 CM | 20,87”
- PROFUNDIDADE 51 CM | 20,08”
- ALTURA 80 CM | 31,50”
- ALTURA DO ASSENTO 44 CM | 17,32”
- PROFUNDIDADE DO ASSENTO 41 CM | 16,14”

OPÇÕES
- Opções de rodízios para piso macio ou duro.
- Duas escolhas de densidades de espuma do assento:
 média (1,8 lb/ft3) ou alta (2,8 lb/ft3).
- Sem braços ou com apoios de braços PU em 8 posições.

MATERIAIS
CARCAÇA BASE DESLIZANTE
- Alumínio fundido com revestimento modificado de nylon PA6/PA66.
- Espessura da carcaça: 10 mm.
ASSENTO
- Espuma HD36.

PAÍS DE ORIGEM
- Itália
"""


In [10]:
prompt = f"""
Sua tarefa é ajudar uma equipe de marketing a criar uma
descrição para um site de varejo de um produto com base
em uma ficha técnica.

Escreva uma descrição de produto com base nas informações
fornecidas nas especificações técnicas delimitadas por
três acentos graves.

Especificações técnicas: ```{fact_sheet_chair}```
"""
response = get_completion(prompt)
print(response)


APIRemovedInV1: 

You tried to access openai.ChatCompletion, but this is no longer supported in openai>=1.0.0 - see the README at https://github.com/openai/openai-python for the API.

You can run `openai migrate` to automatically upgrade your codebase to use the 1.0.0 interface. 

Alternatively, you can pin your installation to the old version, e.g. `pip install openai==0.28`

A detailed migration guide is available here: https://github.com/openai/openai-python/discussions/742


#### Tática 2: Peça por um output estruturado
- JSON, HTML

In [12]:
prompt = f"""
Crie uma lista de três títulos fictícios de livros, juntamente com seus autores e gêneros.
Forneça-os em formato JSON com as seguintes chaves:
book_id, title, author, genre.
"""
response = get_completion(prompt)
print(response)

APIRemovedInV1: 

You tried to access openai.ChatCompletion, but this is no longer supported in openai>=1.0.0 - see the README at https://github.com/openai/openai-python for the API.

You can run `openai migrate` to automatically upgrade your codebase to use the 1.0.0 interface. 

Alternatively, you can pin your installation to the old version, e.g. `pip install openai==0.28`

A detailed migration guide is available here: https://github.com/openai/openai-python/discussions/742


#### Tática 3: Peça ao modelo para verificar se as condições estão satisfeitas

In [13]:
text_1 = f"""
Fazer uma xícara de chá é fácil! Primeiro, você precisa ferver um pouco de água.
Enquanto isso está acontecendo, pegue uma xícara e coloque um saquinho de chá nela.
Assim que a água estiver quente o suficiente, simplesmente despeje-a sobre o saquinho de chá.
Deixe repousar por um tempo para que o chá possa infusionar.
Após alguns minutos, retire o saquinho de chá. Se quiser, você pode adicionar um pouco de açúcar ou leite ao seu gosto.
E pronto! Agora você tem uma deliciosa xícara de chá para saborear.
"""
prompt = f"""
Você receberá um texto delimitado por três aspas.
Se ele contiver uma sequência de instruções,
reescreva essas instruções no seguinte formato:

Passo 1 - ...
Passo 2 - ...
...
Passo N - ...

Se o texto não contiver uma sequência de instruções, \
simplesmente escreva \"Nenhum passo fornecido.\"

\"\"\"{text_1}\"\"\"
"""
response = get_completion(prompt)
print("Output para Text 1:")
print(response)

APIRemovedInV1: 

You tried to access openai.ChatCompletion, but this is no longer supported in openai>=1.0.0 - see the README at https://github.com/openai/openai-python for the API.

You can run `openai migrate` to automatically upgrade your codebase to use the 1.0.0 interface. 

Alternatively, you can pin your installation to the old version, e.g. `pip install openai==0.28`

A detailed migration guide is available here: https://github.com/openai/openai-python/discussions/742


#### Tática 4: "Few-shot" prompting

In [14]:
prompt = f"""
Sua tarefa é responder de maneira consistente.

<criança>: Ensine-me sobre paciência.

<avô/avó>: O rio que esculpe o vale mais profundo
flui de uma modesta nascente; a
mais grandiosa sinfonia se origina de uma única nota;
a tapeçaria mais intrincada começa com um único fio.

<criança>: Ensine-me sobre resiliência.
"""
response = get_completion(prompt)
print(response)

APIRemovedInV1: 

You tried to access openai.ChatCompletion, but this is no longer supported in openai>=1.0.0 - see the README at https://github.com/openai/openai-python for the API.

You can run `openai migrate` to automatically upgrade your codebase to use the 1.0.0 interface. 

Alternatively, you can pin your installation to the old version, e.g. `pip install openai==0.28`

A detailed migration guide is available here: https://github.com/openai/openai-python/discussions/742


### Princípio 2: Dê tempo ao modelo para "pensar"

#### Tática 1: Especifique os passos necessários para concluir uma tarefa

In [15]:
text = f"""
Em uma encantadora vila, os irmãos Jack e Jill partiram \
em uma busca para buscar água de um poço no topo \
de uma colina. Enquanto subiam, cantando alegremente, a adversidade \
os atingiu—Jack tropeçou em uma pedra e rolou \
colina abaixo, com Jill seguindo o mesmo destino. \
Apesar de ligeiramente machucados, o par voltou para casa \
abraços reconfortantes. Apesar do contratempo, \
seus espíritos aventureiros permaneceram inabalados, e eles \
continuaram explorando com alegria.
"""
# example 1
prompt_1 = f"""
Realize as seguintes ações:
1 - Resuma o seguinte texto delimitado por três acentos graves com uma frase.
2 - Traduza o resumo para o francês.
3 - Liste cada nome no resumo em francês.
4 - Produza um objeto JSON que contenha as seguintes chaves: resumo_francês, num_nomes.

Separe suas respostas com quebras de linha.

Texto:
```{text}```
"""
response = get_completion(prompt_1)
print("Completion para Prompt 1:")
print(response)

APIRemovedInV1: 

You tried to access openai.ChatCompletion, but this is no longer supported in openai>=1.0.0 - see the README at https://github.com/openai/openai-python for the API.

You can run `openai migrate` to automatically upgrade your codebase to use the 1.0.0 interface. 

Alternatively, you can pin your installation to the old version, e.g. `pip install openai==0.28`

A detailed migration guide is available here: https://github.com/openai/openai-python/discussions/742


#### Peça o output em um formato específico

In [16]:
prompt_2 = f"""
Sua tarefa é realizar as seguintes ações:
1 - Resumir o seguinte texto delimitado por
<> em uma frase.
2 - Traduzir o resumo para o francês.
3 - Listar cada nome no resumo em francês.
4 - Gerar um objeto JSON que contenha as
seguintes chaves: resumo_francês, num_nomes.

Use o seguinte formato:
Texto: <texto para resumir>
Resumo: <resumo>
Tradução: <tradução do resumo>
Nomes: <lista de nomes no resumo em francês>
Saída JSON: <json com resumo e num_nomes>

Texto: <{text}>
"""
response = get_completion(prompt_2)
print("\nCompletion para Prompt 2:")
print(response)

APIRemovedInV1: 

You tried to access openai.ChatCompletion, but this is no longer supported in openai>=1.0.0 - see the README at https://github.com/openai/openai-python for the API.

You can run `openai migrate` to automatically upgrade your codebase to use the 1.0.0 interface. 

Alternatively, you can pin your installation to the old version, e.g. `pip install openai==0.28`

A detailed migration guide is available here: https://github.com/openai/openai-python/discussions/742


#### Tática 2: Instrua o modelo a testar sua própria solução antes de chegar a uma conclusão precipitada

In [17]:
prompt = f"""
Determine se a solução do estudante está correta ou não.

Pergunta:
Estou construindo uma instalação de energia solar e preciso
de ajuda para calcular os aspectos financeiros.

O custo do terreno é $100 por pé quadrado
Posso comprar painéis solares por $250 por pé quadrado
Eu negociei um contrato de manutenção que custará
uma taxa fixa de $100.000 por ano, e mais $10 por pé
quadrado
Qual é o custo total para o primeiro ano de operações
como uma função do número de pés quadrados.
Solução do Estudante:
Seja x o tamanho da instalação em pés quadrados.
Custos:

Custo do terreno: 100x
Custo dos painéis solares: 250x
Custo de manutenção: 100.000 + 100x
Custo total: 100x + 250x + 100.000 + 100x = 450x + 100.000
"""
response = get_completion(prompt)
print(response)

APIRemovedInV1: 

You tried to access openai.ChatCompletion, but this is no longer supported in openai>=1.0.0 - see the README at https://github.com/openai/openai-python for the API.

You can run `openai migrate` to automatically upgrade your codebase to use the 1.0.0 interface. 

Alternatively, you can pin your installation to the old version, e.g. `pip install openai==0.28`

A detailed migration guide is available here: https://github.com/openai/openai-python/discussions/742
