<a href="https://colab.research.google.com/github/JhonnyLimachi/Sigmoidal/blob/main/79_Prompt_Engineering.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<img alt="Colaboratory logo" width="15%" src="https://raw.githubusercontent.com/carlosfab/escola-data-science/master/img/novo_logo_bg_claro.png">

# Prompt Engineering

Bem-vindo ao curso **Prompt Engineering**! Neste curso, você mergulhará na arte da engenharia de prompts, uma habilidade essencial para aprimorar o uso de modelos de linguagem avançados, como o GPT-3.5, em suas tarefas de ciência de dados.

<center><img src="https://i.guim.co.uk/img/media/6bc60b720f2288e8b8153dc04e8b079b4a7a9dd6/0_93_4276_2566/master/4276.jpg?width=465&dpr=1&s=none" height="300px"></center>


A engenharia de prompts envolve a criação estratégica de instruções ou sugestões de entrada para modelos de linguagem, visando obter resultados mais precisos e relevantes. Você aprenderá a ajustar os prompts para se alinhar melhor aos seus objetivos, explorando técnicas como o uso de tokens especiais, controle de temperatura e contextualização para gerar saídas mais personalizadas.

Durante o curso, abordaremos exemplos práticos, estudos de caso e exercícios hands-on que simulam situações do cotidiano de um cientista de dados. Ao final, você estará pronto para aplicar efetivamente a engenharia de prompts em seus projetos, elevando a qualidade e relevância das respostas geradas por modelos de linguagem avançados.

Prepare-se para dominar a habilidade de engenharia de prompts e elevar suas capacidades como cientista de dados. Vamos começar esta jornada de aprendizado transformadora!

Ao longo deste curso, usaremos o modelo `gpt-3.5-turbo`, e o endpoint Chat Completions.


# Aula 01 - Outline
## Large Language Models

`Large Language Models` (LLMs), ou Modelos de Linguagem de Grande Escala, são uma classe de modelos de inteligência artificial (IA) projetados para entender e gerar linguagem humana de maneira avançada. Esses modelos são treinados em enormes conjuntos de dados textuais para aprender padrões linguísticos, estruturas gramaticais, relações semânticas e até mesmo conhecimento factual sobre o mundo.

Os LLMs são alimentados por redes neurais profundas, especificamente modelos de atenção, que permitem que eles compreendam o contexto e as relações entre palavras e frases em um texto. Isso lhes confere a capacidade de realizar uma variedade de tarefas relacionadas à linguagem natural, como:

* Geração de Texto: Os LLMs podem criar textos coesos, que variam desde parágrafos explicativos até histórias completas, com base em um prompt ou contexto inicial.

* Tradução: Eles podem traduzir texto de uma língua para outra, mantendo o significado e a fluência.

* Resposta a Perguntas: LLMs podem responder perguntas formuladas em linguagem natural, com base em informações contidas nos dados de treinamento.

* Sumarização Automática: Eles podem criar resumos concisos de textos longos, capturando os pontos principais.

* Classificação de Texto: LLMs podem classificar textos em categorias pré-definidas, como análise de sentimento, detecção de spam, etc.

* Geração de Código: Alguns LLMs são capazes de gerar código de programação com base em descrições em linguagem natural.

* Assistência a Escrita: Eles podem sugerir palavras, frases ou até mesmo completar parágrafos para auxiliar na redação.

* Diálogo e Interação: LLMs podem manter conversas coerentes e contextualizadas, proporcionando interações mais naturais.

LLMs têm evoluído consideravelmente em tamanho e capacidade ao longo dos anos. Modelos como GPT-3 têm trilhões de parâmetros, o que lhes permite lidar com tarefas complexas e gerar saídas que frequentemente se assemelham ao estilo humano de comunicação. Esses modelos têm uma ampla gama de aplicações em pesquisa, negócios, educação e muito mais, revolucionando a maneira como a IA interage com e compreende a linguagem humana.

## Tipos de Large Language Models

`Base LLM (Large Language Model)`

Um Base LLM, ou Modelo de Linguagem de Base, é um modelo de inteligência artificial que aprende a linguagem humana a partir de enormes quantidades de texto. Ele pode responder a perguntas, gerar texto e realizar várias tarefas relacionadas à linguagem com base no que aprendeu. No entanto, ele precisa de um prompt (uma instrução ou pergunta) para entender o que você deseja que ele faça.

`Instruction Tuned LLM (Large Language Model com Ajuste de Instrução)`

Um Instruction Tuned LLM, ou Modelo de Linguagem de Grande Escala com Ajuste de Instrução, é um tipo de LLM que pode ser direcionado com instruções específicas. Isso significa que, além do prompt, você pode incluir instruções detalhadas para orientar o modelo em direção às respostas desejadas. Isso torna o modelo mais preciso e alinhado com o que você precisa.

Em resumo, a diferença entre um Base LLM e um Instruction Tuned LLM está na capacidade de fornecer instruções detalhadas para o último, permitindo maior controle sobre suas respostas. Enquanto o Base LLM precisa de prompts genéricos, o Instruction Tuned LLM responde melhor a instruções específicas, tornando-o mais eficaz para tarefas específicas e resultados mais direcionados.

Neste curso, vamos focar em `Instruction Tuned LLMs`, como o Chat GPT.

In [1]:
!pip install openai -q

[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m320.7/320.7 kB[0m [31m4.1 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m75.6/75.6 kB[0m [31m4.9 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m77.9/77.9 kB[0m [31m5.6 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m58.3/58.3 kB[0m [31m3.9 MB/s[0m eta [36m0:00:00[0m
[?25h

In [2]:
import os
import openai

openai.api_key = "insira-aqui-sua-chave"

def get_completion(prompt, model="gpt-3.5-turbo"):
    messages = [{"role": "user", "content": prompt}]
    response = openai.ChatCompletion.create(
        model=model,
        messages=messages,
        temperature=0, # this is the degree of randomness of the model's output
    )
    return response.choices[0].message["content"]

## Princípios de Prompting
- **Princípio 1:  Escreva instruções claras e específicas**
- **Princípio 2: Dê tempo para o modelo "pensar"”**

### Táticas

#### Tática 1: Use delimitadores para indicar claramente partes distintas da entrada
- Delimitadores podem ser qualquer coisa, como: ```, """, < >, `<tag> </tag>`, `:`

In [None]:
fact_sheet_chair = """
VISÃO GERAL
- Parte de uma bela família de móveis de escritório inspirados no design
das décadas de 1950, incluindo arquivos, mesas, estantes, mesas de reunião e mais.
- Várias opções de cor para a carcaça e acabamentos da base.
- Disponível com estofamento frontal e traseiro em plástico (SWC-100)
ou estofamento completo (SWC-110) em 10 opções de tecido e 6 opções de couro.
- Opções de acabamento da base: aço inoxidável, preto fosco,
branco brilhante ou cromado.
- A cadeira está disponível com ou sem apoios de braços.
- Adequada para configurações residenciais ou comerciais.
- Qualificada para uso em contratos.

CONSTRUÇÃO
- Base de alumínio com 5 rodízios revestidos de plástico.
- Ajuste pneumático da altura da cadeira para fácil elevação/rebaixamento.

DIMENSÕES
- LARGURA 53 CM | 20,87”
- PROFUNDIDADE 51 CM | 20,08”
- ALTURA 80 CM | 31,50”
- ALTURA DO ASSENTO 44 CM | 17,32”
- PROFUNDIDADE DO ASSENTO 41 CM | 16,14”

OPÇÕES
- Opções de rodízios para piso macio ou duro.
- Duas escolhas de densidades de espuma do assento:
 média (1,8 lb/ft3) ou alta (2,8 lb/ft3).
- Sem braços ou com apoios de braços PU em 8 posições.

MATERIAIS
CARCAÇA BASE DESLIZANTE
- Alumínio fundido com revestimento modificado de nylon PA6/PA66.
- Espessura da carcaça: 10 mm.
ASSENTO
- Espuma HD36.

PAÍS DE ORIGEM
- Itália
"""
