## Entendendo o GPT

O GPT é uma LLM (Large Language Models), ou seja, um modelo de aprendizado profundo especializado em processamento de linguagem natural. Baseado na arquitetura de transformadores, ele é treinado com grandes volumes de texto para entender e gerar respostas a prompts ou perguntas fornecidas pelo usuário.

São alguns exemplos de LLM:
- GPT (Generative Pre-trained Transformer) - OpenAI
- BERT (Bidirectional Encoder Representations from Transformers) - Google AI
- RoBERTa (A Robustly Optimized BERT Pretraining Approach) - Facebook AI
- ELECTRA (Efficiently Learning an Encoder that Classifies Token Replacements Accurately) - Google Research
- Megatron-LM - NVIDIA
- DeBERTa (Decoding-enhanced BERT with disentangled attention) - Microsoft Research
- Turing-NLG - Microsoft

O GPT possui mais de um modelo, sendo os mais famosos GPT-3.5 e o GPT-4. A OpenAI possui outros modelos como DaVinci, Curie, Ada, etc. 
[Lista dos Modelos do OpenAI](https://platform.openai.com/docs/models)


Para utilizar uma LLM, passamos uma instrução (prompt) solicitando uma resposta ou ação. O prompt pode ser um pedido ou um questionamento.

Exemplos:
- **Q&A:** "Qual é a capital da França?";
- **Criação de Texto:** "Escreva um poema sobre a primavera.";
- **Instrução:** "Transforme a seguinte frase para voz passiva: 'O gato perseguiu o rato.'";

Este prompt será convertido em tokens que representam uma unidade de informação. Um token pode ser tão curto quanto uma letra e tão longo quanto uma palavra, dependendo do contexto e do idioma.

Em média, 100 tokens equivalem a aproximadamente 75 palavras. É possível verificar a quantidade de tokens neste [Link](https://platform.openai.com/tokenizer)


### Instalando os módulos necessários.
- python-dotenv para ler as configurações do arquivo .env
- openai para acessar a API do ChatGPT

In [1]:
!pip install python-dotenv
!pip install openai

Defaulting to user installation because normal site-packages is not writeable
Defaulting to user installation because normal site-packages is not writeable


### Preparando para as chamadas
Iremos importar as bibliotecas necessárias e passar o valor da chave do OpenAI

In [3]:
import os
import openai
import json
from dotenv import load_dotenv, find_dotenv

load_dotenv(find_dotenv())
openai.api_key = os.environ["OPENAI_API_KEY"]

### Exemplo de chamada do OpenAI
Após informar a sua chave do OpenAI, basta realizar a chamada informando o modelo, as mensagens e a temperatura.

Há vários modelos do OpenAI que podem ser utilizados. Cada um com custos diferentes e com propósitos diferentes.
- **Série GPT3**
	- **text-ada-001:** Utilizado para tarefas simples, normalmente mais rápido que o GPT3 com custo mais baixo.
		- Ideal para análise de textos, classificações simples, correções de endereço e palavras-chave.
	- **text-babbage-001:** Utilizado para tarefas simples com baixo custo.
		- Ideal para classificações moderadas e buscas semânticas.
	- **text-curie-001:** Muito capaz, mais rápido e mais barato que o text-davinci-003.
		- Ideal para tradução de idiomas, classificação complexa e sumarização de sentimentos.
- **Série GPT3.5**
	- **text-davinci-edit-001:** Modelo especializado para editar textos.
		- Ideal para alterar um texto conforme a instrução dada.
	- **code-davinci-edit-001:** Modelo especializado para editar códigos.
		- Ideal para alterar um código conforme a instrução dada.
	- **text-davinci-003:** Realiza tarefas com mais qualidade, com saídas mais extensas e com melhores instruções.
		- Ideal para identificar intenção complexa, causa e efeito, geração criativa e sumarização de pesquisas.
	- **gpt-3.5-turbo:** O modelo GPT-3.5 mais capaz e otimizado para chat a 1/10 do custo do text-davinci-003.
		- Ideal para identificar intenção complexa, causa e efeito, geração criativa e sumarização de pesquisas.
- **Série GPT4**
	- **gpt-4:** Mais capaz do que qualquer modelo GPT-3.5, apto a realizar tarefas mais complexas e otimizado para chat.

Compare as diferença de respostas para uma mesma pergunta

In [4]:
#input = "Descreva os potenciais impactos das mudanças climáticas na economia global ao longo do século 21."
input = "Responda em formato de verso. Qual a capital do Brasil?"
messages = [{"role": "user", "content": input}]

#### text-ada-001

In [5]:
response = openai.Completion.create(
	model="text-ada-001",
	prompt=input,
	temperature=0.7,
	max_tokens=2000,
)
print(response.choices[0].text)
print("\n" + "="*50 + "\n")
print(json.dumps(response, indent=4, sort_keys=True))



Brasília


{
    "choices": [
        {
            "finish_reason": "stop",
            "index": 0,
            "logprobs": null,
            "text": "\n\nBras\u00edlia"
        }
    ],
    "created": 1692711929,
    "id": "cmpl-7qLzFV94IGMC1t9erXSoLQoWXGkec",
    "model": "text-ada-001",
    "object": "text_completion",
    "usage": {
        "completion_tokens": 6,
        "prompt_tokens": 16,
        "total_tokens": 22
    },
}


#### text-babbage-001

In [6]:
response = openai.Completion.create(
	model="text-babbage-001",
	prompt=input,
	temperature=0.7,
	max_tokens=2000,
)
print(response.choices[0].text)
print("\n" + "="*50 + "\n")
print(json.dumps(response, indent=4, sort_keys=True))



Brasília.


{
    "choices": [
        {
            "finish_reason": "stop",
            "index": 0,
            "logprobs": null,
            "text": "\n\nBras\u00edlia."
        }
    ],
    "created": 1692711936,
    "id": "cmpl-7qLzMB2tD5f7CD7LC74ikT1D5nbmh",
    "model": "text-babbage-001",
    "object": "text_completion",
    "usage": {
        "completion_tokens": 7,
        "prompt_tokens": 16,
        "total_tokens": 23
    },
}


#### text-curie-001

In [7]:
response = openai.Completion.create(
	model="text-curie-001",
	prompt=input,
	temperature=0.7,
	max_tokens=2000,
)
print(response.choices[0].text)
print("\n" + "="*50 + "\n")
print(json.dumps(response, indent=4, sort_keys=True))



A capital do Brasil é Brasília.


{
    "choices": [
        {
            "finish_reason": "stop",
            "index": 0,
            "logprobs": null,
            "text": "\n\nA capital do Brasil \u00e9 Bras\u00edlia."
        }
    ],
    "created": 1692711947,
    "id": "cmpl-7qLzXisg73ENzHonCWFN7jKcVcX3A",
    "model": "text-curie-001",
    "object": "text_completion",
    "usage": {
        "completion_tokens": 12,
        "prompt_tokens": 16,
        "total_tokens": 28
    },
}


#### text-davinci-003

In [8]:
response = openai.Completion.create(
	model="text-davinci-003",
	prompt=input,
	temperature=0.7,
	max_tokens=2000,
)
print(response.choices[0].text)
print("\n" + "="*50 + "\n")
print(json.dumps(response, indent=4, sort_keys=True))



"Brasília, a capital do Brasil
A terra do sol que nasceu para brilhar"


{
    "choices": [
        {
            "finish_reason": "stop",
            "index": 0,
            "logprobs": null,
            "text": "\n\n\"Bras\u00edlia, a capital do Brasil\nA terra do sol que nasceu para brilhar\""
        }
    ],
    "created": 1692711954,
    "id": "cmpl-7qLzeow9Tb3vzQv6UTE4n7Ai1PnNO",
    "model": "text-davinci-003",
    "object": "text_completion",
    "usage": {
        "completion_tokens": 28,
        "prompt_tokens": 16,
        "total_tokens": 44
    },
}


#### gpt-3.5-turbo

In [12]:
response = openai.ChatCompletion.create(
	model="gpt-3.5-turbo",
	messages=messages,
	temperature=0.7
)
print(response.choices[0].message["content"])
print("\n" + "="*50 + "\n")
print(json.dumps(response, indent=4, sort_keys=True))

Brasília é a capital do Brasil,
Um lugar de beleza sem igual.
Com sua arquitetura moderna,
No coração do Planalto Central.

Lá estão os poderes do país,
Onde a história se faz presente.
Política, cultura e diversidade,
Em cada canto, um encanto latente.

Brasília, cidade planejada,
Com suas avenidas largas e retas.
Um símbolo de progresso e inovação,
No centro do país, entre florestas.

É lá que se encontra o poder,
Onde as decisões são tomadas.
A capital do Brasil, orgulho nacional,
Um lugar que não pode ser esquecido.


{
    "choices": [
        {
            "finish_reason": "stop",
            "index": 0,
            "message": {
                "content": "Bras\u00edlia \u00e9 a capital do Brasil,\nUm lugar de beleza sem igual.\nCom sua arquitetura moderna,\nNo cora\u00e7\u00e3o do Planalto Central.\n\nL\u00e1 est\u00e3o os poderes do pa\u00eds,\nOnde a hist\u00f3ria se faz presente.\nPol\u00edtica, cultura e diversidade,\nEm cada canto, um encanto latente.\n\nBras\u00edlia, cida

#### gpt-4

In [13]:
response = openai.ChatCompletion.create(
	model="gpt-4",
	messages=messages,
	temperature=0.7
)
print(response.choices[0].message['content'])
print("\n" + "="*50 + "\n")
print(json.dumps(response, indent=4, sort_keys=True))

Brasília é a capital, sem igual,
Do nosso querido Brasil tropical.


{
    "choices": [
        {
            "finish_reason": "stop",
            "index": 0,
            "message": {
                "content": "Bras\u00edlia \u00e9 a capital, sem igual,\nDo nosso querido Brasil tropical.",
                "role": "assistant"
            }
        }
    ],
    "created": 1692712024,
    "id": "chatcmpl-7qM0mC6uy1TI8T16j3942acDYsmHj",
    "model": "gpt-4-0613",
    "object": "chat.completion",
    "usage": {
        "completion_tokens": 17,
        "prompt_tokens": 21,
        "total_tokens": 38
    }
}


### Roles 

Para os modelos do GPT-3.5 e GPT-4, é possível definir as roles. Ou seja, o modelo consegue identificar os tipos abaixo:
- user: iteração do usuário;
- assistant: resposta do openAI

- system: diretriz de como o openAI deverá responder

In [14]:
messages = [{"role": "system", "content": "Você é um menestrel da idade média e deverá responder usando versos."},
	{"role": "user", "content": "Qual a capital do Brasil?"}]

response = openai.ChatCompletion.create(
	model="gpt-4",
	messages=messages,
	temperature=0.7,
	max_tokens=2000,
)
print(response.choices[0].message['content'])
print("\n" + "="*50 + "\n")
print(json.dumps(response, indent=4, sort_keys=True))

Em terras distantes além do mar,
Onde o sol é ardente a brilhar,
Existe um lugar de beleza sem par,
Brasília é seu nome a se aclamar.

No coração do país ela se encontra,
Com arquitetura que nossa vista apronta,
A capital, com orgulho, se desfruta,
Nas terras verdes da bela conduta.


{
    "choices": [
        {
            "finish_reason": "stop",
            "index": 0,
            "message": {
                "content": "Em terras distantes al\u00e9m do mar,\nOnde o sol \u00e9 ardente a brilhar,\nExiste um lugar de beleza sem par,\nBras\u00edlia \u00e9 seu nome a se aclamar.\n\nNo cora\u00e7\u00e3o do pa\u00eds ela se encontra,\nCom arquitetura que nossa vista apronta,\nA capital, com orgulho, se desfruta,\nNas terras verdes da bela conduta.",
                "role": "assistant"
            }
        }
    ],
    "created": 1692712038,
    "id": "chatcmpl-7qM10fgVK3qMK9zEeyckq1cSvDvCO",
    "model": "gpt-4-0613",
    "object": "chat.completion",
    "usage": {
        "completion_t

### Temperatura

A temperatura defini o grau de liberdade para criatividade (ou aleatoriedade).

In [16]:
messages = [{"role": "user", "content": "Esta frase é falsa?"},]
print('Zero aleatoriedade')

response = openai.ChatCompletion.create(
	model="gpt-3.5-turbo",
	messages=messages,
	temperature=0
)
print(response.choices[0].message['content'])

print()
print('Muita aleatoriedade')
response = openai.ChatCompletion.create(
	model="gpt-3.5-turbo",
	messages=messages,
	temperature=1
)
print(response.choices[0].message['content'])

Zero aleatoriedade
Sim, essa frase é falsa.

Muita aleatoriedade
A frase "Esta frase é falsa" é uma frase paradoxal ou auto-referencial, onde não pode ser determinado como verdadeira ou falsa. Isso ocorre porque se a frase afirma ser falsa, então ela deveria ser verdadeira. E se a frase é verdadeira, então ela está dizendo que é falsa, o que torna paradoxal. Por essa razão, a frase não pode ser classificada como verdadeira ou falsa.
