## Entendendo o GPT

O GPT é uma LLM (Large Language Models), ou seja, um modelo de aprendizado profundo especializado em processamento de linguagem natural. Baseado na arquitetura de transformadores, ele é treinado com grandes volumes de texto para entender e gerar respostas a prompts ou perguntas fornecidas pelo usuário.

São alguns exemplos de LLM:
- GPT (Generative Pre-trained Transformer) - OpenAI
- BERT (Bidirectional Encoder Representations from Transformers) - Google AI
- RoBERTa (A Robustly Optimized BERT Pretraining Approach) - Facebook AI
- ELECTRA (Efficiently Learning an Encoder that Classifies Token Replacements Accurately) - Google Research
- Megatron-LM - NVIDIA
- DeBERTa (Decoding-enhanced BERT with disentangled attention) - Microsoft Research
- Turing-NLG - Microsoft

O GPT possui mais de um modelo, sendo os mais famosos GPT-3.5 e o GPT-4. A OpenAI possui outros modelos como DaVinci, Curie, Ada, etc. 
[Lista dos Modelos do OpenAI](https://platform.openai.com/docs/models)

Para utilizar uma LLM, passamos uma instrução (prompt) solicitando uma resposta ou ação. O prompt pode ser um pedido ou um questionamento.

É possível pedir para o GPT:
- Rascunhar documentos
- Escrever código de computador
- Responder perguntas sobre uma base de conhecimento
- Analisar textos
- Criar agentes conversacionais
- Dar ao software uma interface de linguagem natural
- Tutorar em uma variedade de assuntos
- Traduzir idiomas
- Simular personagens para jogos

Exemplos:
- **Q&A:** "Qual é a capital da França?";
- **Criação de Texto:** "Escreva um poema sobre a primavera.";
- **Instrução:** "Transforme a seguinte frase para voz passiva: 'O gato perseguiu o rato.'";

Este prompt será convertido em tokens que representam uma unidade de informação. Um token pode ser tão curto quanto uma letra e tão longo quanto uma palavra, dependendo do contexto e do idioma.

Em média, 100 tokens equivalem a aproximadamente 75 palavras. É possível verificar a quantidade de tokens neste [Link](https://platform.openai.com/tokenizer)


### Instalando os módulos necessários.
- python-dotenv para ler as configurações do arquivo .env
- openai para acessar a API do ChatGPT

In [1]:
!pip install python-dotenv
!pip install openai

Defaulting to user installation because normal site-packages is not writeable
Defaulting to user installation because normal site-packages is not writeable


### Preparando para as chamadas
Iremos importar as bibliotecas necessárias e passar o valor da chave do OpenAI

In [3]:
import os
import openai
import json
from dotenv import load_dotenv, find_dotenv

load_dotenv(find_dotenv())
openai.api_key = os.environ["OPENAI_API_KEY"]

### Exemplo de chamada do OpenAI
Após informar a sua chave do OpenAI, basta realizar a chamada informando o modelo, as mensagens e a temperatura.

Há vários modelos do OpenAI que podem ser utilizados. Cada um com custos diferentes e com propósitos diferentes.
- **Série GPT3**
	- **text-ada-001:** Utilizado para tarefas simples, normalmente mais rápido que o GPT3 com custo mais baixo.
		- Ideal para análise de textos, classificações simples, correções de endereço e palavras-chave.
	- **text-babbage-001:** Utilizado para tarefas simples com baixo custo.
		- Ideal para classificações moderadas e buscas semânticas.
	- **text-curie-001:** Muito capaz, mais rápido e mais barato que o text-davinci-003.
		- Ideal para tradução de idiomas, classificação complexa e sumarização de sentimentos.
- **Série GPT3.5**
	- **text-davinci-edit-001:** Modelo especializado para editar textos.
		- Ideal para alterar um texto conforme a instrução dada.
	- **code-davinci-edit-001:** Modelo especializado para editar códigos.
		- Ideal para alterar um código conforme a instrução dada.
	- **text-davinci-003:** Realiza tarefas com mais qualidade, com saídas mais extensas e com melhores instruções.
		- Ideal para identificar intenção complexa, causa e efeito, geração criativa e sumarização de pesquisas.
	- **gpt-3.5-turbo:** O modelo GPT-3.5 mais capaz e otimizado para chat a 1/10 do custo do text-davinci-003.
		- Ideal para identificar intenção complexa, causa e efeito, geração criativa e sumarização de pesquisas.
- **Série GPT4**
	- **gpt-4:** Mais capaz do que qualquer modelo GPT-3.5, apto a realizar tarefas mais complexas e otimizado para chat.

### Compare as diferença de respostas de cada modelo para a mesma pergunta

In [4]:
#input = "Descreva os potenciais impactos das mudanças climáticas na economia global ao longo do século 21."
input = "Responda em formato de verso. Qual a capital do Brasil?"
messages = [{"role": "user", "content": input}]

#### text-ada-001

In [5]:
response = openai.Completion.create(
	model="text-ada-001",
	prompt=input,
	temperature=0.7,
	max_tokens=2000,
)
print(response.choices[0].text)
print("\n" + "="*50 + "\n")
print(json.dumps(response, indent=4, sort_keys=True))



Brasília


{
    "choices": [
        {
            "finish_reason": "stop",
            "index": 0,
            "logprobs": null,
            "text": "\n\nBras\u00edlia"
        }
    ],
    "created": 1692711929,
    "id": "cmpl-7qLzFV94IGMC1t9erXSoLQoWXGkec",
    "model": "text-ada-001",
    "object": "text_completion",
    "usage": {
        "completion_tokens": 6,
        "prompt_tokens": 16,
        "total_tokens": 22
    },
}


#### text-babbage-001

In [6]:
response = openai.Completion.create(
	model="text-babbage-001",
	prompt=input,
	temperature=0.7,
	max_tokens=2000,
)
print(response.choices[0].text)
print("\n" + "="*50 + "\n")
print(json.dumps(response, indent=4, sort_keys=True))



Brasília.


{
    "choices": [
        {
            "finish_reason": "stop",
            "index": 0,
            "logprobs": null,
            "text": "\n\nBras\u00edlia."
        }
    ],
    "created": 1692711936,
    "id": "cmpl-7qLzMB2tD5f7CD7LC74ikT1D5nbmh",
    "model": "text-babbage-001",
    "object": "text_completion",
    "usage": {
        "completion_tokens": 7,
        "prompt_tokens": 16,
        "total_tokens": 23
    },
}


#### text-curie-001

In [7]:
response = openai.Completion.create(
	model="text-curie-001",
	prompt=input,
	temperature=0.7,
	max_tokens=2000,
)
print(response.choices[0].text)
print("\n" + "="*50 + "\n")
print(json.dumps(response, indent=4, sort_keys=True))



A capital do Brasil é Brasília.


{
    "choices": [
        {
            "finish_reason": "stop",
            "index": 0,
            "logprobs": null,
            "text": "\n\nA capital do Brasil \u00e9 Bras\u00edlia."
        }
    ],
    "created": 1692711947,
    "id": "cmpl-7qLzXisg73ENzHonCWFN7jKcVcX3A",
    "model": "text-curie-001",
    "object": "text_completion",
    "usage": {
        "completion_tokens": 12,
        "prompt_tokens": 16,
        "total_tokens": 28
    },
}


#### text-davinci-003

In [8]:
response = openai.Completion.create(
	model="text-davinci-003",
	prompt=input,
	temperature=0.7,
	max_tokens=2000,
)
print(response.choices[0].text)
print("\n" + "="*50 + "\n")
print(json.dumps(response, indent=4, sort_keys=True))



"Brasília, a capital do Brasil
A terra do sol que nasceu para brilhar"


{
    "choices": [
        {
            "finish_reason": "stop",
            "index": 0,
            "logprobs": null,
            "text": "\n\n\"Bras\u00edlia, a capital do Brasil\nA terra do sol que nasceu para brilhar\""
        }
    ],
    "created": 1692711954,
    "id": "cmpl-7qLzeow9Tb3vzQv6UTE4n7Ai1PnNO",
    "model": "text-davinci-003",
    "object": "text_completion",
    "usage": {
        "completion_tokens": 28,
        "prompt_tokens": 16,
        "total_tokens": 44
    },
}


#### gpt-3.5-turbo

In [12]:
response = openai.ChatCompletion.create(
	model="gpt-3.5-turbo",
	messages=messages,
	temperature=0.7
)
print(response.choices[0].message["content"])
print("\n" + "="*50 + "\n")
print(json.dumps(response, indent=4, sort_keys=True))

Brasília é a capital do Brasil,
Um lugar de beleza sem igual.
Com sua arquitetura moderna,
No coração do Planalto Central.

Lá estão os poderes do país,
Onde a história se faz presente.
Política, cultura e diversidade,
Em cada canto, um encanto latente.

Brasília, cidade planejada,
Com suas avenidas largas e retas.
Um símbolo de progresso e inovação,
No centro do país, entre florestas.

É lá que se encontra o poder,
Onde as decisões são tomadas.
A capital do Brasil, orgulho nacional,
Um lugar que não pode ser esquecido.


{
    "choices": [
        {
            "finish_reason": "stop",
            "index": 0,
            "message": {
                "content": "Bras\u00edlia \u00e9 a capital do Brasil,\nUm lugar de beleza sem igual.\nCom sua arquitetura moderna,\nNo cora\u00e7\u00e3o do Planalto Central.\n\nL\u00e1 est\u00e3o os poderes do pa\u00eds,\nOnde a hist\u00f3ria se faz presente.\nPol\u00edtica, cultura e diversidade,\nEm cada canto, um encanto latente.\n\nBras\u00edlia, cida

#### gpt-4

In [13]:
response = openai.ChatCompletion.create(
	model="gpt-4",
	messages=messages,
	temperature=0.7
)
print(response.choices[0].message['content'])
print("\n" + "="*50 + "\n")
print(json.dumps(response, indent=4, sort_keys=True))

Brasília é a capital, sem igual,
Do nosso querido Brasil tropical.


{
    "choices": [
        {
            "finish_reason": "stop",
            "index": 0,
            "message": {
                "content": "Bras\u00edlia \u00e9 a capital, sem igual,\nDo nosso querido Brasil tropical.",
                "role": "assistant"
            }
        }
    ],
    "created": 1692712024,
    "id": "chatcmpl-7qM0mC6uy1TI8T16j3942acDYsmHj",
    "model": "gpt-4-0613",
    "object": "chat.completion",
    "usage": {
        "completion_tokens": 17,
        "prompt_tokens": 21,
        "total_tokens": 38
    }
}


### Roles 

Para os modelos do GPT-3.5 e GPT-4, é possível definir as roles. Ou seja, o modelo consegue identificar os tipos abaixo:
- **user:** iteração do usuário;
- **assistant:** resposta do openAI
- **system:** diretriz de como o openAI deverá responder

A mensagem do sistema ajuda a definir o comportamento do assistente. Por exemplo, você pode modificar a personalidade do assistente ou fornecer instruções específicas sobre como ele deve se comportar ao longo da conversa. No entanto, note que a mensagem do sistema é opcional e o comportamento do modelo sem uma mensagem do sistema provavelmente será semelhante ao uso de uma mensagem genérica, como "Você é um assistente útil."

As mensagens do usuário fornecem solicitações ou comentários para o assistente responder. Mensagens do assistente armazenam respostas anteriores do assistente, mas também podem ser escritas por você para dar exemplos de comportamento desejado.

Incluir o histórico da conversa é importante quando as instruções do usuário se referem a mensagens anteriores. Como os modelos não têm memória de solicitações passadas, todas as informações relevantes devem ser fornecidas como parte do histórico da conversa em cada solicitação. Se uma conversa não puder se encaixar no limite de tokens do modelo, ela precisará ser encurtada de alguma forma.

In [14]:
messages = [{"role": "system", "content": "Você é um menestrel da idade média e deverá responder usando versos."},
	{"role": "user", "content": "Qual a capital do Brasil?"}]

response = openai.ChatCompletion.create(
	model="gpt-4",
	messages=messages,
	temperature=0.7,
	max_tokens=2000,
)
print(response.choices[0].message['content'])
print("\n" + "="*50 + "\n")
print(json.dumps(response, indent=4, sort_keys=True))

Em terras distantes além do mar,
Onde o sol é ardente a brilhar,
Existe um lugar de beleza sem par,
Brasília é seu nome a se aclamar.

No coração do país ela se encontra,
Com arquitetura que nossa vista apronta,
A capital, com orgulho, se desfruta,
Nas terras verdes da bela conduta.


{
    "choices": [
        {
            "finish_reason": "stop",
            "index": 0,
            "message": {
                "content": "Em terras distantes al\u00e9m do mar,\nOnde o sol \u00e9 ardente a brilhar,\nExiste um lugar de beleza sem par,\nBras\u00edlia \u00e9 seu nome a se aclamar.\n\nNo cora\u00e7\u00e3o do pa\u00eds ela se encontra,\nCom arquitetura que nossa vista apronta,\nA capital, com orgulho, se desfruta,\nNas terras verdes da bela conduta.",
                "role": "assistant"
            }
        }
    ],
    "created": 1692712038,
    "id": "chatcmpl-7qM10fgVK3qMK9zEeyckq1cSvDvCO",
    "model": "gpt-4-0613",
    "object": "chat.completion",
    "usage": {
        "completion_t

#### Fornecendo exemplos através das roles
Para adequar mais a resposta, é possível utilizar as roles para dar exemplo de como deverá ser as respostas.

In [51]:
print('Sem exemplos')
messages = [
  {"role": "system", "content": "Você é um assitente que ajudará a entender gírias nordestias."},
  {"role": "user", "content": "O abestalhado quis me dar este item fuleiro."},
]

response = openai.ChatCompletion.create(
	model="gpt-3.5-turbo",
	messages=messages,
	temperature=0.7,
)

print(response.choices[0].message['content'])
print()
print('Com exemplos:')

messages = [
  {"role": "system", "content": "Você é um assitente que ajudará a entender gírias nordestias."},
  {"role": "system", "name":"example_user", "content": "Mas aquele cabra é muito arretado."},
  {"role": "system", "name":"example_assistant", "content": "Mas ele é muito bravo."},
  {"role": "system", "name":"example_user", "content": "Estavam mangando daquele tabacudo."},
  {"role": "system", "name":"example_assistant", "content": "Estavam rindo daquele bobo."},
  {"role": "user", "content": "O abestalhado quis me dar este item fuleiro."},
]

response = openai.ChatCompletion.create(
	model="gpt-3.5-turbo",
	messages=messages,
	temperature=0.7,
)

print(response.choices[0].message['content'])

print('\n' + '='*50 + '\n')
print(json.dumps(response, indent=4, sort_keys=True))

Sem exemplos
A expressão "abestalhado" é uma gíria nordestina que significa alguém desajeitado, bobo ou desprovido de habilidade. Já o termo "fuleiro" é usado para descrever algo de baixa qualidade, malfeito ou sem valor. Nesse contexto, a frase significa que alguém tentou te dar um objeto de má qualidade ou pouco útil.

Com exemplos:
O tolo quis me dar este item de má qualidade.


{
    "choices": [
        {
            "finish_reason": "stop",
            "index": 0,
            "message": {
                "content": "O tolo quis me dar este item de m\u00e1 qualidade.",
                "role": "assistant"
            }
        }
    ],
    "created": 1692744861,
    "id": "chatcmpl-7qUYPX477tS1tgHVdL9RFfg1MLJz1",
    "model": "gpt-3.5-turbo-0613",
    "object": "chat.completion",
    "usage": {
        "completion_tokens": 12,
        "prompt_tokens": 115,
        "total_tokens": 127
    }
}


### Temperatura

A temperatura defini o grau de liberdade para criatividade (ou aleatoriedade).

In [16]:
messages = [{"role": "user", "content": "Esta frase é falsa?"},]
print('Zero aleatoriedade')

response = openai.ChatCompletion.create(
	model="gpt-3.5-turbo",
	messages=messages,
	temperature=0
)
print(response.choices[0].message['content'])

print()
print('Muita aleatoriedade')
response = openai.ChatCompletion.create(
	model="gpt-3.5-turbo",
	messages=messages,
	temperature=1
)
print(response.choices[0].message['content'])

Zero aleatoriedade
Sim, essa frase é falsa.

Muita aleatoriedade
A frase "Esta frase é falsa" é uma frase paradoxal ou auto-referencial, onde não pode ser determinado como verdadeira ou falsa. Isso ocorre porque se a frase afirma ser falsa, então ela deveria ser verdadeira. E se a frase é verdadeira, então ela está dizendo que é falsa, o que torna paradoxal. Por essa razão, a frase não pode ser classificada como verdadeira ou falsa.


### Finish Reasons

Cada resposta tem um motivo de finalização (finish reason). Eles podem ser:
- **stop:** A API retornou uma mensagem completa ou uma mensagem terminada por uma das sequências de parada fornecidas pelo parâmetro stop.
- **length:** Saída incompleta do modelo devido ao parâmetro max_tokens ou limite de tokens.
- **function_call:** O modelo decidiu chamar uma função.
- **content_filter:** Conteúdo omitido devido a uma sinalização de filtros de conteúdo.
- **null:** Resposta da API ainda em andamento ou incompleta.

#### stop

In [17]:
messages = [{"role": "user", "content": "Qual é a letra do Hino do Brasil?"},]

response = openai.ChatCompletion.create(
	model="gpt-3.5-turbo",
	messages=messages,
	temperature=0.7,
	stop=["Ipiranga"],
)
print(response.choices[0].message['content'])
print('motivo da parada:' +response.choices[0].finish_reason)

A letra do Hino Nacional do Brasil é a seguinte:

Ouviram do 
motivo da parada:stop


#### length

In [20]:
messages = [{"role": "user", "content": "Qual é a letra do Hino do Brasil?"},]

response = openai.ChatCompletion.create(
	model="gpt-3.5-turbo",
	messages=messages,
	temperature=0.7,
	max_tokens=30,
)
print(response.choices[0].message['content'])
print('motivo da parada:' +response.choices[0].finish_reason)

A letra do Hino do Brasil é a seguinte:

Ouviram do Ipiranga as margens plácidas
De um povo
motivo da parada:length


#### function_call

In [34]:
messages = [{"role": "user", "content": "Qual é o dobro de 25?"},]

def get_double(number):
	"""Get the double of a number"""
	double = {
		"number": int(number) * 2,
	}
	return json.dumps(double)

functions = [
	{
    	"name": "get_double",
		"description": "Get the double of a number",
		"parameters": {
			"type": "object",
			"properties": {
				"number": {
					"type": "string",
					"description": "Number to be doubled, e.g. '4'",
				}
			},
            "required": ["number"],
		},
	}
]

response = openai.ChatCompletion.create(
	model="gpt-3.5-turbo",
	messages=messages,
	temperature=0.7,
	functions=functions,
)
response_message = response["choices"][0]["message"]

if response_message.get("function_call"):
	available_functions = {
            "get_double": get_double,
	}
	function_name = response_message["function_call"]["name"]
	fuction_to_call = available_functions[function_name]
	function_args = json.loads(response_message["function_call"]["arguments"])
	function_response = fuction_to_call(
            number=function_args.get("number")
	)

	messages.append(response_message)
	messages.append(
		{
			"role": "function",
			"name": function_name,
			"content": function_response,
		}
	)
	second_response = openai.ChatCompletion.create(
		model="gpt-3.5-turbo",
        messages=messages,
	)

	print(second_response.choices[0].message['content'])
print('motivo da parada:' +response.choices[0].finish_reason)

25
O dobro de 25 é 50.
motivo da parada:function_call


#### content_filter
São situações muito específicas em que o chatGPT entende que está indo contra as políticas. Não consegui fazer nenhuma simulação desta situação

#### null
:** Resposta da API ainda em andamento ou incompleta.

### Choices

Também é possível solicitar mais de uma resposta na mesma request. Para isto, basta informar o parâmetro n com a quantidade de respostas desejadas.

Importante lembrar que isto aumentará significativamente a quantidade de tokens, consequentemente, o preço da chamada.

In [37]:
messages = [{"role": "user", "content": "Complete a frase: O Brasil é conhecido por...?"},]

response = openai.ChatCompletion.create(
	model="gpt-3.5-turbo",
	messages=messages,
	temperature=0.7,
	n=4,
)
i=0
for choice in response.choices:
	i+=1
	print('Resposta' + str(i) + ': ' + choice.message['content'])

print('\n' + '='*50 + '\n')
print(json.dumps(response, indent=4, sort_keys=True))

Resposta1: O Brasil é conhecido por suas belezas naturais, cultura diversificada e pelo futebol.
Resposta2: O Brasil é conhecido por suas belas praias, sua diversidade cultural e sua paixão pelo futebol.
Resposta3: O Brasil é conhecido por sua cultura diversificada, suas belas praias, sua paixão pelo futebol e sua rica biodiversidade.
Resposta4: O Brasil é conhecido por sua cultura diversa, suas belezas naturais, seu futebol talentoso e sua música contagiante.


{
    "choices": [
        {
            "finish_reason": "stop",
            "index": 0,
            "message": {
                "content": "O Brasil \u00e9 conhecido por suas belezas naturais, cultura diversificada e pelo futebol.",
                "role": "assistant"
            }
        },
        {
            "finish_reason": "stop",
            "index": 1,
            "message": {
                "content": "O Brasil \u00e9 conhecido por suas belas praias, sua diversidade cultural e sua paix\u00e3o pelo futebol.",
    

### Inserindo textos
Este recurso permite que você controle mais finamente a saída do modelo. Isso é útil para tarefas onde você precisa guiar o modelo em direção a um resultado específico.

**Obs:** Não está muito claro como isto funciona. E na [documentação](https://platform.openai.com/docs/guides/gpt/inserting-text) não tem exemplos.


In [47]:

response = openai.Completion.create(
	model="text-davinci-003",
	prompt="Quem descobriu o Brasil?",
	suffix="chocolate com pimenta",
	temperature=0.7,
	best_of=5,
	max_tokens=2000,
)

i=0
for choice in response.choices:
	i+=1
	print('Resposta' + str(i) + ': ' + choice.text)

print('\n' + '='*50 + '\n')
print(json.dumps(response, indent=4, sort_keys=True))

Resposta1: 

A descoberta do Brasil foi atribuída ao navegador português Pedro Álvares Cabral, em abril de 1500. Cabral e sua frota partiram de Lisboa, Portugal, em 9 de março de 1500, em direção ao Oriente, mas acabaram se desviando para o oceano Atlântico, acabando por descobrir a terra que passou a ser conhecida como Brasil. O nome foi dado em homenagem aos brasileiros, árvore cuja madeira era usada para produzir uma cor laranja avermelhada, que era usado para pintar as embarcações. O Brasil foi colonizado pelos portugueses e, posteriormente, foi anexado à Coroa Portuguesa como sua colônia. Após a independência, em 1822, o Brasil tornou-se um país soberano. 

Outro fato interessante sobre a descoberta do Brasil é que o nome da colônia foi dado em homenagem a uma bebida originalmente conhecida como caçhaca, que era feita de melaço de cana-de-açúcar temperado com pimenta. Daí, surgiu a expressão brasileira "caipirinha", que significa literalmente "caipira de melaço". A caipirinha é um