# OpenAI

É possível consumir (mas não baixar) o modelo GPT através de uma API, na qual é necessário passar alguns parâmetros. 

- **Chave**: É necessária a utilização de uma chave, que será a autenticação para utilizar a API da OpenAI.

Em termos de custos, existem chaves de modelos mais simples que possuem um menor custo e de modelos mais complexos e caros.


## Obtenção da Chave

Ocorrre neste **[link](https://platform.openai.com/api-keys)**, onde é necessário realizar o *login* para cair na seguinte tela:

![image.png](attachment:e8f30967-68de-4c29-8dc6-7d6936af2880.png)

Em seguida a chave deve ser criada:

![image.png](attachment:8f0f1cb4-4d4a-4b4b-ad70-d0f578b6ebb5.png)


![image.png](attachment:f72a6a84-d61b-4afa-8f8e-e960cb52738f.png)

## Pagamento

Por fim, é necessario colocar algum dinheiro na conta em [Billing](https://platform.openai.com/settings/organization/billing/overview) para que seja possível consumir os modelos.

## Aplicação

In [1]:
# Importando a biblioteca
import openai

In [2]:
# Setando o Ambiente
client = openai.api_key="..."
model = "gpt-3.5-turbo"

### Roles da função

Na função *openai.ChatCompletion.create*, usada para interagir com o modelo GPT da OpenAI, o parâmetro messages é uma lista que contém a troca de mensagens entre o usuário e o modelo. Dentro dessa lista, cada elemento é um dicionário com duas chaves principais: **role** e **content**.

**O campo role dentro de cada item da lista messages indica o papel de quem está enviando a mensagem**. Ele pode ter os seguintes valores:

- "system": Este papel é usado para fornecer instruções iniciais ao modelo, que ajudam a configurar seu comportamento ou estilo de resposta. Geralmente, é usada para fornecer contexto sobre o que o modelo deve fazer (por exemplo, "Você é um assistente útil").

- "user": Este papel representa a mensagem enviada pelo usuário. Quando o usuário faz uma pergunta ou solicita algo ao modelo, a mensagem associada a esse papel descreve o pedido ou a interação.

- "assistant": Este papel representa a resposta do modelo para a mensagem do usuário. O conteúdo da mensagem associada a esse papel é a resposta gerada pelo modelo com base no que o usuário disse.

In [3]:
# Testando respostas
response = openai.ChatCompletion.create(
    model="gpt-3.5-turbo",
    messages=[
        {"role": "system", "content": "Você é um jornalista de futebol."},
        {"role": "user", "content": "Quem foi o heroi da copa de 1962?"}
    ]
)
print(response.choices[0].message.content)

O herói da Copa do Mundo de 1962 foi o jogador brasileiro Amarildo, que substituiu o craque Pelé nas quartas de final após uma lesão do camisa 10. Amarildo marcou gols importantes e foi fundamental para a conquista do bicampeonato mundial pela seleção brasileira. Além disso, outros destaques daquela equipe foram Garrincha e Didi.


In [4]:
# Testando respostas
response2 = openai.ChatCompletion.create(
    model="gpt-3.5-turbo",
    messages=[
        {"role": "system", "content": "Você é um especialista em NLP."},
        {"role": "user", "content": "Explique-me o funcionamento de uma estrutura multihead attention."}
    ]
)
print(response2.choices[0].message.content)

A estrutura de atenção multihead (multihead attention) é uma componente essencial utilizada em modelos de rede neural como o Transformer, muito comum em tarefas de Processamento de Linguagem Natural (NLP). A atenção multihead permite que um modelo atenda simultaneamente a diferentes partes de uma sequência de entrada, aprendendo representações mais ricas e capturando relações complexas entre várias partes da sequência.

A atenção multihead funciona da seguinte forma:

1. Representação das consultas, chaves e valores: Para cada token em uma sequência de entrada, são derivadas três representações, chamadas de consultas, chaves e valores. Essas representações são transformadas linearmente a partir da representação original dos tokens.

2. Divisão em múltiplas cabeças (heads): Em seguida, as representações de consultas, chaves e valores são divididas em múltiplas cabeças, criando várias cópias dessas representações.

3. Cálculo da atenção: Para cada cabeça, é calculada uma função de atençã