# Par√¢metros da API

H√° alguns par√¢metros que podem e devem ser configurados para refinar os prompts enviados √† API de complementa√ß√£o (completions). Abaixo est√° a c√©lula de configura√ß√£o de ambiente como demostrado em [Configura√ß√£o de Ambiente]('environment_setup.ipynb').

In [2]:
import openai
import configparser

config = configparser.ConfigParser()
config.read('config.ini') # caminho do arquivo de config .ini

openai.api_key = config['AZURE_CONFIG']['AZURE_OPENAI_KEY']
openai.api_base = config["AZURE_CONFIG"]["AZURE_OPENAI_ENDPOINT"]
openai.api_type = 'azure'
openai.api_version = '2023-05-15' # pode mudar futuramente
DEPLOYMENT_NAME = config["AZURE_CONFIG"]["DEPLOYMENT_NAME"]

## Corpo do Request

Abaixo, segue [tabela disponibilizada pela Microsoft](https://learn.microsoft.com/en-us/azure/ai-services/openai/reference) com um apanhado geral sobre os campos utilizados no corpo do request, seus significados e algumas de suas caracter√≠sticas:

| Par√¢metro | Tipo | Obrigat√≥rio? | Padr√£o | Descri√ß√£o |
|-----------|------|--------------|--------|-----------|
|```prompt```| string ou array | Opcional |```<\|endoftext\|>```|O(s) prompt(s) para o(s) qual(is) ser√°(√£o) gerado(s) as complementa√ß√µes. Note que ```<\|endoftext\|>``` √© o separador do documento que o modelo enxerga durante o treinamento. Se um prompt n√£o √© especificado, ent√£o o modelo ir√° gerar a partir do come√ßo de um novo documento. |
|```max_tokens```| integer | Opcional | 16 | O n√∫mero m√°ximo de tokens para gerar a complementa√ß√£o. A contagem de tokens n√£o pode exceder o tamanho do contexto do modelo. A maioria dos modelos tem um comprimento de contexto de 2048 tokens. |
|```temperature```| number | Opcional | 1 | Qual a temperatura a ser utilizada, variando entre 0 e 2. Valores maiores significam que o modelo tomar√° mais riscos. Tente 0.9 para aplica√ß√µes mais criativas e 0 (argmax sampling) para modelos com respostas mais bem definidas. Recomenda-se alterar a temperatura ou o top_p, mas n√£o ambos. |
|```top_p```| number | Opcional | 1 | Uma alternativa √† temperatura, chamada nucleus sampling, onde o modelo considera os resultados dos tokens com probabilidade top_p de massa. Ent√£o 0,1 significa que apenas os tokens dentro de 10% da probabilidade de massa ser√£o considerados. ecomenda-se alterar a temperatura ou o top_p, mas n√£o ambos. Os valores variam entre 0 e 2. |
|```logit_bias```| map | Opcional | null | Modifica as chances de um token aparecer na complementa√ß√£o. Aceita um objeto json que mapeia tokens (especificados por seu token ID do GPT tokenizer) e um valor associado de vi√©s entre -100 e 100. Pode-se utilizar esse tokenizador (GPT-2 e GPT-3) para converter texto para token ID's. Matematicamente, o vi√©s √© adicionado aos logits gerados pelo modelo antes da amostragem. Os efeitos exatos variam por modelo, mas valores entre -1 e 1 podem diminuir ou aumentar as chances de sele√ß√£o; j√° valores como -100 e 100 podem resultar em banimento ou na sele√ß√£o exclusiva de certos tokens. Por exemplo, voc√™ pode passar {'50256': -100} para previnir que o token ```<\|endoftext\|>``` seja gerado. |
|```user```| string | Opcional | | Um identificador √∫nico representando seu usu√°rio, que pode ajudar a identificar e monitorar abuso. |
|```n```| integer | Opcional | 1 | Quantas complementa√ß√µes ser√£o geradas para cada prompt. Nota: esse par√¢metro pode aumentar bastante o n√∫mero de complementa√ß√µes, o que pode acabar rapidamente com a cota de tokens.
|```stream```| boolean | Optional | False | Se o progresso parcial deve ser transmitido de volta. Se definido, os tokens ser√£o enviados como eventos enviados pelo servidor somente de dados assim que estiverem dispon√≠veis, com o fluxo finalizado por uma mensagem data: [DONE]. |
|```logprobs```| integer | Optional | null | Inclue o log de probabilidades dos tokens mais prov√°veis, assim como dos tokens escolhidos. Por exemplo, se o logprobs √© 10, a API retornar√° uma lista dos 10 tokens mais prov√°veis. A API sempre retornar√° o logprob dos tokens da amostra, ent√£o haver√° logprobs+1 elementos na resposta. Esse par√¢metro n√£o pode ser utilizado com o modelo ```gpt-35-turbo```. |
|```suffix```| string | Opcional | null | O sufixo que vem ap√≥s uma complementa√ß√£o de texto. |
|```echo```| boolean | Opcional | False | Um prefixo adicionado antes do prompt para a complementa√ß√£o. |
|```stop```| string ou array | Opcional | null | At√© quatro sequ√™ncias nas quais a API para de gerar mais tokens. O texto retornado n√£o ir√° conter as stop sequences. |
|```presence_penalty```| number | Opcional | 0 | N√∫mero entre -2.0 e 2.0. Valores positivos penalizam nos tokens baseados onde eles aparecem no texto, aumentando a chance do modelo escrever sobre novos t√≥picos. |
|```frequency_penalty```| number | Opcional | 0 | N√∫mero entre -2.0 e 2.0. Valores positivos penalizam os novos tokens baseados na frequ√™ncia pela a qual eles aparecem no texto at√© aquele momento, diminuindo a probabilidade do modelo de repetir as mesmas falas. |
|```best_of```| integer | Opcional | 1 |  Gera as best_of conclus√µes do lado do servidor e retorna a melhor (aquela com a menor probabilidade de log por token).|

## Temperature

Controla a aleatoriedade. Abaixar a temperatura significa que o modelo ir√° produzir respostas mais repetitivas e determin√≠sticas. Aumentar a temperatura resultar√° em respostas mais criativas ou inesperadas. Pode-se ajustar a temperatura ou o Top P, mas n√£o ambos. Os valores de temperatura v√£o de 0 a 1. Abaixo, iremos testar algumas varia√ß√µes dos valores de temperatura e analisar as respostas da API.

In [3]:
prompt = "Defina o conceito da F√≠sica de temperatura:"

cold_response = openai.Completion.create(
    engine=DEPLOYMENT_NAME,
    prompt=prompt,
    temperature=0,
    max_tokens=100
)

normal_response = openai.Completion.create(
    engine=DEPLOYMENT_NAME,
    prompt=prompt,
    temperature=0.5,
    max_tokens=100
)

hot_response = openai.Completion.create(
    engine=DEPLOYMENT_NAME,
    prompt=prompt,
    temperature=1,
    max_tokens=100
)

print(f"Temperatura 0: {cold_response['choices'][0]['text']}\n")
print(f"Temperatura 0.5: {normal_response['choices'][0]['text']}\n")
print(f"Temperatura 1: {hot_response['choices'][0]['text']}\n")

Temperatura 0:  A temperatura √© uma grandeza f√≠sica que mede o grau de agita√ß√£o das mol√©culas de um corpo. Quanto maior a temperatura, maior a agita√ß√£o das mol√©culas e, portanto, maior a energia cin√©tica m√©dia do sistema.

O que √© a escala Celsius? A escala Celsius √© uma escala termom√©trica que mede a temperatura em graus Celsius (¬∞C). Ela √© definida de tal forma

Temperatura 0.5:  A temperatura √© uma grandeza f√≠sica que mede o grau de agita√ß√£o das part√≠culas que comp√µem um corpo.

O que √© a escala Kelvin? A escala Kelvin √© a escala de temperatura termodin√¢mica, onde o zero absoluto √© a menor temperatura poss√≠vel na natureza.

O que √© a escala Celsius? A escala Celsius √© uma escala de temperatura que √© baseada no ponto de fus√£o do gelo (0¬∞C

Temperatura 1:  ‚ÄúA ESTAT√çSTICA DESCREVE AS PROPRIEDADES DOS MATERIAIS EM FUN√á√ÉO DA TEMPERATURA‚Äù.

11 PROPRIEDADES F√çSICAS DOS MATERIAIS - press√£o - volume

O volume e a press√£o de um g√°s est√£o relacionados

Pudemos perceber, que com o aumento do valor da temperatura, a resposta foi menos objetiva. Esses resultados refor√ßam o conceito abordado acima.

## Max Length (tokens)

Configura o n√∫mero limite de tokens por requisi√ß√£o do modelo. A API suporta um m√°ximo de 4000 tokens entre os utilizados no prompt (incluindo as mensagens de sistema, exemplos, mensagens de hist√≥rico, e query de usu√°rio) e a resposta do modelo. Um token √© mais ou menos 4 caracteres para um t√≠pico texto. Os valores variam entre 1 e 4000 tokens.

In [4]:
prompt = "Me diga como calcular a √°rea de um c√≠rculo"

short_response = openai.Completion.create(
    engine=DEPLOYMENT_NAME,
    prompt=prompt,
    max_tokens=10
)

medium_response = openai.Completion.create(
    engine=DEPLOYMENT_NAME,
    prompt=prompt,
    max_tokens=100
)

long_response = openai.Completion.create(
    engine=DEPLOYMENT_NAME,
    prompt=prompt,
    max_tokens=1000
)

maximum_response = openai.Completion.create(
    engine=DEPLOYMENT_NAME,
    prompt=prompt,
    max_tokens=1000
)

print(f"Max Tokens 10: {short_response['choices'][0]['text']}. N√∫mero total de tokens:{short_response['usage']['total_tokens']}\n")
print(f"Max Tokens 100: {medium_response['choices'][0]['text']}. N√∫mero total de tokens:{medium_response['usage']['total_tokens']}\n")
print(f"Max Tokens 1000: {long_response['choices'][0]['text']}. N√∫mero total de tokens:{long_response['usage']['total_tokens']}\n")
print(f"Max Tokens 4000 (m√°ximo): {maximum_response['choices'][0]['text']}. N√∫mero total de tokens:{maximum_response['usage']['total_tokens']}\n")

Max Tokens 10:  de raio R.

*A= œÄ R¬≤. N√∫mero total de tokens:23

Max Tokens 100:  de raio R?

Bom Ana, a √°rea de um c√≠rculo √© determinada conforme a f√≥rmula abaixo:

A = ‚àè R¬≤

Sendo que "A" √© a √°rea do c√≠rculo e "R" √© o raio do c√≠rculo

Exemplo: Calcular a √°rea de um c√≠rculo cujo o raio √© de 4 cm

A = ‚àè R¬≤

A = 3,14. N√∫mero total de tokens:113

Max Tokens 1000: ");
    chatbot.tfidf_model.add_example('como calcular area de um circulo', 'Calculate the area of a spin');

    test("Calculo de Porcentagem", chatbot.ask("Como calcular o valor de 10% de 100?"));
    test("Calculo de Porcentagem", chatbot.ask("Qual √© o valor de 25% de 200?"));
    test("Calculo de Porcentagem", chatbot.ask("Quanto √© 50% de R$500,00?"));
    test("Calculo de Porcentagem", chatbot.ask("25% √© igual a quantos d√©cimos?"));
    test("Calculo de Porcentagem", chatbot.ask("Qual √© o aumento percentual de R$50,00 para R$180,00?"));

    console.log("----> Chatbot Frontend");

    var url = 'h

## Stop Sequences

Faz com que as respostas parem em um ponto desejado, como o fim de uma senten√ßa, ou uma lista. Especifica-se at√© quatro sequ√™ncias nas quais o modelo ir√° parar de gerar tokens na resposta. O texto retornado n√£o cont√©m as sequ√™ncias de parada.

In [5]:
prompt="""O di√°logo a seguir √© uma conversa√ß√£o com um assistente de Intelig√™ncia Artificial. O assistente √© prestativo, criativo, esperto e muito amig√°vel.
\n \nHuman: Ol√°, quem √© voc√™?
\nAI: Ol√°, eu sou um assistente inteligente. Estou aqui pra ajud√°-lo com algo que voc√™ precise.
\nHuman: Eu gostaria de cancelar minha inscri√ß√£o.
\nAI:"""
stop_sequences=["Human:","AI:"]

chat_response = openai.Completion.create(
    engine=DEPLOYMENT_NAME,
    prompt=prompt,
    stop=stop_sequences,
    max_tokens=256
)

chat_response

<OpenAIObject text_completion id=cmpl-7gjhlfzw6OlBkN6HM9J32PTpJx8JD at 0x2b2002edee0> JSON: {
  "id": "cmpl-7gjhlfzw6OlBkN6HM9J32PTpJx8JD",
  "object": "text_completion",
  "created": 1690419821,
  "model": "gpt-35-turbo",
  "choices": [
    {
      "text": " Claro, sem problemas. Voc\u00ea est\u00e1 se referindo para uma inscri\u00e7\u00e3o espec\u00edfica ou a todas elas?\n\n",
      "index": 0,
      "finish_reason": "stop",
      "logprobs": null
    }
  ],
  "usage": {
    "completion_tokens": 24,
    "prompt_tokens": 90,
    "total_tokens": 114
  }
}

## Top Probabilities

Similar √† temperatura, esse par√¢metro controla a aleatoriedade da resposta, mas de uma forma diferente. Abaixar o top P ir√° retringir a escolha de tokens para os tokens mais prov√°veis, ou seja, com mais chances de serem o pr√≥ximo token a completar a senten√ßa. Aumentar o top P permitir√° que o modelo escolha tokens com alta e baixa probabilidade. Pode-se ajustar a temperatura ou o top p, mas n√£o ambos. Os valores de top p podem ir de 0 at√© 1.

In [6]:
prompt = "Defina o conceito de probabilidade:"

cold_response = openai.Completion.create(
    engine=DEPLOYMENT_NAME,
    prompt=prompt,
    top_p=0,
    max_tokens=100
)

normal_response = openai.Completion.create(
    engine=DEPLOYMENT_NAME,
    prompt=prompt,
    top_p=0.5,
    max_tokens=100
)

hot_response = openai.Completion.create(
    engine=DEPLOYMENT_NAME,
    prompt=prompt,
    top_p=1,
    max_tokens=100
)

print(f"Top P 0: {cold_response['choices'][0]['text']}\n")
print(f"Top P 0.5: {normal_response['choices'][0]['text']}\n")
print(f"Top P 1: {hot_response['choices'][0]['text']}\n")

Top P 0:  A probabilidade √© um ramo da matem√°tica que se dedica ao estudo dos fen√¥menos aleat√≥rios. Ela √© utilizada para se estimar a chance de ocorr√™ncia de um determinado evento em uma experi√™ncia aleat√≥ria.

Qual √© a f√≥rmula da probabilidade? A f√≥rmula da probabilidade √© dada por: P(A) = n(A) / n(S), onde P(A) √© a probabilidade do evento

Top P 0.5:  

A probabilidade √© uma medida num√©rica que varia de 0 a 1, que tem como objetivo medir a chance de um evento ocorrer.

- Quais s√£o os m√©todos cl√°ssico e frequentista para calcular probabilidade?

O m√©todo cl√°ssico √© utilizado para calcular a probabilidade de eventos que possuem um espa√ßo amostral finito e equiprov√°vel. A probabilidade √© calculada dividindo-se o n√∫mero de eventos favor√°veis pelo n√∫mero total de

Top P 1: }{A probabilidade √© um conceito t√£o complexo que pode ser apresentado de diversas formas. Em uma defini√ß√£o mais matem√°tica:
\begin{itemize}
\item[\textbf{Defini√ß√£o}] Dado um espa√ßo amo

## Frequency Penalty

Reduz a chance de repetir um token proporcionalmente baseado em qu√£o frequente ele aparece no texto at√© agora. Isso diminui a chance de repetir o exatamente o mesmo texto em uma reposta. Os valores variam de 0 at√© 2.

In [10]:
prompt = "O que √© preciso para desenvolver um chatbot e como eu posso fazer isso?"

low_freq_penal_response = openai.Completion.create(
    engine=DEPLOYMENT_NAME,
    prompt=prompt,
    frequency_penalty=0,
    max_tokens=200
)

normal_freq_penal_response = openai.Completion.create(
    engine=DEPLOYMENT_NAME,
    prompt=prompt,
    frequency_penalty=1,
    max_tokens=200
)

high_freq_penal_response = openai.Completion.create(
    engine=DEPLOYMENT_NAME,
    prompt=prompt,
    frequency_penalty=2,
    max_tokens=200
)

print(f"Frequency Penalty 0: {low_freq_penal_response['choices'][0]['text']}\n")
print(f"Frequency Penalty 1: {normal_freq_penal_response['choices'][0]['text']}\n")
print(f"Frequency Penalty 2: {high_freq_penal_response['choices'][0]['text']}\n")

Frequency Penalty 0:  Esta √© uma de nossas perguntas [‚Ä¶]

Leia mais‚Ä¶

O WhatsApp √© um aplicativo incr√≠vel para comunica√ß√£o pessoal e empresarial, por√©m, ainda n√£o h√° seguran√ßa de que suas informa√ß√µes [‚Ä¶]

Voc√™ j√° deve ter ouvido falar sobre API. API √© uma sigla em ingl√™s que significa ‚ÄúApplication Programming Interface‚Äù. Em [‚Ä¶]

Na hora de utilizar aplicativos mobile para neg√≥cios, sempre devemos ter em mente: facilidade de uso, layout amig√°vel e boa [‚Ä¶]

Com a constante atualiza√ß√£o da tecnologia e a facilidade no acesso a itens de consumo, √© necess√°rio que as marcas [‚Ä¶]

Os usu√°rios de aplicativos m√≥veis est√£o aumentando a cada dia. Estima-se que haja cerca de 2 bilh√µes de usu√°rios de [‚Ä¶]

Quando se trata de neg√≥cios e relacionamento com o cliente, a seguran√ßa do aplicativo √© crucial. Se voc√™ estiver procurando [‚Ä¶]

Frequency Penalty 1:  As solu√ß√µes ainda dependem em grande parte do uso de an√°lises e dados dispon√≠veis para aprimora

## Presence Penalty

Reduz a chance de repetir qualquer token que apareceu no texto. Isso aumenta a probabilidade de introduzir novos t√≥picos em uma resposta. Os valores variam de 0 at√© 2.

In [11]:
prompt = "O que √© preciso para desenvolver um chatbot e como eu posso fazer isso?"

low_pres_penal_response = openai.Completion.create(
    engine=DEPLOYMENT_NAME,
    prompt=prompt,
    presence_penalty=0,
    max_tokens=200
)

normal_pres_penal_response = openai.Completion.create(
    engine=DEPLOYMENT_NAME,
    prompt=prompt,
    presence_penalty=1,
    max_tokens=200
)

high_pres_penal_response = openai.Completion.create(
    engine=DEPLOYMENT_NAME,
    prompt=prompt,
    presence_penalty=2,
    max_tokens=200
)

print(f"Presence Penalty 0: {low_pres_penal_response['choices'][0]['text']}\n")
print(f"Presence Penalty 1: {normal_pres_penal_response['choices'][0]['text']}\n")
print(f"Presence Penalty 2: {high_pres_penal_response['choices'][0]['text']}\n")

Presence Penalty 0:  Como ele possuir√° a capacidade de dialogar com o usu√°rio, qual tipo de intelig√™ncia artificial eu posso utilizar?

A partir do seu conhecimento no desenvolvimento de software, voc√™ pode facilmente construir um ChatBot chamado TesteBot, usando Node.JS e um servi√ßo do Watson da IBM com a tecnologia de processamento de linguagem natural chamada de Conversation.

Seguindo os princ√≠pios do JavaScript e da arquitetura REST, Node.JS √© uma plataforma para desenvolvimento de aplica√ß√µes web escal√°veis e de alta performance, que roda na m√°quina onde est√° o servidor, geralmente, com o conjunto de servi√ßos de banco de dados.

A proposta da IBM com o Conversational ajuda a entender mensagens dos usu√°rios e permitir que o chatbot reflita sobre padr√µes de fala, tendo a habilidade de entender e gerir um di√°logo, gerar questionamentos para a√ß√£o futura

Presence Penalty 1:  Preciso ter conhecimentos em programa√ß√£o?‚Äù.

A Bolha de Sab√£o Comunica√ß√£o Inteligente 

## Pre e Pos-response text

O pre-response text √© inserido depois da entrada do usu√°rio e antes da resposta do modelo. Isso pode preparar o modelo para uma resposta. Por sua vez, o pos-response text √© inserido depois da resposta gerada pelo modelo, levando o usu√°rio a oferecer uma entrada em seguinda, da forma que se faz em uma conversa√ß√£o.