# Tutorial 03: Par√¢metros Avan√ßados da API

**Objetivos de Aprendizagem:**
- Dominar todos os par√¢metros da API de Chat Completions
- Entender quando e como usar cada par√¢metro
- Otimizar respostas para diferentes casos de uso
- Controlar custos e qualidade das respostas

**Pr√©-requisitos:**
- Tutorial 01: Conversa B√°sica conclu√≠do
- Compreens√£o b√°sica de requisi√ß√µes √† API

## Introdu√ß√£o

A API de Chat Completions oferece diversos par√¢metros que permitem controlar o comportamento, qualidade e custo das respostas. Dominar esses par√¢metros √© essencial para criar aplica√ß√µes eficientes e de alta qualidade.

### Par√¢metros que Vamos Explorar

1. **temperature** - Controla criatividade e aleatoriedade
2. **max_tokens** - Limita tamanho da resposta
3. **top_p** - Nucleus sampling (diversidade)
4. **frequency_penalty** - Reduz repeti√ß√£o de palavras
5. **presence_penalty** - Incentiva novos t√≥picos
6. **n** - N√∫mero de respostas geradas
7. **stop** - Sequ√™ncias que param a gera√ß√£o

## Importante: Combinando Par√¢metros

Os par√¢metros podem ser combinados para obter resultados espec√≠ficos. Por exemplo:
- `temperature=0.7` + `top_p=0.9` = Respostas criativas e diversas
- `temperature=0.2` + `frequency_penalty=0.5` = Respostas precisas sem repeti√ß√£o
- `max_tokens=200` + `presence_penalty=0.6` = Respostas curtas e variadas


In [1]:
# Configura√ß√£o inicial
import os
from dotenv import load_dotenv
from openai import OpenAI

load_dotenv()
client = OpenAI(api_key=os.getenv('OPENAI_API_KEY'))

print("Cliente OpenAI configurado!")


Cliente OpenAI configurado!


## Par√¢metro 1: temperature

Controla a aleatoriedade e criatividade das respostas.

**Valores:**
- **0.0**: Determin√≠stico, sempre a mesma resposta (√∫til para tarefas que precisam de consist√™ncia)
- **0.2-0.5**: Baixa criatividade, respostas mais diretas e precisas
- **0.7**: Equil√≠brio entre criatividade e precis√£o (padr√£o recomendado)
- **1.0-1.5**: Alta criatividade, respostas variadas e elaboradas
- **2.0**: M√°xima criatividade (pode gerar respostas muito diferentes)

**Quando usar:**
- **Baixa (0.0-0.3)**: An√°lise de dados, extra√ß√£o de informa√ß√µes, tarefas t√©cnicas
- **M√©dia (0.7)**: Conversas gerais, assistentes, maioria dos casos
- **Alta (1.0+)**: Gera√ß√£o criativa, brainstorming, escrita criativa


In [2]:
# Exemplo com temperature baixa (respostas mais determin√≠sticas)
response = client.chat.completions.create(
    model='gpt-3.5-turbo',
    messages=[
        {
            'role': 'user',
            'content': 'Explique o que √© Python em uma frase.'
        }
    ],
    temperature=0.2  # Baixa criatividade, resposta mais direta
)

print("=== Temperature 0.2 (Baixa) ===")
print(response.choices[0].message.content)
print()

# Exemplo com temperature alta (respostas mais criativas)
response = client.chat.completions.create(
    model='gpt-3.5-turbo',
    messages=[
        {
            'role': 'user',
            'content': 'Explique o que √© Python de forma criativa.'
        }
    ],
    temperature=1.5  # Alta criatividade, resposta mais elaborada
)

print("=== Temperature 1.5 (Alta) ===")
print(response.choices[0].message.content)


=== Temperature 0.2 (Baixa) ===
Python √© uma linguagem de programa√ß√£o de alto n√≠vel, interpretada e de f√°cil aprendizado.

=== Temperature 1.5 (Alta) ===
Python √© como uma serpente charmosa que mora no mundo da programa√ß√£o. Esta serpente pitoresca desliza suavemente entre as linhas de c√≥digo, envolvendo funcionamentos misteriosos e processos l√≥gicos. Com seu veneno certeiro, Python √© capaz de resolver os problemas mais complexos de forma eficiente e elegante. Al√©m disso, √© uma serpente acolhedora, sempre pronta para receber novos programadores em seu territ√≥rio, incentivando-os a explorar suas vastas habilidades e possibilidades. Em resumo, Python √© uma peculiar serpente programadora que encanta e conquista a todos que se aventuram por seus caminhos. üêçüíª


## Par√¢metro 2: max_tokens

Limita o n√∫mero m√°ximo de tokens na resposta. √ötil para controlar custos e tamanho da resposta.

**Considera√ß√µes:**
- Tokens s√£o unidades de texto (aproximadamente 4 caracteres = 1 token)
- Respostas s√£o cortadas se excederem o limite
- N√£o inclui tokens do prompt, apenas da resposta
- Padr√£o: determinado pelo modelo (geralmente muito alto)

**Quando usar:**
- **50-100 tokens**: Respostas muito curtas, t√≠tulos, tags
- **200-500 tokens**: Respostas m√©dias, par√°grafos
- **1000+ tokens**: Respostas longas, artigos, an√°lises detalhadas

**Dica:** Use `max_tokens` para controlar custos em produ√ß√£o!


In [3]:
# Resposta curta (50 tokens)
response = client.chat.completions.create(
    model='gpt-3.5-turbo',
    messages=[
        {
            'role': 'user',
            'content': 'Explique o que √© Machine Learning.'
        }
    ],
    max_tokens=50  # Limita a resposta a 50 tokens
)

print("=== Max Tokens 50 (Resposta Curta) ===")
print(response.choices[0].message.content)
print(f"Tokens usados: {response.usage.completion_tokens}")
print()

# Resposta longa (500 tokens)
response = client.chat.completions.create(
    model='gpt-3.5-turbo',
    messages=[
        {
            'role': 'user',
            'content': 'Explique o que √© Machine Learning.'
        }
    ],
    max_tokens=500  # Permite resposta mais longa
)

print("=== Max Tokens 500 (Resposta Longa) ===")
print(response.choices[0].message.content)
print(f"Tokens usados: {response.usage.completion_tokens}")


=== Max Tokens 50 (Resposta Curta) ===
Machine Learning √© uma subcategoria da intelig√™ncia artificial que envolve o desenvolvimento de algoritmos e modelos que permitem que os sistemas computacionais analisem dados, identifiquem padr√µes e fa√ßam previs√µes sem ser
Tokens usados: 50

=== Max Tokens 500 (Resposta Longa) ===
Machine Learning √© uma t√©cnica de intelig√™ncia artificial que permite aos computadores aprenderem e melhorarem suas habilidades sem serem explicitamente programados. Em vez disso, os computadores s√£o capazes de reconhecer padr√µes e tomar decis√µes com base nos dados dispon√≠veis. Isso √© feito atrav√©s de algoritmos que analisam grandes conjuntos de dados e identificam rela√ß√µes e tend√™ncias para fazer previs√µes ou tomar decis√µes. O Machine Learning √© amplamente utilizado em diversas √°reas, como reconhecimento de fala, vis√£o computacional, recomenda√ß√£o de produtos, detec√ß√£o de fraudes, entre outros. √â uma tecnologia poderosa que vem sendo cada vez 

## Par√¢metro 3: top_p (Nucleus Sampling)

Controla a diversidade considerando apenas tokens com probabilidade acumulada.

**Como funciona:**
- O modelo considera apenas os tokens mais prov√°veis at√© atingir a probabilidade acumulada especificada
- `top_p=0.1` = Considera apenas top 10% mais prov√°veis (muito focado)
- `top_p=0.9` = Considera top 90% mais prov√°veis (mais diverso)
- `top_p=1.0` = Considera todos os tokens

**Quando usar:**
- **Baixo (0.1-0.3)**: Respostas focadas, precisas
- **M√©dio (0.5-0.7)**: Equil√≠brio entre foco e diversidade
- **Alto (0.9-1.0)**: Respostas mais diversas, criativas

**Nota:** `top_p` e `temperature` podem ser usados juntos, mas geralmente voc√™ escolhe um ou outro.


In [4]:
# Exemplo com top_p para diversidade
response = client.chat.completions.create(
    model='gpt-3.5-turbo',
    messages=[
        {
            'role': 'user',
            'content': 'D√™ 3 ideias de nomes para uma startup de tecnologia.'
        }
    ],
    top_p=0.9  # Mais diversidade nas respostas
)

print("=== Top P 0.9 (Diverso) ===")
print(response.choices[0].message.content)


=== Top P 0.9 (Diverso) ===
1. TecnoVanguarda
2. InovaTech Solutions
3. FuturisTech Group


## Par√¢metro 4: frequency_penalty

Penaliza tokens que aparecem com frequ√™ncia no texto, reduzindo repeti√ß√£o.

**Valores:**
- **Negativos (-2.0 a 0.0)**: Incentiva repeti√ß√£o (raramente usado)
- **0.0**: Sem penalidade (padr√£o)
- **Positivos (0.1 a 2.0)**: Reduz repeti√ß√£o de palavras

**Quando usar:**
- **0.0**: Quando repeti√ß√£o n√£o √© problema
- **0.3-0.7**: Para evitar repeti√ß√£o moderada
- **1.0+**: Para evitar repeti√ß√£o excessiva (pode afetar qualidade)

**Caso de uso:** Gera√ß√£o de listas, par√°grafos longos, conte√∫do onde repeti√ß√£o √© indesejada.


In [5]:
# Exemplo com frequency_penalty para reduzir repeti√ß√£o
response = client.chat.completions.create(
    model='gpt-3.5-turbo',
    messages=[
        {
            'role': 'user',
            'content': 'Escreva um par√°grafo sobre Python sem repetir palavras.'
        }
    ],
    frequency_penalty=0.5  # Reduz repeti√ß√£o de palavras
)

print("=== Frequency Penalty 0.5 (Reduz Repeti√ß√£o) ===")
print(response.choices[0].message.content)


=== Frequency Penalty 0.5 (Reduz Repeti√ß√£o) ===
Python √© uma linguagem de programa√ß√£o vers√°til e poderosa, que ganhou popularidade devido √† sua simplicidade e praticidade. Com uma grande comunidade de desenvolvedores ativos, oferece uma ampla gama de bibliotecas e frameworks para facilitar o desenvolvimento de projetos diversos. Sua sintaxe limpa e leg√≠vel torna a codifica√ß√£o mais intuitiva e eficiente, permitindo a cria√ß√£o de aplica√ß√µes robustas e escal√°veis. Al√©m disso, a portabilidade do Python o torna uma excelente escolha para a constru√ß√£o de aplicativos multiplataforma.


## Par√¢metro 5: presence_penalty

Penaliza tokens baseado em se j√° apareceram no texto. Incentiva o modelo a falar sobre novos t√≥picos.

**Valores:**
- **Negativos (-2.0 a 0.0)**: Incentiva focar em t√≥picos j√° mencionados
- **0.0**: Sem penalidade (padr√£o)
- **Positivos (0.1 a 2.0)**: Incentiva diversidade de t√≥picos

**Quando usar:**
- **0.0**: Quando continuidade de t√≥pico √© desejada
- **0.3-0.7**: Para brainstorming, listas diversas
- **1.0+**: Para m√°xima diversidade de t√≥picos

**Caso de uso:** Brainstorming, gera√ß√£o de ideias, listas com itens diversos.


In [6]:
# Exemplo com presence_penalty para diversidade de t√≥picos
response = client.chat.completions.create(
    model='gpt-3.5-turbo',
    messages=[
        {
            'role': 'user',
            'content': 'D√™ 5 dicas diferentes sobre programa√ß√£o Python.'
        }
    ],
    presence_penalty=0.6  # Incentiva diversidade de t√≥picos
)

print("=== Presence Penalty 0.6 (Diversidade de T√≥picos) ===")
print(response.choices[0].message.content)


=== Presence Penalty 0.6 (Diversidade de T√≥picos) ===
1. Pratique: A pr√°tica √© essencial para melhorar suas habilidades de programa√ß√£o em Python. Dedique tempo diariamente para resolver problemas e criar projetos utilizando a linguagem.

2. Utilize recursos online: Existem diversos tutoriais, cursos e documenta√ß√µes dispon√≠veis na internet que podem te ajudar a aprender mais sobre Python. Utilize esses recursos para se aprofundar na linguagem.

3. Participe da comunidade: Participe de f√≥runs de discuss√£o, grupos no LinkedIn, Reddit e outras redes sociais voltadas para desenvolvedores Python. Compartilhe experi√™ncias, tire d√∫vidas e aprenda com outros programadores.

4. Escreva c√≥digo limpo: Mantenha seu c√≥digo organizado e leg√≠vel. Utilize boas pr√°ticas de programa√ß√£o, como nomes de vari√°veis claros, coment√°rios explicativos e indenta√ß√£o consistente.

5. Explore bibliotecas e frameworks: Python possui uma vasta cole√ß√£o de bibliotecas e frameworks que podem facili

## Par√¢metro 6: n (N√∫mero de Respostas)

Gera m√∫ltiplas respostas para a mesma pergunta. √ötil para comparar diferentes abordagens.

**Valores:**
- **1**: Uma resposta (padr√£o, mais econ√¥mico)
- **2-10**: M√∫ltiplas respostas (aumenta custo proporcionalmente)

**Quando usar:**
- **1**: Maioria dos casos (mais eficiente)
- **2-3**: Quando voc√™ quer op√ß√µes para escolher
- **5+**: Para an√°lise comparativa, A/B testing

**Nota:** Cada resposta adicional custa o mesmo que uma requisi√ß√£o separada!


In [7]:
# Exemplo gerando m√∫ltiplas respostas
response = client.chat.completions.create(
    model='gpt-3.5-turbo',
    messages=[
        {
            'role': 'user',
            'content': 'D√™ uma dica sobre Python.'
        }
    ],
    n=3  # Gera 3 respostas diferentes
)

print("=== N=3 (M√∫ltiplas Respostas) ===")
for i, choice in enumerate(response.choices, 1):
    print(f"\nResposta {i}:")
    print(choice.message.content)


=== N=3 (M√∫ltiplas Respostas) ===

Resposta 1:
Uma dica importante sobre Python √© sempre se atentar aos detalhes de indenta√ß√£o, pois o Python utiliza a indenta√ß√£o para determinar blocos de c√≥digo. Certifique-se de manter a consist√™ncia na indenta√ß√£o do seu c√≥digo para evitar erros de sintaxe.

Resposta 2:
Python √© uma linguagem de programa√ß√£o de alto n√≠vel, f√°cil de aprender e com uma sintaxe limpa e leg√≠vel. √â uma √≥tima escolha para iniciantes na programa√ß√£o, mas tamb√©m √© amplamente utilizada em desenvolvimento web, an√°lise de dados, intelig√™ncia artificial, entre outros. Vale a pena explorar a vasta biblioteca de fun√ß√µes e m√≥dulos dispon√≠veis na linguagem.

Resposta 3:
Python √© uma linguagem de programa√ß√£o de alto n√≠vel, conhecida por sua simplicidade e legibilidade. Uma dica importante √© sempre utilizar a indenta√ß√£o corretamente, pois ela √© fundamental para a estrutura do seu c√≥digo em Python. A indenta√ß√£o correta ajuda na organiza√ß√£o e legi

## Par√¢metro 7: stop

Sequ√™ncias de texto que param a gera√ß√£o quando encontradas.

**Formato:**
- String √∫nica: `stop="FIM"`
- Lista de strings: `stop=["FIM", "FINAL"]`

**Quando usar:**
- Para limitar respostas a um formato espec√≠fico
- Para parar em marcadores espec√≠ficos
- Para controlar estrutura de sa√≠da

**Exemplo:** Se voc√™ quer que a resposta termine em "---", use `stop="---"`


In [8]:
# Exemplo com stop para parar em marcador espec√≠fico
response = client.chat.completions.create(
    model='gpt-3.5-turbo',
    messages=[
        {
            'role': 'user',
            'content': 'Liste 5 linguagens de programa√ß√£o. Use "---" como separador entre cada uma.'
        }
    ],
    stop="---",  # Para quando encontrar "---"
    max_tokens=200
)

print("=== Com Stop Sequence ===")
print(response.choices[0].message.content)


=== Com Stop Sequence ===
Python 


## Combinando Par√¢metros: Casos de Uso Pr√°ticos

### Caso 1: Resposta T√©cnica Precisa
```python
temperature=0.2,
max_tokens=300,
frequency_penalty=0.3
```
**Uso:** Documenta√ß√£o t√©cnica, explica√ß√µes precisas

### Caso 2: Gera√ß√£o Criativa
```python
temperature=1.2,
top_p=0.9,
presence_penalty=0.6
```
**Uso:** Brainstorming, escrita criativa, ideias

### Caso 3: Resposta Curta e Eficiente
```python
max_tokens=100,
temperature=0.7,
stop=["\n\n"]
```
**Uso:** Resumos, t√≠tulos, respostas r√°pidas

### Caso 4: An√°lise Detalhada
```python
temperature=0.5,
max_tokens=1000,
frequency_penalty=0.4
```
**Uso:** An√°lises longas, relat√≥rios, artigos


## Resumo dos Par√¢metros

| Par√¢metro | Tipo | Padr√£o | Range | Quando Usar |
|-----------|------|--------|------|-------------|
| `temperature` | float | 1.0 | 0.0-2.0 | Controlar criatividade |
| `max_tokens` | int | Modelo | 1+ | Controlar custos/tamanho |
| `top_p` | float | 1.0 | 0.0-1.0 | Controlar diversidade |
| `frequency_penalty` | float | 0.0 | -2.0-2.0 | Reduzir repeti√ß√£o |
| `presence_penalty` | float | 0.0 | -2.0-2.0 | Incentivar novos t√≥picos |
| `n` | int | 1 | 1-10 | Gerar m√∫ltiplas respostas |
| `stop` | str/list | None | - | Parar em sequ√™ncias espec√≠ficas |


## Exerc√≠cios Pr√°ticos

### Exerc√≠cio 1: Otimizar para Tarefa Espec√≠fica
Crie uma requisi√ß√£o otimizada para gerar t√≠tulos de artigos (curtos, criativos, sem repeti√ß√£o).

### Exerc√≠cio 2: Comparar Configura√ß√µes
Teste a mesma pergunta com diferentes combina√ß√µes de par√¢metros e compare os resultados.

### Exerc√≠cio 3: Controlar Custos
Use `max_tokens` para limitar respostas a 150 tokens e compare o custo antes e depois.

## Refer√™ncias

- [Documenta√ß√£o - Par√¢metros da API](https://platform.openai.com/docs/api-reference/chat/create)
- [Guia de Prompt Engineering](https://platform.openai.com/docs/guides/prompt-engineering)
