# ü§ñ Aula 1: O que √© um AI Agent?

Este notebook ir√° te guiar na explora√ß√£o pr√°tica de um AI Agent usando a API da OpenAI, com foco em conceitos t√©cnicos, matem√°ticos e exemplos de c√≥digo mais robustos.

## üìå O que faremos:
1. Entender o conceito de AI Agents e sua base matem√°tica.
2. Explorar o funcionamento de modelos de linguagem como GPT.
3. Fazer chamadas √† API do ChatGPT com ajustes de par√¢metros.
4. Implementar um exemplo pr√°tico de um AI Agent simples.
5. Completar desafios t√©cnicos!


## üß† Conceitos T√©cnicos e Matem√°ticos

### O que √© um AI Agent?
Um **AI Agent** √© um sistema aut√¥nomo que percebe seu ambiente, toma decis√µes e age para atingir objetivos espec√≠ficos. Ele √© baseado em modelos de aprendizado de m√°quina, como redes neurais, e pode ser formalizado como uma tupla:

$$ \text{AI Agent} = (S, A, P, R, \gamma) $$

- **S**: Conjunto de estados poss√≠veis.
- **A**: Conjunto de a√ß√µes poss√≠veis.
- **P**: Fun√ß√£o de transi√ß√£o de estados.
- **R**: Fun√ß√£o de recompensa.
- **$\gamma$**: Fator de desconto (import√¢ncia de recompensas futuras).

### Modelos de Linguagem como GPT
Os modelos GPT (Generative Pre-trained Transformer) s√£o baseados em arquiteturas de **transformers**, que usam mecanismos de aten√ß√£o para processar sequ√™ncias de texto. A probabilidade de uma sequ√™ncia de palavras √© dada por:

$$ P(w_1, w_2, \dots, w_n) = \prod_{i=1}^n P(w_i \mid w_1, w_2, \dots, w_{i-1}) $$

Onde:
- **$w_i$**: Palavra na posi√ß√£o $i$.
- **$P(w_i \mid w_1, w_2, \dots, w_{i-1})$**: Probabilidade da palavra $w_i$ dado o contexto anterior.

### Par√¢metros de um Modelo de Linguagem
- **Temperature**: Controla a aleatoriedade das respostas. Valores baixos (ex.: 0.2) geram respostas mais determin√≠sticas, enquanto valores altos (ex.: 0.9) geram respostas mais criativas.
- **Max Tokens**: Limita o tamanho da resposta gerada.
- **Top-p (Nucleus Sampling)**: Controla a diversidade das respostas, selecionando apenas as palavras mais prov√°veis.


In [None]:
# Instale a biblioteca se necess√°rio
!pip install openai

In [None]:
import openai

# Defina sua chave de API aqui (substitua 'SUA_CHAVE_AQUI' pela sua chave real)
openai.api_key = "SUA_CHAVE_AQUI"

In [None]:
def perguntar_ao_chatgpt(pergunta, temperatura=0.7, max_tokens=100, top_p=1.0):
    resposta = openai.ChatCompletion.create(
        model="gpt-4",  # ou "gpt-3.5-turbo" se preferir
        messages=[{"role": "user", "content": pergunta}],
        temperature=temperatura,
        max_tokens=max_tokens,
        top_p=top_p
    )
    return resposta["choices"][0]["message"]["content"]

# Teste r√°pido
pergunta = "O que √© um AI Agent? Explique de forma t√©cnica."
print(perguntar_ao_chatgpt(pergunta))

In [None]:
# Vamos testar diferentes temperaturas e top_p
pergunta = "Explique o conceito de um AI Agent em uma frase curta."

print("Resposta com temperatura 0.2 (determin√≠stica):")
print(perguntar_ao_chatgpt(pergunta, temperatura=0.2))

print("Resposta com temperatura 0.9 (criativa):")
print(perguntar_ao_chatgpt(pergunta, temperatura=0.9))

print("Resposta com top_p=0.5 (mais focada):")
print(perguntar_ao_chatgpt(pergunta, top_p=0.5))

## üõ†Ô∏è Implementando um AI Agent Simples

Vamos criar um AI Agent que responde perguntas e mant√©m um hist√≥rico de conversas.


In [None]:
class AIAgent:
    def __init__(self, nome):
        self.nome = nome
        self.historico = []

    def perguntar(self, pergunta):
        resposta = perguntar_ao_chatgpt(pergunta)
        self.historico.append((pergunta, resposta))
        return resposta

    def mostrar_historico(self):
        for i, (pergunta, resposta) in enumerate(self.historico):
            print(f"Intera√ß√£o {i+1}:")
            print(f"Pergunta: {pergunta}")
            print(f"Resposta: {resposta}")
            print("-" * 50)

# Testando o AI Agent
agent = AIAgent("AgentX")
print(agent.perguntar("O que √© um AI Agent?"))
print(agent.perguntar("Como um AI Agent aprende?"))
agent.mostrar_historico()

## üéØ Desafios T√©cnicos

1. **Desafio 1:** Modifique o AI Agent para incluir um sistema de recompensa simples. Por exemplo, d√™ uma pontua√ß√£o para cada resposta com base na relev√¢ncia.
2. **Desafio 2:** Implemente um mecanismo de **mem√≥ria de longo prazo** usando um banco de dados simples (ex.: SQLite) para armazenar conversas antigas.
3. **Desafio 3:** Crie um AI Agent que integre uma API externa (ex.: Wikipedia) para responder perguntas com base em pesquisas reais.

Compartilhe suas solu√ß√µes no f√≥rum do curso!