<a href="https://colab.research.google.com/github/diegohugo570/backup-python/blob/main/08_Curso_Python_M%C3%B3dulo_8_Forma%C3%A7%C3%A3o_Engenheiro_de_IA.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **M√≥dulo 8: LangChain & Agentes (Engenharia Cognitiva)**

Link do curso: [clique aqui](https://dascia.academy/)

> **Objetivo:** Transformar o Python de uma linguagem de script em uma linguagem de **orquestra√ß√£o de racioc√≠nio**. Voc√™ aprender√° a criar sistemas que n√£o apenas "falam", mas que **planejam**, **agem** no mundo real (APIs, Banco de Dados) e **lembram** do passado.

---

## **Aula 1: O Ecossistema LangChain (Arquitetura)**

<div align="center">
  <img src="https://raw.githubusercontent.com/langchain-ai/langchain/e1d113ea84a2edcf4a7709fc5be0e972ea74a5d9/docs/static/svg/langchain_stack_062024.svg">
</div>

Antes de codar, precisamos entender onde estamos pisando. O ecossistema da LangChain cresceu e se dividiu em tr√™s pilares fundamentais.

1. **LangChain (O Orquestrador):** A biblioteca Python que conecta os modelos (OpenAI, Anthropic) ao seu c√≥digo. √â aqui que constru√≠mos as "Chains" (cadeias de pensamento).
2. **LangGraph (O Controle):** Para criar agentes complexos que precisam de loops, condicionais (if/else) e persist√™ncia de estado. √â a evolu√ß√£o das "Chains" lineares.
3. **LangSmith (A Observabilidade):** Uma plataforma para debugar o que sua IA est√° pensando. Como o LLM √© uma "caixa preta", o LangSmith permite ver os logs de cada etapa do racioc√≠nio.

Neste curso, focaremos no **LangChain** para constru√ß√£o de ferramentas e agentes r√°pidos.

### **A Arquitetura Modular do LangChain**

<div align="center">
  <img src="https://python.langchain.ac.cn/assets/images/ecosystem_packages-32943b32657e7a187770c9b585f22a64.png">
</div>

Antes de instalar, √© crucial entender que o LangChain moderno n√£o √© mais um "monolito". Ele foi refatorado em uma arquitetura de camadas para ser mais seguro e leve em produ√ß√£o.

Ao inv√©s de instalar uma coisa gigante, montamos nosso ambiente como pe√ßas de Lego:

* **`langchain-core`**: A funda√ß√£o. Define as interfaces padr√£o (o que √© uma "Mensagem", o que √© um "Prompt"). √â a √∫nica depend√™ncia obrigat√≥ria para tudo funcionar.
* **Integra√ß√µes (`langchain-openai`, `langchain-anthropic`)**: Os provedores de IA agora vivem em pacotes isolados. Isso significa que podemos atualizar a vers√£o da OpenAI sem quebrar o resto do sistema.
* **`langchain`**: O orquestrador. Cont√©m a l√≥gica das "Chains", estrat√©gias de busca (Retrieval) e a "cola" que une os componentes.
* **`langchain-community`**: Onde vivem as integra√ß√µes mantidas pela comunidade (ferramentas de terceiros, vetores de bancos espec√≠ficos, etc.).

√â por isso que, no comando abaixo, n√£o instalamos apenas `langchain`, mas tamb√©m o conector espec√≠fico `langchain-openai`.

In [None]:
# Instalando o langchain-openai


In [None]:
# Configurando as vari√°veis de ambiente (userdata e os)

# Configura√ß√£o de Chaves (Use os Segredos do Colab ou input manual com getpass)


## **Aula 2: Chat Models**

Um "Chat Model" moderno n√£o funciona apenas recebendo texto e cuspindo texto. Na verdade, n√£o APENAS assim...

Ele pode operar tamb√©m sobre uma **Lista de Mensagens** que representa o estado atual de uma conversa.

### **2.1 String vs. Lista de Mensagens (O Polimorfismo)**

O m√©todo `.invoke()` do LangChain √© polim√≥rfico.

1. **Entrada Simples (String):** Se voc√™ fizer `modelo.invoke("Oi")`, o LangChain converte isso automaticamente, "por baixo do cap√¥", para `[HumanMessage(content="Oi")]`. √â √≥timo para testes r√°pidos.
2. **Entrada de um Chat (Lista de Mensagens):** Para enviar mensagens simulando uma conversa√ß√£o entre um humano e a IA, a utiliza√ß√£o de listas de mensagens √© a mais adequada.

In [None]:
# Importando o ChatOpenAI e enviando uma mensagem


# Instanciando o modelo (gpt-4o-mini e temperatura zero)


# Enviando a primeira mensagem (string)


### **2.2 A Anatomia das Mensagens**

O LangChain padroniza a comunica√ß√£o com qualquer modelo (seja OpenAI, Llama ou Anthropic) usando tr√™s classes principais:

#### **`SystemMessage` (Instru√ß√£o Principal):**
- √â a instru√ß√£o que orienta o comportamento do modelo.
- *Ex:* "Voc√™ √© um especialista em SQL que responde apenas com c√≥digo, sem explica√ß√µes."
- Diferente do `HumanMessage`, o modelo trata isso como uma configura√ß√£o persistente, n√£o como parte do di√°logo.

In [None]:
# Importando a classe SystemMessae


# Vari√°veis do aplicativo
# - Nome do usu√°rio
# - Principal Dificuldade
# - Idade
# - Experi√™ncia em IA (Pouca, M√©dia, Muita)


# Definindo a instru√ß√£o principal


# Criando o System Message


#### **`HumanMessage` (O Input):**
* Representa a fala do usu√°rio.
* Em modelos multimodais (como GPT-4o), o `content` dessa mensagem pode conter n√£o s√≥ texto, mas tamb√©m imagens em Base64 ou URLs.

In [None]:
# Importando a classe HumanMessage


# Definindo a mensagem incial


# Criando o Human Message


#### **`AIMessage` (O Output):**
* √â o que o modelo retorna.
* N√£o cont√©m apenas o texto (`.content`), mas tamb√©m metadados cruciais (`.response_metadata`) como: contagem de tokens gastos, motivo da parada (finish_reason) e **Logprobs** (que veremos mais a frente)

In [None]:
# Enviando o System e Human Messages para obter o AI Message


# Inspecionando o AI Message


In [None]:
# Fazendo append na lista de mensagens e adicionando um novo Human Messae


# Enviando nova lista de mensagens


# Inspecionando a resposta


### üß† **Exerc√≠cios de Fixa√ß√£o (Aula 2)**

**Exerc√≠cio 2.1: Few-Shot Learning (Ensinando por Exemplos)**

Muitas vezes, apenas dar instru√ß√µes no System Prompt n√£o √© suficiente; precisamos dar exemplos pr√°ticos para o modelo entender o padr√£o desejado. Isso se chama "Few-Shot Prompting".

1. Crie uma lista de mensagens que ensine o modelo a converter **g√≠rias** em **linguagem corporativa ultra-formal**.
2. **SystemMessage:** "Voc√™ √© um assistente corporativo que converte linguagem informal em formal."
3. **Exemplo 1 (Human):** "E a√≠ mano, beleza?" -> **(AI):** "Ol√°, prezado colega. Como tem passado?"
4. **Exemplo 2 (Human):** "T√¥ fora dessa reuni√£o." -> **(AI):** "Infelizmente, declino o convite para o alinhamento."
5. **Teste (Human):** "Bora fechar isso logo, t√° demorando muito."
6. Invoque o modelo passando essa lista hist√≥rica e veja se ele segue o padr√£o no final.

In [None]:
# Escreva seu c√≥digo aqui


**Exerc√≠cio 2.2: Contexto Manual (A Mem√≥ria da IA)**

Modelos de chat s√£o "stateless" (sem mem√≥ria). Se voc√™ perguntar "Quem √© o Batman?" e depois perguntar "E quem √© o parceiro dele?", ele n√£o saber√° de quem voc√™ est√° falando na segunda vez, a menos que voc√™ envie o hist√≥rico completo.

1. Defina um `SystemMessage`.
2. Crie uma `HumanMessage` perguntando: "Quem escreveu Dom Casmurro?".
3. Invoque o modelo e guarde a resposta (o objeto `AIMessage`) numa vari√°vel `resposta_1`.
4. Agora, crie uma **nova lista** contendo:
* O System Message original.
* A pergunta original ("Quem escreveu...").
* A `resposta_1` que voc√™ guardou.
* Uma nova `HumanMessage`: "Em que ano foi publicado?".


5. Invoque o modelo com E sem essa lista completa. Se ele responder o ano correto (1899), significa que ele manteve o contexto.


In [None]:
# Escreva seu c√≥digo aqui


## **Aula 3: Logprobs e Perplexidade**

Um *Chat Model* moderno n√£o gera texto ‚Äúno escuro‚Äù. A cada token produzido, o modelo calcula uma **distribui√ß√£o de probabilidades** sobre o vocabul√°rio, da qual emergem m√©tricas fundamentais como a **perplexidade**.

O foco dessa aula n√£o √© "prompt bonito", mas **leitura matem√°tica do comportamento do modelo**.

### **3.1 Perplexidade e Logprobs (defini√ß√£o t√©cnica)**

Considere uma sequ√™ncia de tokens $(t_1, \dots, t_N)$ e um modelo que atribui probabilidades condicionais
$$
p_i = P(t_i \mid t_{<i})
$$

A **perplexidade** (PPL) √© definida como a exponencial da *cross-entropy* m√©dia por token:

$$
\mathrm{PPL} = \exp\left(-\frac{1}{N}\sum_{i=1}^{N}\log p_i\right)
$$

Se voc√™ tem **logprobs** diretamente (isto √©, $(\ell_i = \log p_i)$), ent√£o:

$$
\mathrm{PPL} = \exp\left(-\frac{1}{N}\sum_{i=1}^{N}\ell_i\right)
$$

Interpreta√ß√£o: PPL √© o "n√∫mero efetivo de escolhas equiprov√°veis" por token.  

Ex.: PPL = 10 sugere que, em m√©dia, o modelo estava t√£o incerto quanto escolher entre 10 tokens equiprov√°veis a cada passo.

In [None]:
# Importando numpy


# Exemplo: logprobs de tokens (log natural)


# C√°lculo da perplexidade


### **3.2 Duas implementa√ß√µes equivalentes (probs vs logprobs)**

A defini√ß√£o original da perplexidade usa **probabilidades** porque ela √©, essencialmente, uma **m√©dia geom√©trica do inverso das probabilidades** atribu√≠das pelo modelo aos tokens observados.  

O uso do **inverso** √© fundamental porque a perplexidade n√£o mede confian√ßa, mas **incerteza**: probabilidades altas indicam tokens f√°ceis de prever e devem contribuir pouco para a m√©trica, enquanto probabilidades baixas indicam surpresa e devem aumentar significativamente o valor final. Ao inverter \(p_i\), tokens improv√°veis passam a gerar valores grandes, penalizando o modelo de forma proporcional √† dificuldade da predi√ß√£o.

A m√©dia geom√©trica √© a escolha natural quando lidamos com **quantidades multiplicativas** (probabilidades condicionais ao longo de uma sequ√™ncia), pois preserva a escala relativa e penaliza fortemente eventos improv√°veis.

Formalmente, para uma sequ√™ncia de probabilidades $(p_1, \dots, p_N)$, a perplexidade √© definida como:

1) **Via probabilidades (m√©dia geom√©trica)**

$$
\mathrm{PPL}
=
\left(\prod_{i=1}^{N}\frac{1}{p_i}\right)^{\frac{1}{N}}
$$

Essa express√£o pode ser lida como:
> ‚ÄúEm m√©dia, o modelo se comporta como se estivesse escolhendo entre  
$(\mathrm{PPL})$ alternativas equiprov√°veis a cada token.‚Äù

---

2) **Via logprobs (forma computacionalmente est√°vel)**

Para obter uma forma numericamente est√°vel, aplicamos o logaritmo e exploramos suas propriedades:

$$
\log(\mathrm{PPL})
=
\log\!\left(\left(\prod_{i=1}^{N}\frac{1}{p_i}\right)^{\frac{1}{N}}\right)
$$

$$
=
\frac{1}{N}\log\!\left(\prod_{i=1}^{N}\frac{1}{p_i}\right)
=
\frac{1}{N}\sum_{i=1}^{N}\log\!\left(\frac{1}{p_i}\right)
$$

$$
=
-\frac{1}{N}\sum_{i=1}^{N}\log(p_i)
$$

Aplicando a fun√ß√£o exponencial em ambos os lados, obtemos a forma final:

$$
\mathrm{PPL}
=
\exp\!\left(-\frac{1}{N}\sum_{i=1}^{N}\log(p_i)\right)
$$

Essa reformula√ß√£o mant√©m o mesmo significado estat√≠stico da m√©dia geom√©trica,  
mas √© **muito mais est√°vel numericamente**, raz√£o pela qual √© a forma usada na pr√°tica em modelos de linguagem.

In [None]:
# Vamos criar um caso "realista" com np.full() de sequ√™ncia longa com probabilidades pequenas e seus logs


In [None]:
# Forma inst√°vel (vai dar inf por overflow em 1/prob, ou underflow dependendo do caminho)


# Analisando resultado


In [None]:
# Forma est√°vel


# Analisando resultado


### **3.3 Prova: limite inferior da perplexidade √© 1**

Como $(0 < p_i \le 1)$, ent√£o $(\log(p_i) \le 0)$ (a base √© 2.71828...)

Logo:

$$
-\frac{1}{N}\sum_{i=1}^{N}\log(p_i) \ge 0
$$

Aplicando exponencial:

$$
\mathrm{PPL} = \exp\left(-\frac{1}{N}\sum_{i=1}^{N}\log(p_i)\right) \ge \exp(0)=1
$$

**Quando d√° exatamente 1?**

Somente se $(\log(p_i)=0)$ para todo $(i)$, isto √©, $(p_i=1)$ para todo token.
Ou seja: **o modelo tem certeza absoluta do pr√≥ximo token em cada passo (caso degenerado)**.

Implica√ß√£o pr√°tica:

- $(\mathrm{PPL} \approx 1)$ significa previsibilidade extrema (geralmente texto trivial/repetitivo ou "teacher forcing" perfeito).
- Valores maiores indicam mais incerteza/surpresa m√©dia por token.


In [None]:
# Criando uma fun√ß√£o que recebe um array de logprobs e retorna a perplexidade


# Caso m√≠nimo: p_i = 1 => log p_i = 0 => PPL = 1


### **3.4. Detalhes t√©cnicos que importam**

#### **3.4.1 Base do log**

- Se voc√™ usa $log$ natural: PPL = $\exp(\cdot)$
- Se usa $\log_2$: PPL = $2^{(\cdot)}$. O valor muda de escala, mas a ordena√ß√£o/compara√ß√£o permanece consistente se voc√™ for coerente.


#### **3.4.2 Perplexidade vs ‚Äúconfian√ßa‚Äù**

Logprob alto (pr√≥ximo de 0) por token tende a reduzir PPL, mas:
- PPL √© uma **m√©dia geom√©trica** do inverso das probs.
- Um √∫nico token muito improv√°vel pode puxar PPL pra cima com for√ßa (isso √© caracter√≠stica, n√£o bug).

#### **3.4.3 Compara√ß√£o s√≥ faz sentido com mesma tokeniza√ß√£o e mesma distribui√ß√£o**

Trocar tokenizer muda N e muda os $p_i$. Comparar PPL entre modelos/tokenizers diferentes pode ser bem enganoso.

#### **3.4.4. PPL n√£o "prova alucina√ß√£o", mas √© um √≥timo sinal**

PPL alta sugere que a sequ√™ncia est√° fora do "caminho comum" do modelo (pode ser erro, pode ser criatividade, pode ser dom√≠nio raro etc.).

In [None]:
# Demonstra√ß√£o do "um token ruim estraga a festa"


### **3.4. Calculando a perplexidade real**
Agora que j√° vimos toda a teoria matem√°tica por tr√°s dos logprobs e da perplexidade, vamos calcular a perplexidade real de uma resposta da IA.

In [None]:
# Instanciando o modelo (com logprobs = True)


# Enviando mensagem pedindo um poema


In [None]:
# Pegando a lista de logprobs


# Calculando a perplexidade


### **üß† Exerc√≠cios de Fixa√ß√£o (Aula 3)**

**Exerc√≠cio 3.1: Fato vs. Criatividade (O Teste de Incerteza)**

A perplexidade mede o qu√£o "surpreso" o modelo fica com a pr√≥pria resposta. Respostas factuais tendem a ter perplexidade baixa (o modelo tem certeza). Respostas criativas ou alucina√ß√µes tendem a ter perplexidade alta.

1. Crie dois prompts:
* `prompt_fato`: "Qual √© a capital da Fran√ßa?"
* `prompt_criativo`: "Invente uma nova cor que n√£o existe e descreva o cheiro dela."


2. Invoque o modelo duas vezes: a primeira vez com `temperature=0` e a segunda com `temperature=0.8` para ambos.
3. Calcule a perplexidade de cada resposta.
4. Imprima os quatro valores e compare. Qual √© maior?

In [None]:
# Escreva seu c√≥digo aqui


**Exerc√≠cio 3.5.2: O """Detector de Alucina√ß√£o""" (Threshold)**

Em sistemas cr√≠ticos (como um bot m√©dico ou jur√≠dico), n√£o podemos aceitar respostas duvidosas.

1. Crie uma fun√ß√£o `verificar_confianca(resposta, limite=1.2) -> str`.
2. Ela deve calcular a perplexidade.
3. Se a perplexidade for **menor** que o limite, retorne "‚úÖ Confian√ßa Alta (Seguro)".
4. Se for **maior**, retorne "‚ö†Ô∏è Confian√ßa Baixa (Risco de Alucina√ß√£o)".
5. Teste a fun√ß√£o com uma pergunta sem sentido (ex: "Qual o CPF do Pato Donald?").

In [None]:
# Escreva seu c√≥digo aqui


## **Aula 4: Structured Output (A Ponte Texto-Software)**

Softwares n√£o consomem frases, consomem **JSON**.
O m√©todo `.with_structured_output` usa o **Pydantic** para for√ßar o LLM a preencher um formul√°rio r√≠gido. Se o modelo errar o tipo (ex: colocar texto onde deveria ser data), o Pydantic valida e o LangChain pode at√© pedir para ele corrigir automaticamente.

In [None]:
# Importando classes do Pydantic e Typing


# Definindo schema do Pydantic para extrair de um e-mail:
# - Nome do remetente
# - Data de envio
# - Categoria (comercial, suporte, pessoal, spam)
# - Resumo (de at√© 10 palavras)



In [None]:
# Instanciando o modelo


# Associando a classe ao modelo


In [None]:
# E-mail exemplo


In [None]:
# Analisando o resultado


### **üß† Exerc√≠cios de Fixa√ß√£o (Aula 4)**

**Exerc√≠cio 1: Triagem Autom√°tica de Suporte (Ticket Routing)**

Em empresas grandes, ler cada ticket de suporte para saber para quem mandar √© caro. Sua tarefa √© criar um sistema que l√™ a reclama√ß√£o e retorna um objeto pronto para ser salvo no banco de dados do Jira/Zendesk.

1. Crie uma classe Pydantic `TicketSuporte` com os campos:
* `cot`: Deve ser uma string representando a cadeia de pensamento da IA para realizar a tarefa
* `setor`: Deve ser um `Literal` com as op√ß√µes: "Financeiro", "Suporte T√©cnico", "Vendas".
* `prioridade`: Um inteiro de 1 (Baixa) a 5 (Cr√≠tica).
* `tags`: Uma lista de strings com palavras-chave do problema (ex: ["login", "senha", "erro 404"]).
* `requer_humano`: Booleano. Se o cliente estiver muito irritado, True. Caso contr√°rio, False.


2. Passe a reclama√ß√£o: *"Cara, estou tentando pagar minha fatura h√° 3 dias e o site d√° erro 500! Vou processar voc√™s se cortarem meu servi√ßo!"*
3. Imprima o objeto resultante e verifique se ele detectou corretamente o setor "Financeiro" e a prioridade alta.

In [None]:
# Escreva seu c√≥digo aqui


**Exerc√≠cio 2: O Extrator de Notas Fiscais (OCR Inteligente)**

Voc√™ est√° construindo um app de gest√£o financeira. O usu√°rio tira foto da nota (que vira texto via OCR), mas o texto vem sujo. Voc√™ precisa estruturar isso.

1. Crie uma classe `ItemCompra` com `produto` (str) e `valor` (float).
2. Crie uma classe principal `NotaFiscal` com:
* `nome_loja`: str
* `data`: str (formato YYYY-MM-DD)
* `itens`: uma `list[ItemCompra]` (aqui est√° o desafio: extrair uma lista de objetos!)
* `valor_total`: float


3. Passe o texto bagun√ßado:
*"Compra no Mercado do Jo√£o, dia 12 de mar√ßo de 2024. Levei 2 leites por 10 reais cada (total 20) e um p√£o por 5.90. Deu 25.90 tudo."*
4. Veja se o modelo consegue quebrar os itens individualmente dentro da lista.

In [None]:
# Escreva seu c√≥digo aqui


---

## **Aula 5: Tool Calling (Dando Bra√ßos √† IA)**

LLMs vivem numa caixa fechada. Eles n√£o sabem a temperatura atual nem acessar a internet. **Tools** s√£o a ponte.

O fluxo de Tool Calling √©:

1. **LLM decide:** "Preciso chamar a fun√ß√£o `temperatura` com o argumento `cidade='sp'`".
2. **Pausa:** O LLM para de gerar texto e te devolve um objeto `tool_call`.
3. **Python Executa:** Voc√™ roda a fun√ß√£o real.
4. **Retorno:** Voc√™ devolve o resultado para o LLM.
5. **Resposta Final:** O LLM l√™ o resultado e formula a frase final para o usu√°rio.

In [None]:
# Importando o decorator tool


# Criando a Ferramenta (consultar_temperatura)


In [None]:
# Instanciando o modelo


# Associando ao modelo a ferramenta


In [None]:
# Perguntando a temperatura atual de uma cidade


# Analisando a resposta


In [None]:
# Ele pediu pra chamar alguma ferramenta? Qual? Quais os argumentos?


In [None]:
# Adicionando a inten√ß√£o ao hist√≥rico


**`ToolMessage` (O Retorno da Fun√ß√£o):**
* Representa o *resultado* pr√°tico vindo do "mundo real" (do seu c√≥digo Python) ap√≥s o modelo solicitar uma a√ß√£o.
* *Ex:* "22¬∞C" (o retorno de `get_temperatura`) ou "Erro: Usu√°rio n√£o encontrado".
* **Ponto Chave:** Ele deve conter obrigatoriamente o `tool_call_id`. √â assim que o modelo sabe conectar essa resposta espec√≠fica ("22¬∞C") √† pergunta espec√≠fica que ele fez anteriormente.

In [None]:
# Criando fluxo de execu√ß√£o das tools


In [None]:
# Obtendo a resposta final


### **üß† Exerc√≠cios de Fixa√ß√£o (Aula 5)**

**Exerc√≠cio 4.1: O Agendador de Salas (Gest√£o de Recursos)**

Voc√™ est√° criando o bot interno de uma empresa. Os funcion√°rios vivem perguntando no Slack se as salas de reuni√£o est√£o livres. O sistema sabe quem est√° perguntando (pelo user do Slack), mas n√£o sabe **qual sala** e **qual hor√°rio** eles querem. A IA precisa extrair isso do texto.

1. Crie uma ferramenta `@tool` chamada `verificar_disponibilidade_sala`.
2. Ela deve receber dois argumentos obrigat√≥rios:
* `nome_sala` (str): Pode ser "Azul", "Vermelha" ou "Executiva".
* `horario` (str): O hor√°rio desejado (ex: "14:00", "15:00").


3. Dentro da fun√ß√£o, use este dicion√°rio para simular a agenda do dia:
```python
AGENDA_HOJE = {
    "azul": ["09:00", "10:00", "14:00"], # Hor√°rios OCUPADOS
    "vermelha": ["11:00", "15:00"],
    "executiva": [] # Livre o dia todo
}

```


4. A l√≥gica √©:
* Se a sala n√£o existir, informe ao agente que a sala n√£o existe
* Se o hor√°rio estiver na lista, informe ao agente que aquele hor√°rio est√° ocupado
* Se n√£o estiver, informe ao agente que aquele hor√°rio est√° dispon√≠vel


5. Pergunte: *"A sala Azul est√° livre √†s 2 da tarde?"*.
6. Teste tamb√©m: *"A executiva t√° tranquila √†s 10:00?"*.
7. Veja se o modelo extrai corretamente os par√¢metros ("azul"/"14:00" e "executiva"/"10:00") e responde de acordo.

In [None]:
# Escreva seu c√≥digo aqui


**Exerc√≠cio 5.2: O Corretor de Seguros (C√°lculo Determin√≠stico)**

LLMs s√£o p√©ssimos em matem√°tica financeira. Uma seguradora quer um bot que d√™ cota√ß√µes r√°pidas de seguro auto, mas o c√°lculo precisa ser exato (Python), e n√£o uma estimativa do GPT.

1. Crie uma ferramenta `@tool` chamada `calcular_seguro_auto`.
2. Ela deve receber: `idade` (int), `valor_carro` (float) e `tem_sinistro` (bool).
3. A l√≥gica de neg√≥cio (Python) √©:
* Pre√ßo base √© 3% do valor do carro.
* Se `idade < 25`, adiciona 20% de risco sobre o pre√ßo base.
* Se `tem_sinistro` for True, adiciona 50% de risco sobre o pre√ßo base.


4. Fa√ßa o bind e pergunte: *"Tenho 22 anos, um carro de 100 mil reais e nunca bati. Quanto fica o seguro?"*.
5. Verifique se o modelo extraiu os argumentos certos (idade=22, valor=100000, sinistro=False) e se ele usou o valor exato retornado pela fun√ß√£o na resposta final.

In [None]:
# Escreva seu c√≥digo aqui


---

## **Aula 6: Agentes (Automatizando o Racioc√≠nio)**

Fazer o loop acima (if tool_calls...) manualmente √© cansativo.
O **Agente** (`create_agent`) √© uma abstra√ß√£o que faz esse loop (ReAct - Reason, Act) automaticamente at√© chegar na resposta ou atingir um limite de passos.

In [None]:
# Instanciando a fun√ß√£o create_agent, do m√≥dulo agents do Langchain


# Instanciando o modelo


# Usando as mesmas ferramentas anteriores e criando o agente


In [None]:
# Executando um prompt


### **üß† Exerc√≠cios de Fixa√ß√£o (Aula 6)**

**Exerc√≠cio 6.1: O Assistente de Viagens (Agrega√ß√£o de Informa√ß√£o)**

Muitas vezes, uma resposta simples para o usu√°rio exige consultar v√°rias fontes diferentes. O usu√°rio pergunta "Quanto custa ir para Paris?", e o Agente precisa consultar o a√©reo E a hospedagem separadamente para somar.

1. Crie duas ferramentas:
* `cotar_passagem(destino: str)`: Retorna o pre√ßo do voo. Use um mock: `{"paris": 4500, "ny": 3000}`.
* `cotar_hotel(destino: str)`: Retorna o pre√ßo da di√°ria. Use um mock: `{"paris": 1200, "ny": 1500}`.


2. Crie um Agente (`create_tool_calling_agent`) com essas duas tools.
3. Pergunte: *"Quanto fica uma viagem para Paris considerando a passagem e 3 di√°rias de hotel?"*.
4. **O Desafio:** O Agente deve ser capaz de:
1. Chamar `cotar_passagem("paris")`.
2. Chamar `cotar_hotel("paris")`.
3. Fazer a conta (4500 + 3*1200) sozinho ou usando uma calculadora interna.
4. Responder o valor final.

In [None]:
# Escreva seu c√≥digo aqui


**Exerc√≠cio 6.2: O Agente de Reembolso (L√≥gica Condicional)**

Este √© um cl√°ssico de Customer Experience (CX). O Agente precisa verificar uma regra de neg√≥cio (Data da Compra) antes de executar uma a√ß√£o (Gerar Reembolso). Ele n√£o pode gerar o reembolso se o prazo expirou.

1. Crie tr√™s ferramentas:
* `obter_data_compra(id_pedido: str)`: Retorna uma data simulada.
* Se ID for "PED-ANTIGO", retorne "2020-01-01".
* Se ID for "PED-NOVO", retorne a data de hoje (use `datetime.now()`).

* `calcular_dias(data: str)`: Retorna a diferen√ßa em n√∫mero de dias da data fornecida em rela√ß√£o a hoje.


* `gerar_reembolso(id_pedido: str)`: Retorna "Reembolso processado com sucesso!".


2. Crie um Agente e d√™ a ele o seguinte System Prompt:
*"Voc√™ √© um agente financeiro. Verifique a data da compra. Se a compra foi feita h√° mais de 7 dias, RECUSE o reembolso educadamente. Se for recente, processe o reembolso."*
3. Teste 1: *"Quero reembolso do pedido PED-ANTIGO"*. (O agente deve checar a data, calcular os dias e negar, **sem** chamar a ferramenta de gerar reembolso).
4. Teste 2: *"Quero reembolso do pedido PED-NOVO"*. (O agente deve checar a data, calcular os dias e, vendo que √© menor do que 7, chamar a ferramenta de reembolso).


In [None]:
# Escreva seu c√≥digo aqui


## **Aula 7: Streaming (A Arte da Resposta em Tempo Real)**

At√© agora, usamos `.invoke()`, que espera a resposta completa ficar pronta para entregar tudo de uma vez. Isso √© ruim para o usu√°rio, que fica encarando uma tela parada.

O **Streaming** entrega a resposta "token a token" (letra por letra), assim que √© gerada. Isso cria a sensa√ß√£o de velocidade imediata.

### **7.1 Streaming Simples (Chat Models)**

Para modelos de chat, basta trocar `.invoke()` por `.stream()`. O retorno n√£o √© mais uma mensagem, √© um **Iterador** (Generator) que cospe pedacinhos de texto (`chunks`).

In [None]:
# Importando a biblioteca time e o ChatOpenAI


# Instanciando o modelo


# Iniciando o processo de straming


# Em vez de esperar tudo, recebemos peda√ßos
# Chunk √© um peda√ßo da AIMessage (para cada chunk no stream, printamos o content (com end='' e flush = True))


### üß† **Exerc√≠cios de Fixa√ß√£o (Aula 7)**

**Exerc√≠cio 7.1: O Efeito M√°quina de Escrever**

Crie uma fun√ß√£o `stream_texto(texto: str)` que recebe um texto longo pronto.
Dentro dela, simule um streaming "falso": percorra o texto letra por letra, imprima com `end=""`, d√™ um `time.sleep(0.05)` e fa√ßa `flush`. Isso ajuda a entender a UX do streaming.

In [None]:
# Escreva seu c√≥digo aqui


**Exerc√≠cio 7.2: Streaming com Stop**

Use o `llm.stream("Conte at√© 100")`.
Crie um loop que imprime os tokens. Adicione uma l√≥gica: se o n√∫mero "10" aparecer no chunk, pare o streaming (`break`) imediatamente e imprima "üö´ Interrompido pelo filtro de seguran√ßa.".

In [None]:
# Escreva seu c√≥digo aqui


---

## **üöÄ Pr√≥ximo Passo: Projeto no Cursor**

Agora voc√™ tem o poder de criar "seres digitais".

**Vamos para a IDE Cursor construir o "The CLI Assistant".**

Neste projeto final, vamos elevar a barra. Al√©m da mem√≥ria e das ferramentas b√°sicas, voc√™ implementar√° uma ferramenta de **Integra√ß√£o de API Real**.

### **O Desafio Extra: Pok√©API**

Voc√™ deve criar uma tool que usa a biblioteca `requests` para consultar a API p√∫blica do Pok√©mon (`https://pokeapi.co/api/v2/pokemon/{nome}`).
Seu assistente dever√° ser capaz de responder:
*"Que horas s√£o e qual √© a altura do Pikachu?"*
Ele ter√° que chamar `get_current_time`, depois `get_pokemon_info`, e consolidar tudo.

**Estrutura do Projeto:**

* `cli_assistant.py`: A classe que gerencia o hist√≥rico e o Agente.
* `tools.py`: Onde voc√™ escrever√° a fun√ß√£o `get_pokemon_info` usando `requests`.
* `main.py`: O loop de intera√ß√£o com o usu√°rio.

V√° para o Cursor. √â hora de virar um Engenheiro de IA.