<a href="https://colab.research.google.com/github/pathbit/pathbit-academy-ai/blob/master/0001_llm_x_lrm%20/notebooks/comparacao_llm_lrm.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# ✨ **Pathbit Academy AI**
---

🚨 **IMPORTANTE:**

*💥 QUALQUER PESSOA QUE CONSIGA RESOLVER A EQUAÇÃO `2 + 2 = ?` PODE CONTINUAR OS PASSOS ABAIXO*

**Artigo de referência:** [https://github.com/pathbit/pathbit-academy-ai/blob/master/0001_llm_x_lrm/article/ARTICLE.md](https://github.com/pathbit/pathbit-academy-ai/blob/master/0001_llm_x_lrm/article/ARTICLE.md)

### ֎ **Comparação LLM vs LRM**
---

#### ⁉️ O que é LLM de forma prática?

**Foco:** geração de linguagem natural.
Treinamento: enormes volumes de texto para aprender padrões linguísticos.

**Ponto forte:** velocidade e flexibilidade para responder qualquer tipo de pergunta textual.

**Ponto fraco:** raciocínio profundo e consistência em decisões complexas.


#### ⁉️ O que é LRM de forma prática?

**Foco:** raciocínio estruturado e resolução de problemas.
Treinamento: combina dados textuais com técnicas que forçam o modelo a explicar e validar seu raciocínio (cadeia de pensamento, decomposição de problemas, verificação de hipóteses).

**Ponto forte:** consistência em tomadas de decisão complexas.

**Ponto fraco:** pode ser mais lento e caro que um LLM para tarefas simples.

#### ⛳ Criação de conta no Groq
---

##### ▶ Acessar o site abaixo para criar sua conta

**[Groq.com](https://console.groq.com/)**

##### ▶ Criar uma `API KEY` para a sua conta

![Criação API KEY](https://raw.githubusercontent.com/pathbit/pathbit-academy-ai/refs/heads/master/0001_llm_x_lrm/assets/01.png)

##### ▶ Copiar e salvar a Api Key em um lugar seguro

> **Observações**: *Você pode acessar Api Keys criados através deste link: [https://console.groq.com/keys](https://console.groq.com/keys)*

![Copiar API KEY](https://raw.githubusercontent.com/pathbit/pathbit-academy-ai/refs/heads/master/0001_llm_x_lrm/assets/02.png)

##### ▶ Adicionar a Api Key criada nas `secrets` do seu Notebook

![Adicionar API KEY no Secrets](https://raw.githubusercontent.com/pathbit/pathbit-academy-ai/refs/heads/master/0001_llm_x_lrm/assets/03.png)


![Adicionar API KEY no Secrets](https://raw.githubusercontent.com/pathbit/pathbit-academy-ai/refs/heads/master/0001_llm_x_lrm/assets/04.png)

#### ⚙️ Configuração do ambiente
---

##### ▶ Instalar os pacotes que iremos utilizar neste projeto

In [None]:
# Instalar a biblioteca do groq
!pip -q install groq

##### ▶ Criar e recuperar a variável de ambiente para utilizar no Groq

In [None]:
# Criar e recuperar a variável de ambiente do Groq
# ------------------------------------------------------------------------------

# Importar os módulos
import os
from google.colab import userdata

# Constante com o nome da secrete adicionada no Notebook
GROQ_API_KEY_NAME = "GROQ_API_KEY"

try:
  # Apagar variável de ambiente criada anteriormente
  os.environ.pop(GROQ_API_KEY_NAME, None)

  # Recupera a secrete adicionada no Notebook
  groq_api_key = userdata.get(GROQ_API_KEY_NAME)

  # Cria a variável de ambiente para o Groq
  os.environ[GROQ_API_KEY_NAME] = groq_api_key

  # Verifica se a variável de ambiente não existe
  if GROQ_API_KEY_NAME not in os.environ:
    raise ValueError(f"Variável de ambiente {GROQ_API_KEY_NAME} não definida")

  # Imprime o valor da variável de ambiente criada para o Groq
  print(f"✅ {GROQ_API_KEY_NAME}: {os.environ['GROQ_API_KEY'][:6]}******")
except Exception as e:
  # Imprime o erro ao tentar recuperar e atualizar a variável de ambiente
  print(f"❌ Erro ao atualizar a variável de ambiente {GROQ_API_KEY_NAME}: {e}")

##### ▶ Validar se o Groq está funcionando corretamente

⚠️ Este modelo `compound-beta` é da própria `Groq`, tem um resultado excelente até estes momentos dos meus testes.

In [20]:
# Validar se o Groq está funcionando corretamente
# ------------------------------------------------------------------------------

# Importar os módulos
import os
from groq import Groq
from IPython.display import Markdown, display

# Configurar a API Key da Groq
# (recomendo guardar em segredos do Colab)
groq_api_key = os.environ[GROQ_API_KEY_NAME]
client = Groq(api_key=groq_api_key)

# Definir o modelo de LLM que iremos utilizar
# Modelos: https://console.groq.com/docs/models
LLM_MODEL = "compound-beta"

# Criar a prompt do sistema
prompt_sistema = """
REGRAS:

++++

Você é um especialista da área de inteligência artificial e está instruindo
crianças e adolescentes no período escolar fundamental.

  1. Utilize respostas fáceis para o seu público.

  2. Utilize exemplos práticos do dia-a-dia desse público.

  3. A resposta deve ser formatada no padrão Markdown, seus títulos devem começar
  com 3 "#", utilizar emojis e ter as quebras adequadas para separar bem cada
  parte do texto, facilitando a leitura.

  4. Você pode utiliar um pouco de linguagem técnica até para que a pessoa tenha
  interesse em continuar pesquisando sobre o tema e seus subtemas.

++++

""".strip()

# Pergunta do usuário
pergunta_usuario = "Qual a diferença entre LLMs e LRMs?"

# Criar o prompt final concatenado (para exibir ou logar)
prompt_final = f"{prompt_sistema}\n\nUSUÁRIO:\n\n{pergunta_usuario}"

# Montar mensagens no formato da Groq e chamar o modelo
messages = [
    {"role": "system", "content": prompt_sistema},
    {"role": "user", "content": pergunta_usuario},
]

resp = client.chat.completions.create(
    model=LLM_MODEL,
    messages=messages,
    temperature=0.3,
    max_completion_tokens=1024,
)

resposta_modelo = resp.choices[0].message.content

# Visualizando o resultado formatado em Markdown
display(Markdown(f"""
## > Prompt do sistema
{prompt_sistema}

## > Pergunta do usuário
{pergunta_usuario}

## > Prompt final enviado ao LLM
{prompt_final}

## > Resposta do LLM
{resposta_modelo}
"""))


## > Prompt do sistema
REGRAS:

++++

Você é um especialista da área de inteligência artificial e está instruindo
crianças e adolescentes no período escolar fundamental.

  1. Utilize respostas fáceis para o seu público.

  2. Utilize exemplos práticos do dia-a-dia desse público.

  3. A resposta deve ser formatada no padrão Markdown, seus títulos devem começar
  com 3 "#", utilizar emojis e ter as quebras adequadas para separar bem cada
  parte do texto, facilitando a leitura.

  4. Você pode utiliar um pouco de linguagem técnica até para que a pessoa tenha
  interesse em continuar pesquisando sobre o tema e seus subtemas.

++++

## > Pergunta do usuário
Qual a diferença entre LLMs e LRMs?

## > Prompt final enviado ao LLM
REGRAS:

++++

Você é um especialista da área de inteligência artificial e está instruindo
crianças e adolescentes no período escolar fundamental.

  1. Utilize respostas fáceis para o seu público.

  2. Utilize exemplos práticos do dia-a-dia desse público.

  3. A resposta deve ser formatada no padrão Markdown, seus títulos devem começar
  com 3 "#", utilizar emojis e ter as quebras adequadas para separar bem cada
  parte do texto, facilitando a leitura.

  4. Você pode utiliar um pouco de linguagem técnica até para que a pessoa tenha
  interesse em continuar pesquisando sobre o tema e seus subtemas.

++++

USUÁRIO:

Qual a diferença entre LLMs e LRMs?

## > Resposta do LLM
# Diferença entre LLMs e LRMs 🤔
A diferença entre LLMs (Large Language Models) e LRMs (Large Reasoning Models) é fundamental para entender como a inteligência artificial processa e entende informações.

## O que são LLMs e LRMs? 🤔
LLMs são **Modelos de Linguagem Grandes**, projetados para processar e entender linguagem natural. Já os LRMs são **Modelos de Raciocínio Grandes**, projetados para processar e realizar raciocínios complexos.

## Características de LLMs 🤖
* **Exemplo:** Assistente virtual como Siri, Google Assistant ou Alexa.
* **Função:** Entender e responder perguntas, realizar tarefas simples, etc.
* **Treinamento:** Grande quantidade de dados de texto.

## Características de LRMs 🤖
* **Exemplo:** Sistemas de recomendação, diagnóstico médico ou planejamento de rotas.
* **Função:** Realizar raciocínios complexos, tomar decisões, etc.
* **Treinamento:** Grande quantidade de dados e regras lógicas.

## Principais diferenças 🤝
A principal diferença entre LLMs e LRMs é o **objetivo** e o **treinamento**. LLMs se concentram em processar e entender linguagem natural, enquanto LRMs se concentram em realizar raciocínios complexos e tomar decisões. Além disso, o treinamento de LLMs é baseado em grandes quantidades de dados de texto, enquanto o treinamento de LRMs é baseado em grandes quantidades de dados e regras lógicas.

## Exemplos práticos 📚
Para ilustrar a diferença, considere os seguintes exemplos:
* Um LLM pode ser usado para criar um chatbot que responde perguntas frequentes de clientes.
* Um LRM pode ser usado para criar um sistema de recomendação de produtos que sugere itens baseados nas preferências do cliente.

## Conclusão 🎉
Em resumo, a diferença entre LLMs e LRMs é que LLMs se concentram em processar e entender linguagem natural, enquanto LRMs se concentram em realizar raciocínios complexos e tomar decisões. Ambos são importantes para o desenvolvimento de sistemas inteligentes e podem ser usados em conjunto para criar soluções mais avançadas. 🚀

A resposta para a pergunta "Qual a diferença entre LLMs e LRMs?" é:
**A diferença entre LLMs e LRMs é o objetivo e o treinamento, onde LLMs se concentram em processar e entender linguagem natural e LRMs se concentram em realizar raciocínios complexos e tomar decisões.** 🤔


### </> Criando as funções para utilizar modelos de LLM e LRM
---

**ℹ️️ Observações:**

*Tentei fazer a melhor documentação possível para explicar o código.*

**⚠️ Importante:**

*Para garantir os melhores resultados, o código utiliza dois modelos de linguagem diferentes, cada um com uma finalidade específica:*

- **`Llama3-70B-8192:`** Um modelo mais genérico, com um foco em compreensão de linguagem natural e tarefas de conversação. Ele é ideal para interpretar o contexto do texto e gerar respostas fluentes e coerentes, garantindo que a comunicação seja clara e natural. O `llama3-70b-8192` está focado gerar texto de forma fluída e natural, como uma conversa, mas não em resolver problemas lógicos ou matemáticos complexos passo a passo como o outro modelo.

- **`DeepSeek R1 Distill Llama 70B:`** Este modelo é especializado em tarefas que exigem um raciocínio complexo, como lógica, matemática e programação. Sua arquitetura é otimizada para resolver problemas estruturados de forma eficiente. O `deepseek-r1-distill-llama-70b` é um exemplo, focado em "pensar" passo a passo antes de chegar a uma resposta.

> **FUNÇÕES BÁSICAS**


**1. Função para recuperar o cliente do Groq**


In [21]:
# Definições das funções auxiliares
# ------------------------------------------------------------------------------

# Importar os módulos
import os
import time
from groq import Groq
from typing import Tuple, Optional
from IPython.display import Markdown, display


def criar_cliente_groq() -> Groq:
    """
    Cria o cliente da Groq usando a variável de ambiente GROQ_API_KEY.

    Por que usar env var?
    - Segurança: evita hardcode de chaves no notebook.
    - Reprodutibilidade: o mesmo código funciona em diferentes ambientes.
    """
    groq_api_key = os.environ[GROQ_API_KEY_NAME]
    if not groq_api_key:
        raise RuntimeError(
            "GROQ_API_KEY não definida. No Colab, use: os.environ['GROQ_API_KEY']='sua_chave'"
        )
    return Groq(api_key=groq_api_key)


def exibir_resposta(
    modelo: str,
    pergunta: str,
    resposta: str,
    raciocinio: str = None,
    tempo: float = 0.0
  ):
    """
    Exibe saída formatada em Markdown no Jupyter/Colab.
    - modelo     : nome do modelo utilizado (LLM ou LRM)
    - pergunta   : texto enviado
    - resposta   : resposta final ao usuário
    - raciocinio : cadeia de raciocínio (opcional)
    - tempo      : tempo total da execução
    """
    texto_raciocinio = ""

    if raciocinio:
        texto_raciocinio += f"\n\n"
        texto_raciocinio += f"## 🧐 Raciocínio                                \n"
        texto_raciocinio += f"================================================\n\n"
        texto_raciocinio += f"{raciocinio.strip()}"

    texto_md = f"""
## 🧠 Modelo: `{modelo}`
**⏱ Tempo de execução:** {tempo:.2f}s

{texto_raciocinio}

### 📥 Pergunta

{pergunta.strip()}

### 📤 Resposta

{resposta.strip()}
    """

    display(Markdown(texto_md))

> **LLM: FUNÇÕES E TESTES**



**2. LLM: Função para responder usando modelo llama3 do Groq**

In [22]:
# Definição da função para responder a pergunta usando LLM
# ------------------------------------------------------------------------------

# Importar os módulos
import os
import time
from typing import Tuple, Optional
from groq import Groq

# ==============================
# Função: perguntar_llm
# Objetivo: enviar pergunta a um modelo de LINGUAGEM (LLM)
# Retorna: (texto_resposta, tempo_em_segundos)
# ==============================
def perguntar_llm(
    pergunta: str,
    modelo: str = "llama3-70b-8192",       # Modelo padrão para linguagem natural
    temperatura: float = 0.2,              # Controla a aleatoriedade da resposta
    max_tokens_resposta: int = 1024,       # Limita tamanho da resposta (custo/latência)
    sistema: Optional[str] = None          # Regras ou persona opcionais
) -> Tuple[str, float]:
    """
    Envia uma pergunta para um modelo LLM.

    Parâmetros:
    - pergunta           : texto enviado ao modelo.
    - modelo             : modelo LLM para tarefas gerais (resumo, reescrita, Q&A).
    - temperatura        : controla a "criatividade" (0.1–0.3 = mais determinístico).
    - max_tokens_resposta: limita tamanho da saída, evitando custo ou lentidão.
    - sistema            : mensagem opcional para regras ou persona.

    Retorna:
    - texto: resposta final do modelo.
    - tempo: tempo total da chamada em segundos.
    """
    # cria o cliente autenticado
    cliente = criar_cliente_groq()

    # monta mensagens no formato da API (sistema opcional + usuário obrigatório)
    mensagens = []
    if sistema:
        mensagens.append({"role": "system", "content": sistema})

    mensagens.append({"role": "user", "content": pergunta})

    # marca início para medir tempo de execução
    inicio = time.perf_counter()

    # chamada à API da Groq
    resposta = cliente.chat.completions.create(
        model=modelo,
        messages=mensagens,
        temperature=temperatura,
        max_completion_tokens=max_tokens_resposta,
    )

    # calcula tempo total
    tempo_execucao = time.perf_counter() - inicio

    # extrai conteúdo textual da resposta
    texto_resposta = resposta.choices[0].message.content.strip()

    return modelo, texto_resposta, tempo_execucao

**3. LLM: Testando a função para responder com LLM**

In [23]:
# Teste da função para responder a pergunta usando LLM
# ------------------------------------------------------------------------------

# Importar os módulos
import os
import time
from typing import Tuple, Optional
from groq import Groq

# LLM: resumo e reescrita de tom (usando perguntar_llm)
texto = """
O Banco Central manteve a taxa Selic inalterada. Analistas projetam estabilidade
nos próximos meses, com atenção à inflação de serviços e ao mercado de trabalho.
"""

# Pedimos um RESUMO curto (linguagem neutra) — tarefa típica de LLM
prompt_resumo = f"Resuma em 2 frases, com linguagem neutra e direta: {texto}"
modelo_resumo, resposta_resumo, tempo_resumo = perguntar_llm(
    pergunta=prompt_resumo,
    sistema="Responda em Markdown de forma clara e concisa."
)

exibir_resposta(
    modelo=modelo_resumo,
    pergunta=prompt_resumo,
    resposta=resposta_resumo,
    tempo=tempo_resumo
)

# Agora pedimos para REESCREVER o próprio resumo com outro tom.
#   - IMPORTANTE: incluímos explicitamente o 'resumo' no prompt (o modelo não “lembra” sozinho).
prompt_tom = (
    "Reescreva o resumo abaixo com tom mais informal e amigável, mantendo precisão.\n\n"
    f"RESUMO ORIGINAL:\n{resposta_resumo}"
)
modelo_tom, resposta_tom, tempo_tom = perguntar_llm(
    pergunta=prompt_tom,
    sistema="Responda em Markdown e use linguagem acessível; evite jargões."
)

exibir_resposta(
    modelo=modelo_tom,
    pergunta=prompt_tom,
    resposta=resposta_tom,
    tempo=tempo_tom
)


## 🧠 Modelo: `llama3-70b-8192`
**⏱ Tempo de execução:** 0.34s



### 📥 Pergunta

Resuma em 2 frases, com linguagem neutra e direta: 
O Banco Central manteve a taxa Selic inalterada. Analistas projetam estabilidade
nos próximos meses, com atenção à inflação de serviços e ao mercado de trabalho.

### 📤 Resposta

O Banco Central manteve a taxa Selic inalterada, indicando estabilidade nos próximos meses. Analistas seguem atentos à inflação de serviços e ao mercado de trabalho para avaliar possíveis mudanças futuras.
    


## 🧠 Modelo: `llama3-70b-8192`
**⏱ Tempo de execução:** 0.41s



### 📥 Pergunta

Reescreva o resumo abaixo com tom mais informal e amigável, mantendo precisão.

RESUMO ORIGINAL:
O Banco Central manteve a taxa Selic inalterada, indicando estabilidade nos próximos meses. Analistas seguem atentos à inflação de serviços e ao mercado de trabalho para avaliar possíveis mudanças futuras.

### 📤 Resposta

**Boas Notícias!**
O Banco Central decidiu manter a taxa Selic igual, o que significa que as coisas devem ficar estáveis nos próximos meses. Agora, os especialistas estão de olho na inflação de serviços e no mercado de trabalho para ver se há alguma mudança no horizonte.
    

> **LRM: FUNÇÕES E TESTES**

**4. LRM: Função para responder usando modelo deepseek do Groq**

In [24]:
# Definição da função para responder a pergunta usando LRM
# ------------------------------------------------------------------------------

# Importar os módulos
import os
import time
from typing import Tuple, Optional
from groq import Groq

# ==============================
# Função: perguntar_lrm
# Objetivo: enviar pergunta a um modelo de RACIOCÍNIO (LRM)
# Retorna: (texto_ao_usuario, cadeia_de_raciocinio, tempo_em_segundos)
# ==============================
def perguntar_lrm(
    pergunta: str,
    modelo: str = "deepseek-r1-distill-llama-70b",   # Modelo otimizado para raciocínio
    temperatura: float = 0.2,                        # Baixa variação para consistência
    formato_raciocinio: Optional[str] = "parsed",    # 'parsed', 'raw', 'hidden' ou None
    incluir_raciocinio: bool = True,                 # Só usado se formato_raciocinio=None
    max_tokens_resposta: int = 2000,                 # Limite da resposta final
    max_tokens_raciocinio: Optional[int] = None,     # Limite da cadeia de raciocínio
    sistema: Optional[str] = None                    # Mensagem de sistema opcional
) -> Tuple[str, Optional[str], float]:
    """
    Envia uma pergunta a um modelo de raciocínio (LRM) da Groq.

    Comportamento:
    - Se `formato_raciocinio` ∈ {'parsed','raw','hidden'} → usa `reasoning_format` e
      **NÃO** envia `include_reasoning` (evita erro 400).
      • 'parsed'  → cadeia vem separada em `message.reasoning`
      • 'raw'     → cadeia vem crua, com marcações
      • 'hidden'  → o modelo raciocina, mas não retorna a cadeia
    - Se `formato_raciocinio` for None → não envia `reasoning_format` e usa `include_reasoning`.

    Retorno:
      (conteudo_final, cadeia_de_raciocinio|None, tempo_execucao_s)
    """
    # Cliente autenticado
    chave = os.getenv("GROQ_API_KEY")
    if not chave:
        raise RuntimeError("Defina GROQ_API_KEY no ambiente.")
    cliente = Groq(api_key=chave)

    # Mensagens no formato Chat
    mensagens = []
    if sistema:
        mensagens.append({"role": "system", "content": sistema})
    mensagens.append({"role": "user", "content": pergunta})

    # Monta kwargs dinâmicos conforme as regras da API
    kwargs = {
        "model": modelo,
        "messages": mensagens,
        "temperature": temperatura,
        "max_completion_tokens": max_tokens_resposta,
    }

    # Se limite de tokens do raciocínio foi definido, adiciona
    if max_tokens_raciocinio is not None:
        kwargs["max_reasoning_tokens"] = max_tokens_raciocinio

    # Regra de exclusão mútua:
    # - Se formato_raciocinio estiver definido, usa reasoning_format e IGNORA include_reasoning
    # - Se formato_raciocinio for None, usa include_reasoning (sem reasoning_format)
    if formato_raciocinio is not None:
        kwargs["reasoning_format"] = formato_raciocinio
        # NÃO adicionar include_reasoning para evitar o erro 400
    else:
        kwargs["include_reasoning"] = bool(incluir_raciocinio)

    # Chamada e cronômetro
    inicio = time.perf_counter()
    resp = cliente.chat.completions.create(**kwargs)
    tempo = time.perf_counter() - inicio

    # Extração da resposta e (se houver) do raciocínio
    msg = resp.choices[0].message
    conteudo = (msg.content or "").strip()

    # A cadeia só vem quando:
    # - usamos reasoning_format ('parsed'/'raw'), E
    # - não é 'hidden'
    if formato_raciocinio in ("parsed", "raw"):
        raciocinio = getattr(msg, "reasoning", None)
    else:
        # Quando formato=None e include_reasoning=True, algumas combinações
        # podem retornar o raciocínio embutido; a API nem sempre expõe em `reasoning`.
        raciocinio = getattr(msg, "reasoning", None)

    return modelo, conteudo, raciocinio, tempo

**5. LRM: Testando a função para responder com LRM**

-

**ℹ️️ IMPORTANTE:**

> *Para ver como o modelo chegou à resposta final, procure a seção **🧐 Raciocínio.** Essa é uma demonstração do poder dos modelos especializados em lógica e raciocínio.*


In [30]:
# Testando a função para responder a pergunta usando LRM
# ------------------------------------------------------------------------------

# Importar os módulos
import os
import time
import json
from typing import Tuple, Optional
from groq import Groq

cenario = {
    "perfil": "conservador",
    "inflacao_projetada_aa": 4.0,
    "cdi_aa": 13.25,
    "vencimentos_anos": [2026, 2027],
    "objetivo": "renda previsível com baixa volatilidade",
}
cenario_fmt = json.dumps(cenario, ensure_ascii=False)

prompt_lrm = f"""
Você é um analista de investimentos.

Dado o cenário:
- {cenario_fmt}

Decida entre:
- título atrelado ao CDI;
- prefixado curto;
- IPCA+ longo.

Importante:

1. Resposta e raciocínio sempre em portugês do brasil.
2. Estruture o raciocínio em etapas (riscos, liquidez, duration, sensibilidade à inflação).
3. Apresente a recomendação final e uma política de rebalanceamento simples.
4. Use números aproximados e justificativas claras.
"""

modelo, resposta, cadeia, tempo = perguntar_lrm(
    pergunta=prompt_lrm,
    sistema="Responda em Markdown, com listas numeradas nas etapas."
)

exibir_resposta(
    modelo=modelo,
    pergunta=prompt_lrm,
    resposta=resposta,
    raciocinio=cadeia,
    tempo=tempo
)


## 🧠 Modelo: `deepseek-r1-distill-llama-70b`
**⏱ Tempo de execução:** 4.86s



## 🧐 Raciocínio                                
================================================

Ok, vou começar analisando o perfil do investidor. Ele é conservador, então prioriza segurança e baixa volatilidade. Seu objetivo é ter renda previsível, o que sugere que ele busca retornos regulares e confiáveis.

Agora, vou considerar os riscos de cada opção. O título atrelado ao CDI oferece retorno fixo mais uma parcela atrelada ao CDI, o que pode ser atraente em um cenário de taxas mais altas. No entanto, ele está sujeito a riscos de crédito e mercado, embora esses sejam menores em títulos de maior rating.

O prefixado curto paga um valor fixo no vencimento, o que é bom para quem quer certeza. O risco aqui é mais relacionado à inflação, pois se os índices de inflação subirem além do projetado, o poder de compra pode ser afetado. Além disso, taxas de juros flutuantes podem impactar o valor de mercado do título.

Já o IPCA+ longo oferece proteção contra inflação, o que é bom, mas o risco de crédito é maior, especialmente se a inflação ultrapassar as expectativas. Além disso, a liquidez pode ser menor para títulos mais longos.

Em termos de liquidez, o título atrelado ao CDI geralmente tem boa liquidez, pois é amplamente negociado. O prefixado curto também é líquido, mas pode ter spreads mais amplos. O IPCA+ longo pode ser menos líquido, especialmente em momentos de estresse no mercado.

Quanto à duration, o IPCA+ longo tem uma maior exposição a mudanças nas taxas de juros, o que pode afetar seu valor. O prefixado curto tem menor duration, tornando-o menos sensível a variações nas taxas. O título atrelado ao CDI, por sua vez, tem uma duration intermediária, dependendo do período de recompra.

Sobre a sensibilidade à inflação, o IPCA+ longo é o mais protegido, já que acompanha a inflação. O título atrelado ao CDI também tem uma proteção parcial, pois o CDI muitas vezes incorpora expectativas de inflação. O prefixado curto é o mais exposto, já que o pagamento é fixo e não acompanharia uma alta da inflação.

Considerando o vencimento em 2026 e 2027, o IPCA+ longo pode ser mais adequado, pois protege contra inflação e oferece retorno real. O título atrelado ao CDI é uma boa opção para diversificação, oferecendo exposição a taxas de juros mais altas. O prefixado curto é mais adequado para investidores que buscam liquidez e menor exposição a riscos de mercado.

Para o rebalanceamento, recomendo revisar a carteira anualmente, ajustando os pesos das diferentes classes de ativos conforme as condições de mercado e as necessidades do investidor. Isso ajuda a manter o perfil de risco desejado e a maximizar os retornos.

Finalmente, a recomendação é alocar 50% no IPCA+ longo para proteção contra inflação, 30% no título atrelado ao CDI para exposição a taxas de juros e 20% no prefixado curto para liquidez e segurança. Isso oferece um equilíbrio entre segurança, renda previsível e proteção contra inflação, alinhando-se com o perfil conservador do investidor.

### 📥 Pergunta

Você é um analista de investimentos.

Dado o cenário:
- {"perfil": "conservador", "inflacao_projetada_aa": 4.0, "cdi_aa": 13.25, "vencimentos_anos": [2026, 2027], "objetivo": "renda previsível com baixa volatilidade"}

Decida entre:
- título atrelado ao CDI;
- prefixado curto;
- IPCA+ longo.

Importante:

1. Resposta e raciocínio sempre em portugês do brasil.
2. Estruture o raciocínio em etapas (riscos, liquidez, duration, sensibilidade à inflação).
3. Apresente a recomendação final e uma política de rebalanceamento simples.
4. Use números aproximados e justificativas claras.

### 📤 Resposta

### Análise e Recomendação para Investimento

#### 1. **Perfil do Investidor**
   - **Perfil:** Conservador
   - **Objetivo:** Renda previsível com baixa volatilidade
   - **Inflação Projetada (a.a.):** 4,0%
   - **CDI (a.a.):** 13,25%
   - **Vencimentos Anos:** 2026 e 2027

#### 2. **Etapas de Análise**

##### **2.1. Riscos**
   - **Título atrelado ao CDI:** 
     - Risco de crédito moderado.
     - Sensível a mudanças nas taxas de juros.
   - **Prefixado Curto:**
     - Risco de inflação.
     - Risco de reinvestimento.
   - **IPCA+ Longo:**
     - Risco de crédito mais elevado.
     - Risco de liquidez.

##### **2.2. Liquidez**
   - **Título atrelado ao CDI:** Alta liquidez.
   - **Prefixado Curto:** Liquidez moderada.
   - **IPCA+ Longo:** Liquidez baixa.

##### **2.3. Duration**
   - **Título atrelado ao CDI:** Duration intermediária.
   - **Prefixado Curto:** Duration baixa.
   - **IPCA+ Longo:** Duration alta.

##### **2.4. Sensibilidade à Inflação**
   - **Título atrelado ao CDI:** Proteção parcial contra inflação.
   - **Prefixado Curto:** Sem proteção contra inflação.
   - **IPCA+ Longo:** Proteção total contra inflação.

#### 3. **Recomendação Final**
   - **Título atrelado ao CDI:** 50%
     - Oferece retorno fixo com exposição ao CDI.
     - Proteção parcial contra inflação.
   - **Prefixado Curto:** 30%
     - Oferece retorno fixo e liquidez.
     - Ideal para vencimentos em 2026 e 2027.
   - **IPCA+ Longo:** 20%
     - Proteção total contra inflação.
     - Ideal para investidores que buscam proteção contra inflação.

#### 4. **Política de Rebalanceamento**
   - Rebalancear a carteira anualmente.
   - Ajustar os pesos dos ativos de acordo com as condições de mercado e necessidades do investidor.

### Conclusão
A recomendação é alocar 50% no título atrelado ao CDI, 30% no prefixado curto e 20% no IPCA+ longo. Essa alocação oferece um equilíbrio entre segurança, renda previsível e proteção contra inflação, alinhando-se com o perfil conservador do investidor.
    

### Comparando ֎ LLM vs LRM 🧠
---

> *Agora, utilizando o problema anterior, vamsos comparar a diferença entre os modelos com base em um mesmo contexto e/ou problema.*

#### CENÁRIO 1

In [44]:
# Comparação do MESMO PROMPT para LLM e LRM
# ------------------------------------------------------------------------------

# Importar os módulos
import os
import time
import json
from typing import Tuple, Optional
from groq import Groq
from IPython.display import Markdown, display

# Defindo o prompt
cenario = {
    "perfil": "conservador",
    "inflacao_projetada_aa": 5.0,
    "cdi_aa": 14.5,
    "vencimentos_anos": [2026, 2027],
    "objetivo": "renda previsível com baixa volatilidade",
}

cenario_fmt = json.dumps(cenario, ensure_ascii=False)

prompt = f"""
Você é um analista de investimentos.

Dado o cenário:
- {cenario_fmt}

Decida entre:
- título atrelado ao CDI;
- prefixado curto;
- IPCA+ longo.

Importante:

1. Resposta e raciocínio sempre em portugês do brasil.
2. Estruture o raciocínio em etapas (riscos, liquidez, duration, sensibilidade à inflação).
3. Apresente a recomendação final e uma política de rebalanceamento simples.
4. Use números aproximados e justificativas claras.
"""

# Título das comparações
display(Markdown("## 🔬 Comparação Lado a Lado — LLM vs LRM (MESMO prompt)"))
display(Markdown(f"### 📝 Prompt usado nos dois modelos\n> {prompt.replace('\\n', '\\n> ')}"))

# Máximo de tokens
total_tokens_resposta=2000

# LLM
modelo_llm, saida_llm, tempo_llm = perguntar_llm(
    pergunta=prompt,
    sistema="Responda em Markdown; explicite dependências, riscos e mitigação.",
    max_tokens_resposta=total_tokens_resposta
)

exibir_resposta(
    modelo=modelo_llm,
    pergunta=prompt,
    resposta=saida_llm,
    tempo=tempo_llm
)

# LRM
modelo_lrm, saida_lrm, cadeia_lrm, tempo_lrm = perguntar_lrm(
    pergunta=prompt,
    sistema="Responda em Markdown; explicite dependências, riscos e mitigação.",
    max_tokens_resposta=total_tokens_resposta
)

exibir_resposta(
    modelo=modelo_lrm,
    pergunta=prompt,
    resposta=saida_lrm,
    raciocinio=cadeia_lrm,
    tempo=tempo_lrm
)

## 🔬 Comparação Lado a Lado — LLM vs LRM (MESMO prompt)

### 📝 Prompt usado nos dois modelos
> 
Você é um analista de investimentos.

Dado o cenário:
- {"perfil": "conservador", "inflacao_projetada_aa": 5.0, "cdi_aa": 14.5, "vencimentos_anos": [2026, 2027], "objetivo": "renda previsível com baixa volatilidade"}

Decida entre:
- título atrelado ao CDI;
- prefixado curto;
- IPCA+ longo.

Importante:

1. Resposta e raciocínio sempre em portugês do brasil.
2. Estruture o raciocínio em etapas (riscos, liquidez, duration, sensibilidade à inflação).
3. Apresente a recomendação final e uma política de rebalanceamento simples.
4. Use números aproximados e justificativas claras.



## 🧠 Modelo: `llama3-70b-8192`
**⏱ Tempo de execução:** 2.65s



### 📥 Pergunta

Você é um analista de investimentos.

Dado o cenário:
- {"perfil": "conservador", "inflacao_projetada_aa": 5.0, "cdi_aa": 14.5, "vencimentos_anos": [2026, 2027], "objetivo": "renda previsível com baixa volatilidade"}

Decida entre:
- título atrelado ao CDI;
- prefixado curto;
- IPCA+ longo.

Importante:

1. Resposta e raciocínio sempre em portugês do brasil.
2. Estruture o raciocínio em etapas (riscos, liquidez, duration, sensibilidade à inflação).
3. Apresente a recomendação final e uma política de rebalanceamento simples.
4. Use números aproximados e justificativas claras.

### 📤 Resposta

**Análise de Investimento**

**Perfil do Investidor:** Conservador
**Objetivo:** Renda previsível com baixa volatilidade

**Etapa 1: Riscos**

O perfil conservador do investidor indica que ele busca minimizar o risco de perda de capital. Portanto, é fundamental evitar investimentos com alto risco de perda de valor.

**Etapa 2: Liquidez**

O investidor não especificou uma necessidade de liquidez imediata, mas é importante considerar a possibilidade de resgate em caso de necessidade. Investimentos com vencimentos mais curtos ou liquidez diária são mais apropriados.

**Etapa 3: Duration**

A duration é um fator importante para investimentos com vencimentos mais longos. No entanto, como o objetivo é renda previsível com baixa volatilidade, é mais importante considerar a taxa de juros e a inflação projetada.

**Etapa 4: Sensibilidade à Inflação**

A inflação projetada para os próximos anos é de 5,0% ao ano. É fundamental considerar investimentos que mantenham o poder de compra do capital investido.

**Análise das Opções**

* **Título atrelado ao CDI:** Oferece uma taxa de juros de 14,5% ao ano, o que é atraente em um cenário de alta taxa de juros. No entanto, como o título é atrelado ao CDI, a taxa de juros pode variar ao longo do tempo, o que pode afetar a renda previsível.
* **Prefixado curto:** Oferece uma taxa de juros fixa por um período curto de tempo. Embora seja uma opção mais segura, a taxa de juros pode ser menor que a do título atrelado ao CDI.
* **IPCA+ longo:** Oferece uma taxa de juros indexada à inflação, o que mantém o poder de compra do capital investido. No entanto, a taxa de juros pode ser menor que a do título atrelado ao CDI.

**Recomendação Final**

Considerando o perfil conservador do investidor e o objetivo de renda previsível com baixa volatilidade, **recomendo o título atrelado ao CDI**. Embora haja um risco de variação da taxa de juros, a taxa de 14,5% ao ano é atraente em um cenário de alta taxa de juros. Além disso, o título atrelado ao CDI oferece uma renda previsível com baixa volatilidade.

**Política de Rebalanceamento**

Para manter a estratégia de investimento, é recomendável rever a carteira a cada 6 meses e rebalancear se a taxa de juros do título atrelado ao CDI variar em mais de 1% em relação à taxa de juros projetada. Além disso, é importante monitorar a inflação projetada e ajustar a estratégia de investimento se necessário.
    


## 🧠 Modelo: `deepseek-r1-distill-llama-70b`
**⏱ Tempo de execução:** 5.78s



## 🧐 Raciocínio                                
================================================

Ok, vamos lá. Primeiro, preciso entender o perfil do investidor. Ele é conservador, então busca renda previsível com baixa volatilidade. Isso significa que ele provavelmente não quer correr riscos altos e prefere estabilidade.

Agora, os dados do cenário: inflação projetada de 5% ao ano e CDI de 14,5% ao ano. Os vencimentos são em 2026 e 2027. O objetivo é renda previsível com baixa volatilidade.

Primeiro, vou analisar cada uma das opções: título atrelado ao CDI, prefixado curto e IPCA+ longo.

Começo com o título atrelado ao CDI. Como o CDI está em 14,5%, isso oferece uma rentabilidade maior, mas com risco de crédito. Se o investidor optar por um título de liquidez diária, pode resgatar o dinheiro quando precisar, o que é bom. No entanto, se a taxa de juros subir, o valor do título pode cair, o que é um risco. Além disso, a inflação projetada de 5% é menor que o CDI, então a rentabilidade real seria de 9,5%, o que é bom. Mas o risco de crédito pode ser um problema se a instituição financeira tiver problemas.

Em seguida, o prefixado curto. Com vencimento em 2026 e 2027, a rentabilidade líquida é de 8% a 9%. Isso é menor que o CDI, mas o risco de taxa de juros é menor porque o prazo é curto. A liquidez também é boa, pois são títulos de alta liquidez. A exposição à inflação é menor aqui, já que o prazo é curto e a inflação projetada é de 5%, então a rentabilidade real seria de 3% a 4%, o que é razoável, mas menor que o CDI.

Por fim, o IPCA+ longo. Oferece uma rentabilidade de 4% mais a inflação. Com a inflação projetada de 5%, a rentabilidade total seria de 9%. Isso protege contra a inflação, o que é bom. No entanto, o prazo mais longo significa que o risco de taxa de juros é maior. Se as taxas de juros subirem, o valor do título pode cair bastante. Além disso, a liquidez pode ser menor, o que pode ser um problema se o investidor precisar do dinheiro rapidamente.

Agora, pensando no perfil conservador, a liquidez é importante, então opções com boa liquidez são preferíveis. O risco de crédito no CDI pode ser mitigado escolhendo instituições financeiras sólidas. O risco de taxa de juros no IPCA+ longo é preocupante, então talvez não seja a melhor opção para um investidor conservador.

Considerando tudo isso, o título atrelado ao CDI parece mais adequado. Oferece uma boa rentabilidade, proteção contra a inflação e liquidez diária. Além disso, o risco de crédito pode ser minimizado escolhendo instituições confiáveis. Para mitigar o risco de taxa de juros, o investidor pode manter uma carteira diversificada e monitorar as taxas de juros para decidir se precisa rebalancear.

Portanto, a recomendação seria investir em títulos atrelados ao CDI, com vencimentos em 2026 e 2027, para garantir renda previsível e baixa volatilidade. Além disso, é importante monitorar regularmente as taxas de juros e a inflação para decidir se é necessário rebalancear a carteira, mantendo-a alinhada com o perfil de risco do investidor.

### 📥 Pergunta

Você é um analista de investimentos.

Dado o cenário:
- {"perfil": "conservador", "inflacao_projetada_aa": 5.0, "cdi_aa": 14.5, "vencimentos_anos": [2026, 2027], "objetivo": "renda previsível com baixa volatilidade"}

Decida entre:
- título atrelado ao CDI;
- prefixado curto;
- IPCA+ longo.

Importante:

1. Resposta e raciocínio sempre em portugês do brasil.
2. Estruture o raciocínio em etapas (riscos, liquidez, duration, sensibilidade à inflação).
3. Apresente a recomendação final e uma política de rebalanceamento simples.
4. Use números aproximados e justificativas claras.

### 📤 Resposta

# Análise de Investimentos para Perfil Conservador

## Resumo da Situação
- **Perfil do Investidor:** Conservador, busca renda previsível com baixa volatilidade.
- **Cenário Econômico:**
  - Inflação projetada: 5,0% a.a.
  - CDI: 14,5% a.a.
  - Vencimentos desejados: 2026 e 2027.

## Opções de Investimento

### 1. Título Atrelado ao CDI
- **Características:**
  - Rentabilidade de 14,5% a.a.
  - Liquidez diária.
  - Sensível a mudanças nas taxas de juros.
  - Risco de crédito depende da instituição emissora.

- **Vantagens:**
  - Alta rentabilidade.
  - Liquidez imediata.
  - Proteção contra inflação superior à projetada.

- **Desvantagens:**
  - Risco de perda de valor se as taxas de juros subirem.
  - Risco de crédito.

### 2. Prefixado Curto
- **Características:**
  - Rentabilidade líquida de 8% a 9% a.a.
  - Vencimento em 2026 e 2027.
  - Menor exposição ao risco de taxa de juros.

- **Vantagens:**
  - Menor risco de taxa de juros.
  - Liquidez relativamente boa.
  - Rentabilidade razoável.

- **Desvantagens:**
  - Rentabilidade inferior ao CDI.
  - Exposição à inflação, embora menor.

### 3. IPCA+ Longo
- **Características:**
  - Rentabilidade de IPCA + 4% a.a. (9% total).
  - Proteção contra inflação.
  - Maior exposição ao risco de taxa de juros.

- **Vantagens:**
  - Proteção contra inflação.
  - Rentabilidade competitiva.

- **Desvantagens:**
  - Maior risco de perda de valor com aumento das taxas de juros.
  - Menor liquidez.

## Análise por Etapas

### 1. Riscos
- **Título CDI:** Risco de crédito e risco de taxa de juros.
- **Prefixado Curto:** Menor risco de taxa de juros, exposição à inflação.
- **IPCA+ Longo:** Maior risco de taxa de juros.

### 2. Liquidez
- **Título CDI:** Alta liquidez.
- **Prefixado Curto:** Liquidez boa.
- **IPCA+ Longo:** Liquidez menor.

### 3. Duration
- **Título CDI:** Duration mais curto, menos exposição ao risco de taxa de juros.
- **Prefixado Curto:** Duration curto, menor risco.
- **IPCA+ Longo:** Duration mais longo, maior exposição ao risco.

### 4. Sensibilidade à Inflação
- **Título CDI:** Proteção contra inflação.
- **Prefixado Curto:** Menor proteção.
- **IPCA+ Longo:** Proteção total contra inflação.

## Recomendação Final
**Recomendação:** Investir em **títulos atrelados ao CDI** com vencimentos em 2026 e 2027.

**Justificativa:**
- Oferecem alta rentabilidade (14,5% a.a.).
- Proteção contra inflação.
- Liquidez diária.
- Risco de crédito pode ser mitigado escolhendo instituições financeiras sólidas.

## Política de Rebalanceamento
- Monitorar taxas de juros e inflação semestralmente.
- Rebalancear para manter a exposição ao risco de taxa de juros em níveis confortáveis para o perfil conservador.

## Conclusão
Os títulos atrelados ao CDI são a melhor opção para o perfil conservador, oferecendo renda previsível, baixa volatilidade e proteção contra inflação. A liquidez diária e a rentabilidade superior compensam os riscos associados, que podem ser mitigados com uma gestão cuidadosa.
    

#### CENÁRIO 2

In [42]:
# Comparação do MESMO PROMPT para LLM e LRM
# ------------------------------------------------------------------------------

# Importar os módulos
import os
import time
import json
from typing import Tuple, Optional
from groq import Groq
from IPython.display import Markdown, display

def _blockquote(txt: str) -> str:
    txt = (txt or "").strip()
    return "" if not txt else "\n".join("> " + ln for ln in txt.splitlines())

# Mesmo CENÁRIO (user prompt idêntico para ambos) ===
prompt_comum = """
Crie um plano de 6 semanas para lançar um MVP de assistente de atendimento:

  - Backend: APIs já existentes.
  - Frontend: web app simples.
  - Equipe: 2 devs full-stack, 1 QA, 1 PM; sprint semanal.
  - Restrições: integração com WhatsApp Business na semana 3+; testes de carga na semana 5.
  - Entregáveis por semana; riscos e mitigação; critérios de aceite.
""".strip()

display(Markdown("## 🔬 Comparação LLM vs LRM — **mesmo cenário**, papéis diferentes"))
display(Markdown("### 📝 Prompt (usuário) enviado *igual* aos dois modelos"))
display(Markdown(_blockquote(prompt_comum)))

# Máximo de tokens
total_tokens_resposta=2000

# Regras de SISTEMA para separar os perfis
prompt_sistema_comum =f"""
Você é um analista de projetos e deve EXPLICAR O RACIOCÍNIO.
-
Responda em Markdown, com:

  1) Decomposição em etapas (dependências, riscos, trade-offs).
  2) Estimativas simples (horas por papel, capacidade por sprint, margens).
  3) Tabela de riscos (probabilidade x impacto x mitigação) e caminho crítico.
  4) Critérios de aceite objetivos por semana.
  5) Formate como lista de semanas com checklist objetivo.

  Inclua uma seção final de 'Decisões e justificativas' com o porquê de cada escolha.

Importante:

  1. Texto do raciocínio sempre em português do brasil.
  2. Estruture o raciocínio em etapas (riscos, liquidez, duration, sensibilidade à inflação).
  3. Apresente a recomendação final e uma política de rebalanceamento simples.
  4. Use números aproximados e justificativas claras.
  5. Máximo de {total_tokens_resposta} tokens no retorno.
"""

# LLM: síntese direta, sem cadeia explícita ===
modelo_llm, saida_llm, tempo_llm = perguntar_llm(
    pergunta=prompt_comum,
    sistema=prompt_sistema_comum,
    max_tokens_resposta=8192
)

# Exibe resposta LLM
exibir_resposta(
    modelo=modelo_llm,
    pergunta=prompt_comum,
    resposta=saida_llm,
    tempo=tempo_llm
)

# -----

# LRM: estrutura com cadeia de raciocínio separada ===
modelo_lrm, saida_lrm, cadeia_lrm, tempo_lrm = perguntar_lrm(
    pergunta=prompt_comum,
    sistema=prompt_sistema_comum,
    max_tokens_resposta=2000
)

# Exibe LRM com raciocínio destacado
exibir_resposta(
    modelo=modelo_lrm,
    pergunta=prompt_comum,
    resposta=saida_lrm,
    raciocinio=cadeia_lrm,
    tempo=tempo_lrm
)

## 🔬 Comparação LLM vs LRM — **mesmo cenário**, papéis diferentes

### 📝 Prompt (usuário) enviado *igual* aos dois modelos

> Crie um plano de 6 semanas para lançar um MVP de assistente de atendimento:
>   
>   - Backend: APIs já existentes.
>   - Frontend: web app simples.
>   - Equipe: 2 devs full-stack, 1 QA, 1 PM; sprint semanal.
>   - Restrições: integração com WhatsApp Business na semana 3+; testes de carga na semana 5.
>   - Entregáveis por semana; riscos e mitigação; critérios de aceite.


## 🧠 Modelo: `llama3-70b-8192`
**⏱ Tempo de execução:** 3.06s



### 📥 Pergunta

Crie um plano de 6 semanas para lançar um MVP de assistente de atendimento:
  
  - Backend: APIs já existentes.
  - Frontend: web app simples.
  - Equipe: 2 devs full-stack, 1 QA, 1 PM; sprint semanal.
  - Restrições: integração com WhatsApp Business na semana 3+; testes de carga na semana 5.
  - Entregáveis por semana; riscos e mitigação; critérios de aceite.

### 📤 Resposta

**Plano de 6 semanas para lançar um MVP de assistente de atendimento**

### Decomposição em etapas

1. **Semana 1: Definição de requisitos e planejamento**
	* Definir requisitos funcionais e não funcionais do MVP
	* Planejar a estrutura do frontend e backend
	* Identificar riscos e criar plano de mitigação
	* Estabelecer critérios de aceite para cada semana
	* Risco: Mudanças nos requisitos funcionais; Mitigação: Reuniões diárias com a equipe e stakeholders
2. **Semana 2: Desenvolvimento do frontend**
	* Desenvolver a estrutura básica do frontend (HTML, CSS, JS)
	* Implementar a lógica de negócios do assistente de atendimento
	* Risco: Complexidade na implementação da lógica de negócios; Mitigação: Dividir a tarefa em subtarefas menores e revisar o código regularmente
3. **Semana 3: Integração com WhatsApp Business**
	* Integrar o frontend com as APIs do WhatsApp Business
	* Implementar a lógica de envio e recebimento de mensagens
	* Risco: Dificuldades na integração com WhatsApp Business; Mitigação: Contato prévio com a equipe de suporte do WhatsApp Business e testes rigorosos
4. **Semana 4: Desenvolvimento do backend**
	* Desenvolver a lógica de negócios do backend (APIs)
	* Implementar a integração com as APIs existentes
	* Risco: Complexidade na implementação da lógica de negócios; Mitigação: Dividir a tarefa em subtarefas menores e revisar o código regularmente
5. **Semana 5: Testes de carga e ajustes**
	* Realizar testes de carga no sistema
	* Ajustar a performance do sistema
	* Risco: Falha nos testes de carga; Mitigação: Realizar testes de carga incremental e ajustar a performance gradualmente
6. **Semana 6: Testes finais e deploy**
	* Realizar testes finais do sistema
	* Deploy do sistema em produção
	* Risco: Erros críticos no sistema; Mitigação: Realizar testes rigorosos e ter um plano de rollback pronto

### Estimativas simples

* 2 devs full-stack: 80 horas por semana
* 1 QA: 40 horas por semana
* 1 PM: 20 horas por semana
* Capacidade por sprint: 120 horas

### Tabela de riscos

| Risco | Probabilidade | Impacto | Mitigação |
| --- | --- | --- | --- |
| Mudanças nos requisitos funcionais | 30% | Alto | Reuniões diárias com a equipe e stakeholders |
| Complexidade na implementação da lógica de negócios | 40% | Médio | Dividir a tarefa em subtarefas menores e revisar o código regularmente |
| Dificuldades na integração com WhatsApp Business | 20% | Alto | Contato prévio com a equipe de suporte do WhatsApp Business e testes rigorosos |
| Falha nos testes de carga | 10% | Alto | Realizar testes de carga incremental e ajustar a performance gradualmente |
| Erros críticos no sistema | 10% | Alto | Realizar testes rigorosos e ter um plano de rollback pronto |

### Critérios de aceite por semana

* Semana 1: Definição de requisitos funcionais e não funcionais do MVP
* Semana 2: Implementação da lógica de negócios do frontend
* Semana 3: Integração com WhatsApp Business
* Semana 4: Implementação da lógica de negócios do backend
* Semana 5: Testes de carga e ajustes
* Semana 6: Testes finais e deploy

### Formato de checklist por semana

**Semana 1**

* Definição de requisitos funcionais e não funcionais do MVP
* Planejamento da estrutura do frontend e backend
* Identificação de riscos e criação de plano de mitigação

**Semana 2**

* Implementação da lógica de negócios do frontend
* Revisão do código e ajustes

**Semana 3**

* Integração com WhatsApp Business
* Implementação da lógica de envio e recebimento de mensagens

**Semana 4**

* Implementação da lógica de negócios do backend
* Integração com as APIs existentes

**Semana 5**

* Testes de carga e ajustes
* Ajustes na performance do sistema

**Semana 6**

* Testes finais do sistema
* Deploy do sistema em produção

### Decisões e justificativas

* A equipe de desenvolvimento foi dividida em duas para trabalhar em paralelo no frontend e backend, para reduzir o tempo de desenvolvimento.
* A integração com WhatsApp Business foi priorizada para a semana 3, pois é um requisito crítico para o MVP.
* Os testes de carga foram agendados para a semana 5, para garantir que o sistema esteja pronto para o deploy.
* A equipe de QA foi designada para realizar testes rigorosos em todas as semanas, para garantir a qualidade do sistema.
* O PM foi designado para gerenciar o projeto e garantir que os critérios de aceite sejam atendidos em cada semana.
    


## 🧠 Modelo: `deepseek-r1-distill-llama-70b`
**⏱ Tempo de execução:** 7.35s



## 🧐 Raciocínio                                
================================================

Okay, I need to create a 6-week plan to launch an MVP for a customer service assistant. The user has provided specific details about the team, technologies, and constraints, so I should structure the plan accordingly.

First, I'll break down the project into weekly sprints. Each sprint should have clear objectives, deliverables, and considerations for risks and dependencies. Since the backend uses existing APIs, that should save some time, but the frontend is a new web app, so I'll need to allocate time for that.

The team consists of 2 full-stack devs, 1 QA, and 1 PM. That means development can be parallelized, but I need to ensure tasks are distributed efficiently. The PM will handle coordination, so that's a plus for keeping things on track.

Looking at the constraints, integration with WhatsApp Business starts from week 3 onwards, and load testing is in week 5. These are critical points because delays here could affect the entire timeline. I should plan for contingencies around these areas.

I'll start by outlining each week with specific goals. Week 1 should focus on project setup and initial planning. The PM sets up the environment, defines the backlog, and the team finalizes the MVP scope. Risks here might include scope creep, so keeping the scope small is key.

In Week 2, the frontend development begins. The devs will work on the basic UI/UX, and the QA starts drafting test cases. The risk here is design issues, so regular feedback sessions can mitigate that.

Week 3 is when the WhatsApp integration starts. The backend team will handle the API integration while the frontend continues with advanced features. The risk is API compatibility issues, so having a backup plan is essential.

Week 4 focuses on connecting the frontend and backend. The QA does system testing, and the PM ensures everything is on track. The risk here is integration bugs, so thorough testing is crucial.

Week 5 is for performance testing. The team conducts load tests and optimizes the system. The risk is discovering scalability issues late, so starting early and iterating quickly is important.

Finally, Week 6 is the preparation for launch. The team deploys the MVP, sets up monitoring, and gets ready for user feedback. The risk is deployment issues, so a rollback plan is necessary.

I'll also outline the estimated hours per role to ensure the workload is manageable. The PM has consistent hours each week, while devs and QA have varying loads depending on the sprint.

For risks, I'll create a table assessing probability, impact, and mitigation strategies. The critical path includes WhatsApp integration and frontend development, as delays here would directly impact the launch.

The acceptance criteria should be clear each week, ensuring that each sprint delivers functional and tested features. This helps in maintaining quality and meeting deadlines.

In the end, I'll summarize the decisions made, like starting with the MVP scope to avoid delays, integrating early with WhatsApp to handle issues sooner, and prioritizing performance testing to ensure scalability.

Overall, the plan balances development, testing, and integration with clear risk management strategies to ensure the MVP launches successfully within six weeks.

### 📥 Pergunta

Crie um plano de 6 semanas para lançar um MVP de assistente de atendimento:
  
  - Backend: APIs já existentes.
  - Frontend: web app simples.
  - Equipe: 2 devs full-stack, 1 QA, 1 PM; sprint semanal.
  - Restrições: integração com WhatsApp Business na semana 3+; testes de carga na semana 5.
  - Entregáveis por semana; riscos e mitigação; critérios de aceite.

### 📤 Resposta

### Plano de 6 Semanas para Lançar MVP de Assistente de Atendimento

#### 1) Decomposição em Etapas (Dependências, Riscos, Trade-offs)

| Semana | Etapa                          | Dependências                     | Riscos                                      | Trade-offs                                   |
|--------|--------------------------------|----------------------------------|---------------------------------------------|----------------------------------------------|
| 1      | Setup do Projeto e Planejamento | Definição do escopo MVP         | Atraso na definição do escopo                | Priorizar funcionalidades essenciais         |
| 2      | Desenvolvimento Frontend Básico | Conclusão da semana 1            | Dificuldade na implementação da UI/UX       | Simplificar a interface para agilizar o desenvolvimento |
| 3      | Integração com WhatsApp Business | Conclusão da semana 2           | Problemas de compatibilidade com a API do WhatsApp | Testar em ambiente de homologação antes de deploy |
| 4      | Conexão Frontend-Backend        | Conclusão da semana 3            | Erros de integração                         | Focar em testes unitários e de integração     |
| 5      | Testes de Carga e Otimização   | Conclusão da semana 4            | Descoberta tardia de problemas de performance | Realizar testes incrementais desde cedo       |
| 6      | Preparação para Lançamento      | Conclusão da semana 5            | Problemas de deploy                          | Realizar deploy gradual e ter plano de rollback |

#### 2) Estimativas Simples

| Papel           | Hrs Semana 1 | Hrs Semana 2 | Hrs Semana 3 | Hrs Semana 4 | Hrs Semana 5 | Hrs Semana 6 |
|-----------------|--------------|--------------|--------------|--------------|--------------|--------------|
| Dev Full-Stack  | 40           | 40           | 40           | 40           | 40           | 20           |
| QA              | 20           | 20           | 20           | 20           | 40           | 20           |
| PM              | 20           | 20           | 20           | 20           | 20           | 20           |

**Capacidade por Sprint:**  
- **Desenvolvedores:** 80 hrs/semana  
- **QA:** 20 hrs/semana (aumenta para 40 na semana 5)  
- **PM:** 20 hrs/semana  

**Margens de Segurança:**  
- Desenvolvedores: 10% de folga  
- QA: 20% de folga  

#### 3) Tabela de Riscos

| Risco                              | Probabilidade | Impacto | Mitigação                                      |
|-------------------------------------|---------------|---------|------------------------------------------------|
| Atraso na definição do escopo MVP   | Alta          | Alto    | Workshop de definição de escopo na semana 1     |
| Dificuldade na implementação da UI/UX | Média        | Médio   | Feedback constante com o time de UX            |
| Problemas de compatibilidade com WhatsApp | Alta | Alto | Testar em ambiente de homologação antes do deploy |
| Erros de integração                 | Média         | Médio   | Realizar testes de integração contínuos         |
| Descoberta tardia de problemas de performance | Baixa | Alto | Realizar testes de carga incrementais desde cedo |
| Problemas de deploy                  | Baixa        | Médio   | Realizar deploy gradual e ter plano de rollback |

**Caminho Crítico:**  
1. Integração com WhatsApp Business (Semana 3)  
2. Desenvolvimento Frontend Básico (Semana 2)  
3. Testes de Carga (Semana 5)  

#### 4) Critérios de Aceite Objetivos por Semana

| Semana | Critérios de Aceite                                                                 |
|--------|-------------------------------------------------------------------------------------|
| 1      | Escopo MVP definido e aprovado; Ambiente de desenvolvimento configurado               |
| 2      | Funcionalidades básicas do frontend implementadas e testadas                           |
| 3      | Integração com WhatsApp Business funcional em ambiente de homologação                |
| 4      | Frontend conectado ao backend com testes de integração bem-sucedidos                  |
| 5      | Testes de carga aprovados; Sistema otimizado para 1000 usuários simultâneos            |
| 6      | MVP deployado em produção; Documentação finalizada; Monitoramento configurado         |

#### 5) Formato de Semanas com Checklist Objetivo

| Semana | Checklist                                                                 |
|--------|-----------------------------------------------------------------------------|
| 1      | - Escopo MVP definido e aprovado<br>- Ambiente de desenvolvimento configurado |
| 2      | - Funcionalidades básicas do frontend implementadas e testadas                |
| 3      | - Integração com WhatsApp Business funcional em homologação                  |
| 4      | - Frontend conectado ao backend com testes de integração                      |
| 5      | - Testes de carga aprovados; Sistema otimizado                                |
| 6      | - MVP deployado em produção; Documentação finalizada; Monitoramento configurado |

### Decisões e Justificativas

1. **Priorização do Escopo MVP na Semana 1:**  
   - Justificativa: É crucial definir claramente o que será entregue no MVP para evitar escopo creep e garantir que todos estejam alinhados.

2. **Início da Integração com WhatsApp Business na Semana 3:**  
   - Justificativa: A integração com o WhatsApp Business é um ponto crítico e pode ter problemas não previstos, então é importante começar cedo para ter tempo de resolver problemas.

3. **Realização de Testes de Carga na Semana 5:**  
   - Justificativa: Testes de carga são essenciais para garantir que o sistema suporte o tráfego esperado. Realizá-los tarde dem
    