<a href="https://colab.research.google.com/github/jsansao/teic-20231/blob/main/TEIC_Licao36_EngenhariaPrompt_SelfConsistencyReAct.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# üöÄ Engenharia de Prompt Avan√ßada: Self-Consistency e ReAct (Tool Calling) com Gemini

Este notebook demonstra duas t√©cnicas avan√ßadas de engenharia de prompt que v√£o al√©m do Chain-of-Thought (CoT) b√°sico.

1.  **Self-Consistency:** Como melhorar a confiabilidade das respostas CoT rodando o prompt m√∫ltiplas vezes e fazendo uma "vota√ß√£o".
2.  **ReAct (Reason + Act):** Como permitir que o LLM use ferramentas externas para responder perguntas. Mostraremos isso usando a funcionalidade nativa de **Tool Calling** do Gemini, que √© a evolu√ß√£o moderna do padr√£o ReAct.

## Passo 1: Instala√ß√£o e Configura√ß√£o

Primeiro, instalamos a biblioteca e configuramos a API Key.

**Instru√ß√µes (Importante):**
1.  Gere sua API Key no [Google AI Studio](https://aistudio.google.com/app/apikey).
2.  Clique no √≠cone de **chave** (üîë) na barra lateral esquerda do Colab.
3.  Adicione um novo segredo chamado `GOOGLE_API_KEY` e cole sua chave l√°.

In [1]:
!pip install -q google-generativeai

In [2]:
import google.generativeai as genai
from google.colab import userdata
import os
import re
from collections import Counter
import json

try:
    GOOGLE_API_KEY = userdata.get('GOOGLE_API_KEY')
    genai.configure(api_key=GOOGLE_API_KEY)
    print("API Key configurada com sucesso!")
except userdata.SecretNotFoundError:
    print("Erro: 'GOOGLE_API_KEY' n√£o encontrada nos Secrets do Colab.")
    print("Por favor, adicione sua API Key na aba 'Secrets' (√≠cone de chave) √† esquerda.")
except Exception as e:
    print(f"Ocorreu um erro: {e}")

API Key configurada com sucesso!


## Parte 2: Self-Consistency (Autoconsist√™ncia)

**O Conceito:** O Chain-of-Thought (CoT) √© √≥timo, mas e se o modelo cometer um erro no "passo a passo"? A resposta final estar√° errada.

**A T√©cnica:**
1.  Usamos um prompt CoT (ex: "Pense passo a passo").
2.  Definimos a `temperature` do modelo como > 0 (ex: 0.7). Isso introduz aleatoriedade, fazendo com que o modelo gere *caminhos de racioc√≠nio diferentes* a cada vez.
3.  Rodamos o mesmo prompt N vezes (ex: 5 ou 7 vezes).
4.  Extra√≠mos a resposta final de cada uma das N sa√≠das.
5.  Usamos um "voto majorit√°rio": a resposta final que apareceu mais vezes √© provavelmente a correta, pois diferentes caminhos de racioc√≠nio convergiram para ela.

Vamos usar um problema de l√≥gica que pode ter caminhos confusos.

In [3]:
# O problema
problema_sc = """
P: Numa cafeteria, havia 50 muffins. 15 foram vendidos pela manh√£.
√Ä tarde, eles assaram mais 30 muffins.
Depois, um cliente comprou 8.
Quantos muffins restam no final do dia?

R: Pense passo a passo.
"""

# 1. Configurar o modelo com temperature > 0 para gerar caminhos diversos
generation_config = {
    "temperature": 0.7,
    "top_p": 1.0,
    "top_k": 32,
}

model_sc = genai.GenerativeModel(
    model_name='gemini-2.5-flash-preview-09-2025',
    generation_config=generation_config
)

# 2. Rodar o prompt N vezes
num_amostras = 5
respostas = []

print(f"Rodando o prompt {num_amostras} vezes (pode levar um momento)...\n")

for i in range(num_amostras):
    try:
        response = model_sc.generate_content(problema_sc)
        respostas.append(response.text)
        print(f"--- Amostra {i+1} ---")
        print(response.text)
        print("--------------------\n")
    except Exception as e:
        print(f"Erro na Amostra {i+1}: {e}")


Rodando o prompt 5 vezes (pode levar um momento)...

--- Amostra 1 ---
Esta √© a resolu√ß√£o passo a passo:

**1. Muffins iniciais:**
Havia **50** muffins.

**2. Venda da manh√£ (Subtra√ß√£o):**
Foram vendidos 15.
$50 - 15 = 35$ muffins restantes.

**3. Assar mais (Adi√ß√£o):**
Eles assaram mais 30.
$35 + 30 = 65$ muffins no total.

**4. Venda final (Subtra√ß√£o):**
Um cliente comprou 8.
$65 - 8 = 57$ muffins restantes.

**Resposta:** Restam **57** muffins no final do dia.
--------------------

--- Amostra 2 ---
Este √© o c√°lculo passo a passo:

1. **In√≠cio do Dia:** Havia **50** muffins.
2. **Vendas da Manh√£:** 15 foram vendidos.
   $$50 - 15 = 35$$
3. **Assaram Mais:** 30 foram adicionados.
   $$35 + 30 = 65$$
4. **√öltima Venda:** Um cliente comprou 8.
   $$65 - 8 = 57$$

**Resposta:** Restam **57** muffins no final do dia.
--------------------

--- Amostra 3 ---
Esta √© a resolu√ß√£o passo a passo:

**1. Muffins Iniciais:**
Havia **50** muffins.

**2. Venda da Manh√£:**
15 foram

In [4]:
# 3. e 4. Extrair a resposta final e fazer a vota√ß√£o

def extrair_resposta_final(texto):
    """Encontra o √∫ltimo n√∫mero no texto, que geralmente √© a resposta final."""
    # Tenta encontrar padr√µes como "A resposta √© 57" ou "restam 57"
    numeros = re.findall(r'\b(\d+)\b', texto)
    if numeros:
        # Retorna o √∫ltimo n√∫mero encontrado como string
        return numeros[-1]
    return None

respostas_finais_extraidas = []
for r in respostas:
    ans = extrair_resposta_final(r)
    if ans:
        respostas_finais_extraidas.append(ans)

print(f"Respostas finais extra√≠das: {respostas_finais_extraidas}")

# 5. Voto majorit√°rio
if respostas_finais_extraidas:
    votos = Counter(respostas_finais_extraidas)
    print(f"\Contagem de votos: {votos}")

    resposta_mais_comum, _ = votos.most_common(1)[0]
    print(f"\nüèÜ A resposta mais consistente √©: {resposta_mais_comum}")
    print("\n(A resposta correta √© 50 - 15 + 30 - 8 = 57)")
else:
    print("Nenhuma resposta final p√¥de ser extra√≠da.")

Respostas finais extra√≠das: ['57', '57', '57', '57', '57']
\Contagem de votos: Counter({'57': 5})

üèÜ A resposta mais consistente √©: 57

(A resposta correta √© 50 - 15 + 30 - 8 = 57)


  print(f"\Contagem de votos: {votos}")


## Parte 3: ReAct (Reason + Act) via Tool Calling

**O Conceito:** LLMs n√£o sabem de tudo (ex: clima em tempo real, pre√ßos de a√ß√µes, dados em um banco de dados). Eles precisam de "ferramentas". O padr√£o ReAct (Reason + Act) permite que o modelo:
1.  **Reason (Pensar):** Determine qual informa√ß√£o est√° faltando.
2.  **Act (Agir):** Decida chamar uma ferramenta (ex: `get_weather(location)`).
3.  **Observe (Observar):** Receba o resultado da ferramenta.
4.  Repita ou gere a resposta final.

A API do Gemini implementa isso nativamente com **Tool Calling**.

**Nosso Exemplo:** Vamos criar uma ferramenta falsa `get_preco_produto` e ver o modelo decidir us√°-la.

In [5]:
# 1. Definir nossa ferramenta Python (a fun√ß√£o que ser√° chamada)
def get_preco_produto(nome_produto, loja="qualquer"):
    """Retorna o pre√ßo de um produto em uma loja espec√≠fica."""
    print(f"*** Chamada de API Externa: get_preco_produto(nome_produto={nome_produto}, loja={loja}) ***")

    # Simula√ß√£o de dados de um banco de dados de e-commerce
    db_precos = {
        "laptop gamer": {"preco": 7500.00, "loja": "LojaTech", "estoque": 10},
        "smartphone 5g": {"preco": 3200.50, "loja": "MobileCenter", "estoque": 5},
        "teclado mec√¢nico": {"preco": 450.00, "loja": "Perif√©ricosTop", "estoque": 20}
    }

    produto_key = nome_produto.lower()
    if produto_key in db_precos:
        info_produto = db_precos[produto_key]
        info_produto["produto"] = nome_produto
    else:
        info_produto = {"produto": nome_produto, "preco": None, "erro": "Produto n√£o encontrado"}

    return json.dumps(info_produto)

# 2. Definir o *esquema* da ferramenta para a API do Gemini
# Isso diz ao modelo O QUE a ferramenta faz e QUAIS s√£o seus argumentos.
ferramenta_preco_produto = {
    "name": "get_preco_produto",
    "description": "Retorna o pre√ßo e o estoque de um produto em uma loja online.",
    "parameters": {
        "type": "OBJECT",
        "properties": {
            "nome_produto": {
                "type": "STRING",
                "description": "O nome do produto a ser buscado, ex: Laptop Gamer"
            },
            "loja": {
                "type": "STRING",
                "description": "A loja espec√≠fica onde buscar (opcional)"
            }
        },
        "required": ["nome_produto"]
    }
}

# 3. Criar o modelo e informar sobre a ferramenta
model_react = genai.GenerativeModel(
    model_name='gemini-2.5-flash-preview-09-2025',
    tools=[ferramenta_preco_produto] # Informa ao modelo quais ferramentas ele pode usar
)

# Iniciar o chat (necess√°rio para o loop de tool calling)
chat = model_react.start_chat(enable_automatic_function_calling=False) # Manual para vermos os passos

print("Modelo ReAct/Tool-Calling configurado.")

Modelo ReAct/Tool-Calling configurado.


In [16]:
# 4. O Loop ReAct (Reason, Act, Observe)


prompt_preco = "Quanto custa o laptop gamer?"
#prompt_preco = "Quanto custa o laptop ?"
#prompt_preco = "Quanto custa o teclado mec√¢nico?"

print(f"Usu√°rio: {prompt_preco}\n")

# PASSO 1: O modelo PENSA (Reason) e decide AGIR (Act)
response_passo1 = chat.send_message(prompt_preco)
candidate = response_passo1.candidates[0]

# Verificar se o modelo decidiu chamar nossa fun√ß√£o
if candidate.content.parts[0].function_call:
    # O modelo decidiu AGIR!
    chamada_de_funcao = candidate.content.parts[0].function_call
    print(f"ü§ñ (Reasoning) O modelo decidiu chamar uma ferramenta: {chamada_de_funcao.name}")
    print(f"ü§ñ (Action) Argumentos da chamada: {chamada_de_funcao.args}\n")

    # PASSO 2: N√≥s executamos a ferramenta (a parte "Act" no nosso c√≥digo)
    # e obtemos a "Observa√ß√£o"
    nome_funcao = chamada_de_funcao.name
    args = chamada_de_funcao.args

    if nome_funcao == "get_preco_produto":
        # Chama a fun√ß√£o Python real
        resultado_funcao = get_preco_produto(nome_produto=args['nome_produto'],
                                            loja=args.get('loja', 'qualquer'))

        print(f"üêç (Observation) Resultado da ferramenta: {resultado_funcao}\n")

        # PASSO 3: Devolver a "Observa√ß√£o" para o modelo
        # O modelo vai usar isso para gerar a resposta final.
        response_passo2 = chat.send_message(content=resultado_funcao)


        # O modelo agora gera a resposta final em linguagem natural
        print("ü§ñ (Final Answer) Resposta final do modelo:")
        print(response_passo2.text)

    else:
        print(f"Erro: Modelo tentou chamar uma fun√ß√£o desconhecida: {nome_funcao}")

else:
    # O modelo n√£o precisou de ferramenta (ou falhou)
    print("ü§ñ O modelo respondeu diretamente:")
    print(response_passo1.text)

Usu√°rio: Quanto custa o teclado mec√¢nico?

ü§ñ (Reasoning) O modelo decidiu chamar uma ferramenta: get_preco_produto
ü§ñ (Action) Argumentos da chamada: <proto.marshal.collections.maps.MapComposite object at 0x7aea9754a1e0>

*** Chamada de API Externa: get_preco_produto(nome_produto=teclado mec√¢nico, loja=qualquer) ***
üêç (Observation) Resultado da ferramenta: {"preco": 450.0, "loja": "Perif\u00e9ricosTop", "estoque": 20, "produto": "teclado mec\u00e2nico"}

ü§ñ (Final Answer) Resposta final do modelo:
O teclado mec√¢nico na loja Perif√©ricosTop custa R$ 450,00 e tem 20 unidades em estoque.


In [8]:
chat.send_message()

google.generativeai.types.content_types.PartDict

## Conclus√£o

Voc√™ viu duas t√©cnicas poderosas:

1.  **Self-Consistency:** Aumenta a **confiabilidade** das respostas de racioc√≠nio complexo atrav√©s de amostragem e vota√ß√£o. (Usando `temperature` e `Counter`).
2.  **ReAct / Tool Calling:** D√° ao LLM "bra√ßos e pernas" para interagir com o mundo exterior, permitindo que ele acesse dados em tempo real e execute a√ß√µes. (Usando a defini√ß√£o de `tools` e o loop `FunctionCall` / `FunctionResponse`).