# Chain-of-Thought Prompting com Modelos de Linguagem

## O que é Chain-of-Thought (CoT) Prompting?

O *Chain-of-Thought (CoT) Prompting* é uma técnica introduzida por [Wei et al. (2022)](https://arxiv.org/abs/2201.11903), que permite ao modelo realizar raciocínios complexos, dividindo o problema em etapas intermediárias. Essa abordagem aumenta a precisão ao permitir que o modelo explique seu raciocínio passo a passo, em vez de simplesmente fornecer uma resposta final.

Ao combinar CoT com *Few-shot Prompting*, podemos melhorar ainda mais o desempenho em tarefas que exigem raciocínio lógico.

### Exemplo Visual de Chain-of-Thought Prompting

![Chain-of-Thought Prompting](../../assets/cot.webp)

### Exemplo de Chain-of-Thought com Soma de Números Ímpares

Vamos usar um exemplo prático para ilustrar como o Chain-of-Thought Prompting pode ajudar em uma tarefa que envolve raciocínio lógico.

**Prompt:**

> Os números ímpares neste grupo somam um número par: 4, 8, 9, 15, 12, 2, 1.

**Resposta Esperada:**

> Somando todos os números ímpares (9, 15, 1) dá 25. A resposta é Falso.

In [1]:
# Prompt de Chain-of-Thought para verificar se a soma de números ímpares é par ou ímpar
from langchain_ollama import ChatOllama
from langchain_core.prompts import ChatPromptTemplate

chat = ChatOllama(model="llama3")
template_cot = ChatPromptTemplate.from_messages([
    ('system', 'Você é um assistente de matemática que verifica se a soma de números ímpares é par ou ímpar e explica o raciocínio.'),
    ('human', 'A soma dos números ímpares neste grupo é um número par: 4, 8, 9, 15, 12, 2, 1. '
              'A: Somando os números ímpares (9 + 15 + 1) obtemos 25. A resposta é Falso.')
])

def exemplo_cot():
    resposta = template_cot | chat
    output = resposta.invoke({})
    return output


In [2]:
# Executar a função de Chain-of-Thought
resultado_cot = exemplo_cot()


In [3]:
print(f"Resultado do exemplo Chain-of-Thought: {resultado_cot.content}")


Resultado do exemplo Chain-of-Thought: Mas vamos verificar isso!

Vou somar os números ímpares do grupo: 9 + 15 + 1 = 25

E, sim, o resultado é um número ímpar (25 é ímpar). Portanto, a afirmação inicial está correta: A soma dos números ímpares é par.

A resposta certa é Verdadeiro.


## Zero-shot Chain-of-Thought (CoT) Prompting

O *Zero-shot CoT Prompting*, proposto por [Kojima et al. (2022)](https://arxiv.org/abs/2205.11916), é uma variação onde se adiciona uma instrução como 'Vamos pensar passo a passo' no prompt. Isso incentiva o modelo a seguir um raciocínio estruturado, mesmo sem exemplos prévios.

**Exemplo:**

> Eu fui ao mercado e comprei 10 maçãs. Dei 2 maçãs ao vizinho e 2 ao reparador. Depois comprei mais 5 maçãs e comi 1. Com quantas maçãs fiquei?

**Prompt Zero-shot CoT:**

> Vamos pensar passo a passo.

### Exemplo Visual de Zero-shot Chain-of-Thought Prompting

![Zero-shot Chain-of-Thought Prompting](../../assets/zero-cot.webp)

In [4]:
# Exemplo prático de Zero-shot Chain-of-Thought
template_zero_shot_cot = ChatPromptTemplate.from_messages([
    ('system', 'Você é um assistente que calcula quantas maçãs sobraram usando o raciocínio passo a passo.'),
    ('human', 'Eu fui ao mercado e comprei 10 maçãs. Dei 2 ao vizinho e 2 ao reparador. Depois comprei 5 e comi 1. '
              'Com quantas maçãs fiquei? Vamos pensar passo a passo.')
])

def exemplo_zero_shot_cot():
    resposta = template_zero_shot_cot | chat
    output = resposta.invoke({})
    return output


In [5]:
# Executar a função de Zero-shot CoT
resultado_zero_shot_cot = exemplo_zero_shot_cot()


In [6]:
print(f"Resultado do exemplo Zero-shot CoT: {resultado_zero_shot_cot.content}")

Resultado do exemplo Zero-shot CoT: Que delícia de maçãs! Vamos calcular juntos.

Primeiro, você começou com 10 maçãs que comprou no mercado.

Em seguida, você deu 2 maçãs ao vizinho e outras 2 maçãs ao reparador. Isso significa que você agora tem:

10 (maçãs iniciais) - 2 (dadas ao vizinho) = 8 maçãs
8 - 2 (dadas ao reparador) = 6 maçãs

Agora, você comprou mais 5 maçãs. Isso significa que você agora tem:

6 (maçãs restantes) + 5 (novo suprimento) = 11 maçãs

Por último, você comeu 1 maçã. Isso significa que você agora tem:

11 - 1 = 10 maçãs

Portanto, você faltou com 10 maçãs!


## Automatic Chain-of-Thought (Auto-CoT)

A técnica *Auto-CoT*, proposta por [Zhang et al. (2022)](https://arxiv.org/abs/2210.03493), visa eliminar a necessidade de criar exemplos manualmente, permitindo que o modelo gere automaticamente cadeias de raciocínio para demonstrações. Esse método seleciona perguntas representativas de um conjunto de dados e utiliza o raciocínio passo a passo para construir demonstrações com diversidade e precisão.

### Processo do Auto-CoT
1. Agrupamento de perguntas.
2. Seleção de uma pergunta representativa de cada grupo.
3. Geração da cadeia de raciocínio usando o Zero-shot CoT.

Essa técnica reduz o esforço manual, mantendo a qualidade das respostas.

### Exemplo Visual de Automatic Chain-of-Thought (Auto-CoT)

![Automatic Chain-of-Thought Prompting](../../assets/auto-cot.webp)

In [7]:
# Exemplo prático de Automatic Chain-of-Thought (Auto-CoT)
template_auto_cot = ChatPromptTemplate.from_messages([
    ('system', 'Você é um assistente que resolve problemas complexos usando raciocínio automático em cadeia.'),
    ('human', 'Zoe comprou 3 álbuns de música country e 5 álbuns de pop. Cada álbum tem 3 músicas. '
              'Quantas músicas Zoe comprou no total? Vamos pensar passo a passo.')
])

def exemplo_auto_cot():
    resposta = template_auto_cot | chat
    output = resposta.invoke({})
    return output


In [8]:
# Executar a função de Auto-CoT
resultado_auto_cot = exemplo_auto_cot()


In [9]:
print(f"Resultado do exemplo Auto-CoT: {resultado_auto_cot.content}")

Resultado do exemplo Auto-CoT: Vou ajudar a resolver isso!

Especificamente, vou utilizar raciocínio automático em cadeia para encontrar a resposta.

Primeiramente, precisamos saber quantos álbuns de música country Zoe comprou: 3.

Cada álbum tem 3 músicas, então podemos calcular o número de músicas de música country compradas como segue:

3 álbuns de música country × 3 músicas por álbum = 9 músicas de música country

Agora precisamos considerar os álbuns de pop. Zoe comprou 5 álbuns de pop, e cada um tem 3 músicas. Podemos calcular o número de músicas de pop compradas da seguinte maneira:

5 álbuns de pop × 3 músicas por álbum = 15 músicas de pop

Agora que sabemos a quantidade de músicas de country e pop, podemos somar esses números para encontrar o total de músicas compradas por Zoe:

9 músicas de música country + 15 músicas de pop = 24 músicas no total

Portanto, Zoe comprou um total de 24 músicas!


## Conclusão

O Chain-of-Thought Prompting e suas variações (Zero-shot CoT e Auto-CoT) são técnicas avançadas para melhorar o desempenho de modelos de linguagem em tarefas complexas. Cada abordagem tem suas vantagens, e a escolha depende do tipo de tarefa e da disponibilidade de exemplos.

Com essas técnicas, é possível melhorar a capacidade de raciocínio e a precisão do modelo, tornando-o mais robusto para enfrentar desafios variados.