# Zero-shot Prompting com Modelos de Linguagem

## Introdução aos Modelos de Linguagem de Grande Escala (LLMs)

Os modelos de linguagem de grande escala (LLMs), como o GPT-3.5 Turbo, GPT-4 e Claude 3, foram treinados em grandes volumes de dados e ajustados para seguir instruções. Essa capacidade de processamento em larga escala permite que esses modelos realizem algumas tarefas sem a necessidade de exemplos, uma habilidade conhecida como **zero-shot prompting**.

No **zero-shot prompting**, fornecemos ao modelo apenas uma instrução, sem exemplos adicionais. A ideia é que, devido ao seu treinamento prévio, o modelo compreenda a tarefa diretamente a partir da instrução e responda corretamente. Esse método é útil para tarefas simples e diretas, mas pode falhar em tarefas que exigem raciocínio complexo ou conhecimentos específicos.

## Conceito de Zero-shot Prompting

Zero-shot prompting refere-se ao uso de um modelo de linguagem para realizar uma tarefa sem fornecer exemplos no prompt. Isso é possível porque os LLMs foram expostos a uma ampla gama de dados durante o treinamento e conseguem deduzir padrões e significados de palavras e frases.

Um exemplo típico de zero-shot é a **classificação de sentimento**. No exemplo a seguir, o modelo precisa identificar o tom de uma frase e classificá-la como 'positiva', 'negativa' ou 'neutra', sem que exemplos específicos de sentimento sejam apresentados no prompt.

### Exemplo de Zero-shot Prompting: Classificação de Sentimento

No exemplo abaixo, pedimos ao modelo para classificar o sentimento de uma frase. Note que não fornecemos exemplos anteriores para guiar o modelo, apenas uma instrução direta.

- **Prompt**: Classifique o texto como 'neutro', 'negativo' ou 'positivo'.
- **Texto**: 'Acho que as férias foram boas.'

O modelo deve entender o termo 'sentimento' e responder com a classificação correta, mostrando a capacidade de zero-shot.

In [None]:
from langchain_ollama import ChatOllama
from langchain_core.prompts import ChatPromptTemplate


In [None]:
# Configuração do modelo
chat = ChatOllama(model="llama3")


In [None]:

template = ChatPromptTemplate.from_messages([
    ('system', 'Você é um assistente especializado em análise de sentimentos.'),
    ('human', 'Classifique o texto como "neutro", "negativo" ou "positivo".\nTexto: {texto}\nSentimento:')
])

def classificar_sentimento_zero_shot(texto):
    # Invoca o modelo com a frase fornecida
    resposta = template | chat
    output = resposta.invoke({"texto": texto})
    return output


In [2]:
# Executar a função de classificação em zero-shot
texto_para_classificar = "Acho que as férias foram boas."
resultado_classificar_sentimento_zero_shot = classificar_sentimento_zero_shot(texto_para_classificar)


In [3]:
print(f"Classificação (Zero-shot): {resultado_classificar_sentimento_zero_shot.content}")


Classificação (Zero-shot): Positivo!


## Ajuste de Instruções (Instruction Tuning) e RLHF

O ajuste de instruções, ou **instruction tuning**, aprimora a capacidade dos modelos em realizar tarefas zero-shot ao treiná-los com datasets descritos via instruções (Wei et al., 2022). Isso torna os modelos mais eficientes em entender e seguir comandos diretos, como o pedido para classificar um sentimento.

Além disso, o **Reinforcement Learning from Human Feedback** (RLHF) é uma técnica que alinha o modelo para se ajustar melhor às preferências humanas [RLHF (arxiv:1706.03741)](https://arxiv.org/abs/1706.03741). Esse método, utilizado em modelos como o ChatGPT, melhora a resposta a tarefas zero-shot, tornando o modelo mais sensível a nuances de linguagem e preferências do usuário.

### Exemplo de Zero-shot com Classificação de Sentimento e Explicação

No próximo exemplo, pedimos ao modelo não apenas para classificar o sentimento de uma frase, mas também para explicar o motivo da classificação.

- **Prompt**: Classifique o texto e explique a razão.
- **Texto**: 'O serviço foi péssimo.'

Este tipo de prompt incentiva o modelo a fornecer um raciocínio, ainda que seja um zero-shot, aproveitando o ajuste de instruções e o RLHF para aumentar a precisão da resposta.

In [4]:
# Novo template para classificação com explicação
template_explicacao = ChatPromptTemplate.from_messages([
    ('system', 'Você é um assistente que classifica o sentimento e explica a razão da classificação.'),
    ('human', 'Classifique o texto como "neutro", "negativo" ou "positivo" e explique o motivo.\nTexto: {texto}\nSentimento e Explicação:')
])

def classificar_sentimento_com_explicacao_zero_shot(texto):
    # Invoca o modelo com a frase fornecida
    resposta = template_explicacao | chat
    output = resposta.invoke({"texto": texto})
    return output

In [5]:
# Executar a função de classificação com explicação
texto_para_classificar_explicacao = "O serviço foi péssimo."
resultado_classificar_sentimento_com_explicacao = classificar_sentimento_com_explicacao_zero_shot(texto_para_classificar_explicacao)


In [6]:
print(f"Classificação com Explicação (Zero-shot): {resultado_classificar_sentimento_com_explicacao.content}")

Classificação com Explicação (Zero-shot): Classificação: Negativa

Motivo: A palavra-chave do texto é "péssimo", que é um termo fortemente negativo, expressando uma forte desaprovação ou descontentamento com o serviço. Além disso, a falta de palavras positivas e a ausência de justificativas para o serviço ser ruim também contribuem para essa classificação.


## Conclusão sobre Zero-shot Prompting e Limitações

O zero-shot prompting é uma ferramenta poderosa para tarefas onde o modelo consegue identificar padrões com base apenas em instruções diretas. No entanto, ele tem limitações, especialmente em tarefas que requerem raciocínio mais complexo ou conhecimento de contexto específico.

Quando o zero-shot não é suficiente, é recomendável considerar o uso de **few-shot prompting**, onde exemplos adicionais são fornecidos ao modelo, ou até técnicas mais avançadas, como o **Chain-of-Thought Prompting** para problemas que exigem múltiplas etapas de raciocínio.

Aprendemos que o ajuste de instruções, como descrito em [Wei et al., 2022](https://arxiv.org/pdf/2109.01652), e o RLHF [RLHF (arxiv:1706.03741)](https://arxiv.org/abs/1706.03741), são métodos cruciais para melhorar a eficiência dos modelos em tarefas zero-shot.