# Exercícios de Embedding e Engenharia de Prompt

Bem-vindo a este notebook onde você explorará dois conceitos críticos em NLP moderna:

1. **Embeddings de Palavras**: Como palavras e sequências são representadas em espaços vetoriais densos.
2. **Engenharia de Prompt**: Como projetar prompts efetivos para melhorar o desempenho de Modelos de Linguagem de Grande Escala (LLMs).

Vamos começar!

---

## **Seção 1: Exercícios de Embedding de Palavras**

### **Exercício 1: Teórico - Entendendo Embeddings de Palavras**

**Objetivo:** Explicar o conceito de embeddings de palavras.

**Instruções:**

- Descreva o que é um embedding de palavra e como ele difere de métodos tradicionais como codificação one-hot.
- Discuta as vantagens de usar embeddings.
- Explique como a similaridade cosseno é usada para comparar embeddings.

➡️ **Escreva sua resposta abaixo em uma célula markdown.**

### **Exercício 2: Prático - Usando Word2Vec para Calcular Similaridades**

**Objetivo:** Treinar um modelo Word2Vec e explorar similaridades entre palavras.

**Instruções:**

- Use `gensim` para treinar um modelo Word2Vec em um pequeno corpus de texto à sua escolha.
- Selecione pelo menos 3 pares de palavras e calcule a similaridade cosseno entre elas usando o modelo treinado.
- Visualize os embeddings usando PCA ou t-SNE em um espaço 2D.

➡️ **Use a célula de código abaixo para realizar as tarefas.**

In [None]:
# Importe as bibliotecas necessárias

# Prepare um corpus simples

# Treine um modelo Word2Vec

# Selecione pares de palavras e calcule similaridades cosseno

# Visualize os embeddings em 2D com PCA ou t-SNE

### **Exercício 3: Prático - Aritmética Vetorial com Embeddings**

**Objetivo:** Demonstrar operações vetoriais com embeddings.

**Instruções:**

- Realize operações vetoriais como: `rei - homem + mulher = ?`.
- Use `most_similar()` para encontrar qual palavra está mais próxima do vetor resultante.
- Reflita sobre o que isso revela sobre a estrutura do espaço de embedding.

➡️ **Use a célula de código abaixo para este experimento.**

In [None]:
# Realize operações vetoriais usando o modelo Word2Vec treinado
# Exemplo: model.wv.most_similar(positive=['rei', 'mulher'], negative=['homem'])

### **Exercício 4: Teórico - Codificação Posicional em Transformers**

**Objetivo:** Entender a importância da codificação posicional e suas implicações nos modelos de linguagem.

**Instruções:**

1. Explique por que a codificação posicional é necessária em Transformers.
2. Descreva a diferença entre codificações posicionais fixas (baseadas em funções seno e cosseno) e codificações aprendidas.
3. Como a codificação posicional interage com o mecanismo de atenção nos Transformers?

➡️ **Escreva suas respostas em células markdown.**

### **Exercício 5: Prático - Usando Embeddings Pré-Treinados para Similaridade de Sentenças**

**Objetivo:** Aplicar embeddings pré-treinados para calcular similaridade entre sentenças.

**Instruções:**

- Carregue embeddings pré-treinados (ex: GloVe, FastText).
- Crie uma função para calcular embeddings de sentenças, fazendo a média dos embeddings das palavras.
- Escolha ao menos dois pares de sentenças: um par semanticamente similar e outro não.
- Calcule e compare as similaridades cosseno entre os pares.

➡️ **Use a célula de código abaixo para esta tarefa.**

In [None]:
# Carregue embeddings pré-treinados

# Defina uma função para calcular embeddings de sentenças

# Escolha pares de sentenças e calcule similaridades

## **Seção 2: Exercícios de Engenharia de Prompt**

In [None]:
# --- Apenas rode essa célula
%pip install groq

In [None]:
# código para chamada no modelo.
# Apenas execute esta célula
from groq import Groq

client = Groq(api_key="<sua-api-key-aqui>")

# --- Função para chamada ao modelo ---
def call(text: str) -> str:
    """Wrapper function for model calling"""
    try:
        completion = client.chat.completions.create(
            model="llama-3.1-8b-instant",
            messages=[
            {
                "role": "user",
                "content": text,
            }
            ],
            temperature=1,
            max_completion_tokens=1024,
            top_p=1,
            stream=False,
            stop=None,
        )
        return completion.choices[0].message.content
    
    except Exception as e:
        print(f"Erro na chamada para o modelo: {e}")
        raise


Execute esta célula para testar se a integração com o Groq está funcionando. Use a função ``call()`` para os exercícios de prompt engineering.

In [None]:
call("Me conte uma piada")

### **Exercício 1: Teórico - Introdução à Engenharia de Prompt**

**Objetivo:** Entender o conceito e técnicas de engenharia de prompt.

**Instruções:**

- Defina engenharia de prompt com suas próprias palavras.
- Explique por que engenharia de prompt é crítica ao trabalhar com LLMs.
- Liste e descreva brevemente pelo menos três técnicas: zero-shot, few-shot, chain-of-thought.

➡️ **Escreva sua explicação abaixo em uma célula markdown.**

### **Exercício 2: Prático - Zero-Shot Prompting**

**Objetivo:** Explorar o zero-shot prompting.

**Instruções:**

Apresente ao modelo a seguinte sequência:

```makefile
Grass: Green  
Sky: Blue  
Sunflower: Yellow  
```

Agora peça:
"Continue a sequência com: Apple: ?"

Observe se o modelo associa corretamente o padrão de objeto-cor.
Se ele falhar, explique como reformular o prompt para que ele compreenda melhor o padrão.

➡️ **Use a célula de código abaixo para enviar seu prompt e observar a saída.**

In [None]:
# Envie um prompt zero-shot para o modelo

### **Exercício 3: Prático - Few-Shot Prompting**

**Objetivo:** Explorar o few-shot prompting.

**Instruções:**

- Forneça ao modelo alguns exemplos antes de pedir que realize a tarefa.
- Apresente ao modelo:

```makefile
Apple: Purple  
Banana: Purple  
Lemon: Blue
Elephant: Grey  
```

Neste caso, usaremos ``Purple`` para todas as frutas doces, ``Blue`` para todas as demais frutas e ``Grey`` para todos os animais.

Faça um experiento pedindo ao modelo para classificar ``Tiger``, ``Tomato`` e ``Strawberry``. Veja o resultado. Tente depois fornecer um Few-Shot prompting para tentar formatar a resposta.

➡️ **Use a célula de código abaixo para construir e enviar seu prompt few-shot.**

In [None]:
# Envie um prompt few-shot para o modelo
# Exemplo: tarefa de tradução com alguns exemplos

### **Exercício 4: Prático - Chain-of-Thought Prompting**

**Objetivo:** Testar o chain-of-thought (CoT) prompting para melhorar o raciocínio.

**Instruções:**

- Repita o experimento anterior utilizando o Chain-of-Thought.
- O resultado esperado ficou melhor ou pior? Por que?

➡️ **Use a célula de código abaixo para enviar ambos os prompts e comparar os resultados.**

In [None]:
# Envie um prompt direto para resolver um problema de múltiplas etapas

# Envie o mesmo prompt com CoT: "Vamos pensar passo a passo..."

### **Exercício 5: Valence, Arousal, Emotion, Intensity**

**Objetivo:** Controlar a saída do modelo para uma tarefa específica.

**Instruções:**

- Construa um prompt que permita o modelo classificar um texto segundo sua Valência, Excitação (Arousal), Emoção e Intensidade. A saída do modelo deverá ser apenas um JSON.
- A resposta deve ser neste formato:
  
```makefile
{
    "emotion": "[nome da emoção]",
    "valence": "Positive" ou "Negative",
    "arousal": "High" ou "Low",
    "intensity": número entre 0 e 1
}
```

Avalie seu prompt nas seguintes frases:

1. "Apesar de tudo, sinto uma mistura de esperança e preocupação pelo futuro."  
2. "Eu ri, mas no fundo algo me incomodava durante a conversa."  
3. "O silêncio na sala me deixou inquieto, mas também aliviado."  
4. "Senti uma onda de tristeza que logo se transformou em determinação."  
5. "Estou exausto, mas feliz por ter conseguido terminar o projeto."  
6. "Minha mente está cheia de pensamentos confusos, mas uma pequena faísca de otimismo permanece."  
7. "A nostalgia tomou conta de mim, trazendo um sorriso melancólico."  
8. "Fiquei irritado no momento, mas agora vejo que foi uma reação exagerada."  
9. "O medo me paralisou, porém, uma curiosidade estranha me fez continuar."  
10. "Há uma calma tensa no ar, como se algo estivesse prestes a acontecer."

➡️ **Use a célula de código abaixo para seus experimentos e resuma suas conclusões em uma célula markdown.**

In [None]:
# Seu código aqui