# Exercício 1 – Teórico: Fundamentos de RAG

Explique, com suas próprias palavras:

1. O que é RAG (Retrieval-Augmented Generation) e qual problema ele resolve na geração de texto usando modelos de linguagem?
2. Quais são as vantagens de utilizar RAG em vez de depender apenas do modelo base?
3. Quais são as principais etapas de um pipeline de RAG? Explique brevemente cada uma das seguintes fases:
- Chunking
- Indexing
- Retrieval
- Reranking
- Geração (Generation)

# Exercício 2 – Prático: Chunking de Documentos

Implemente uma função que realiza o *chunking* de um documento de texto longo.

Requisitos:
- A função deve dividir o texto em pedaços (chunks) de tamanho configurável (ex.: 500 tokens ou 1000 caracteres).
- Deve permitir uma sobreposição (*overlap*) entre os chunks (ex.: 20% de sobreposição).
- O output esperado é uma lista de chunks.

Exemplo de uso esperado:
```python
chunks = chunk_text(long_text, chunk_size=500, overlap=100)
```

# Exercício 3 – Prático: Indexação Vetorial

Com os chunks criados no exercício anterior:

1. Gere embeddings para cada chunk usando um modelo de embeddings (ex.: `sentence-transformers`, OpenAI embeddings ou outro de sua escolha).
2. Crie um índice vetorial (FAISS, ChromaDB, Elasticsearch, etc.).
3. Implemente uma função para realizar buscas no índice, retornando os Top-K documentos mais similares a uma query.

Exemplo de uso esperado:
```python
results = search_index(query="Qual o impacto da inflação?", top_k=5)
```

# Exercício 4 – Prático: Recuperação de Contexto + Geração de Resposta

Implemente uma função que faça o seguinte:

1. Receba uma query do usuário.
2. Recupere os Top-K chunks mais relevantes do índice vetorial.
3. Monte um *prompt* contendo a query + os textos dos chunks recuperados.
4. Envie o prompt para um LLM (ex.: OpenAI, Mistral, Llama ou outro) para gerar uma resposta.

Exemplo de uso esperado:
```python
response = rag_pipeline(query="Explique o conceito de inflação")
print(response)
```

# Exercício 5 – Prático: Reranking

Implemente uma etapa de reranking para melhorar a qualidade dos documentos recuperados:

1. Após o retrieval inicial (ex.: Top-10), use um modelo de reranking (ex.: um `cross-encoder` da `sentence-transformers`) para reordenar os documentos com base na relevância para a query.
2. Compare as respostas geradas pelo RAG antes e depois do reranking.
3. Discuta brevemente se o reranking trouxe melhorias na qualidade da resposta.

Exemplo de uso esperado:
```python
ranked_results = rerank(query, retrieved_docs)
response = generate_answer(query, ranked_results)
```