# Mini RAG - Abordagem Procedural Passo a Passo

Este notebook demonstra como criar um sistema RAG (Retrieval-Augmented Generation) completo usando uma abordagem **procedural** e **did√°tica**.

## O que √© RAG?

RAG √© uma t√©cnica que combina:
- **Recupera√ß√£o de informa√ß√µes** (busca em documentos)
- **Gera√ß√£o de texto** (usando um LLM)

Com RAG, o LLM pode responder perguntas baseadas em documentos espec√≠ficos (como PDFs, manuais, etc.) ao inv√©s de apenas usar seu conhecimento geral.

## Fluxo Completo do RAG

```
1. üìÑ Carregar documentos (PDFs)
2. ‚úÇÔ∏è  Dividir em chunks (peda√ßos menores)
3. üßÆ Criar embeddings (vetores num√©ricos)
4. üíæ Armazenar no banco vetorial (FAISS)
5. üîç Buscar chunks relevantes
6. üìù Formatar contexto
7. üí¨ Criar prompt
8. ü§ñ Gerar resposta com LLM
```

Vamos seguir cada passo!

## Passo 1: Importar Bibliotecas

Primeiro, importamos todas as bibliotecas necess√°rias para construir nosso sistema RAG.

In [60]:
import os
import requests
from pathlib import Path
from dotenv import load_dotenv
from langchain_community.vectorstores import FAISS

from langchain_ollama import OllamaEmbeddings, OllamaLLM
from langchain_core.prompts import PromptTemplate
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_community.document_loaders import PyPDFLoader



## Passo 2: Configurar Ambiente

Definimos as configura√ß√µes b√°sicas:
- URL do Ollama (servidor local de LLMs)
- Caminho para os PDFs que ser√£o processados

In [61]:
# Configura√ß√µes iniciais (par√¢metros simples)
OLLAMA_BASE_URL = 'http://localhost:11434'
BASE_DIR = Path(__file__).parent if "__file__" in globals() else Path.cwd()
PDF_DIR = BASE_DIR.parent.parent / "data" / "pdfs"

# Modelos
EMBEDDING_MODEL = 'embeddinggemma'
LLM_MODEL = 'llama3.2:1b'

print(f"üìÅ Diret√≥rio de PDFs: {PDF_DIR}")
print(f"ü§ñ Ollama URL: {OLLAMA_BASE_URL}")

üìÅ Diret√≥rio de PDFs: e:\01-projetos\11-work\11.34-engenharia-vetorial\data\pdfs
ü§ñ Ollama URL: http://localhost:11434


In [62]:
# Checagem m√≠nima de ambiente (caminho feliz)
print('Verificando Ollama...')
resp = requests.post(f"{OLLAMA_BASE_URL}/api/show")
print('Ollama status:', resp.status_code)
print('Modelo de embedding:', EMBEDDING_MODEL)
print('Modelo LLM:', LLM_MODEL)

# Import opcional para exibi√ß√£o
from IPython.display import Markdown, display
import pandas as pd

Verificando Ollama...
Ollama status: 400
Modelo de embedding: embeddinggemma
Modelo LLM: llama3.2:1b


## Passo 3: Carregar Documentos (PDFs)

**O que acontece aqui?**
- Localizamos todos os arquivos PDF na pasta `data/pdfs/`
- Carregamos cada PDF usando o `PyPDFLoader`
- Cada p√°gina do PDF vira um documento separado

**Resultado:** Uma lista de documentos, onde cada documento = 1 p√°gina de PDF

In [63]:
# L√™ os documentos
documents = []

pdf_paths = list(PDF_DIR.glob("*.pdf"))
print(f"üìö Encontrados {len(pdf_paths)} PDFs\n")

for pdf_path in pdf_paths:
    loader = PyPDFLoader(str(pdf_path))
    docs = loader.load()
    documents.extend(docs)
    print(f"  ‚úì {pdf_path.name}: {len(docs)} p√°ginas")
    
print(f"üìÑ Total de documentos carregados: {len(documents)}")

incorrect startxref pointer(1)
parsing for Object Streams
incorrect startxref pointer(1)
parsing for Object Streams
incorrect startxref pointer(1)
parsing for Object Streams
incorrect startxref pointer(1)
parsing for Object Streams


üìö Encontrados 4 PDFs

  ‚úì api_documentation.pdf: 3 p√°ginas
  ‚úì livro_receitas.pdf: 5 p√°ginas
  ‚úì manual_futebol.pdf: 4 p√°ginas
  ‚úì manual_iphone15.pdf: 3 p√°ginas
üìÑ Total de documentos carregados: 15


## Passo 4: Dividir em Chunks (Chunking)

**Por que fazer isso?**
- P√°ginas de PDF podem ser muito grandes
- LLMs t√™m limite de tokens
- Chunks menores = buscas mais precisas

**Configura√ß√µes:**
- `chunk_size=1000`: Cada chunk ter√° ~1000 caracteres
- `chunk_overlap=200`: Overlap de 200 chars entre chunks consecutivos (evita cortar frases importantes)
- `separators`: Prioriza quebras em par√°grafos (`\n\n`), depois linhas (`\n`), depois espa√ßos

**Resultado:** Uma lista de chunks (peda√ßos) menores e mais gerenci√°veis

In [64]:
# Par√¢metros de chunking / busca
CHUNK_SIZE = 1000
CHUNK_OVERLAP = 200
SEPARATORS = ["\n\n", "\n", " ", ""]

print(f"üî¢ Par√¢metros: chunk_size={CHUNK_SIZE}, chunk_overlap={CHUNK_OVERLAP}")

# Divide os documentos em chunks (usa par√¢metros do topo)
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=CHUNK_SIZE,
    chunk_overlap=CHUNK_OVERLAP,
    length_function=len,
    separators=SEPARATORS,
)

chunks = text_splitter.split_documents(documents=documents)

print(f"‚úÇÔ∏è  Total de chunks criados: {len(chunks)}")
print(f"üìä Expans√£o de chunking: {len(chunks)/len(documents):.1f}x")

üî¢ Par√¢metros: chunk_size=1000, chunk_overlap=200
‚úÇÔ∏è  Total de chunks criados: 33
üìä Expans√£o de chunking: 2.2x


## Passo 5: Criar Embeddings

**O que s√£o embeddings?**
- S√£o vetores num√©ricos (listas de n√∫meros) que representam o significado do texto
- Textos com significados similares t√™m vetores similares

**Modelo usado:** `embeddinggemma` (Modelo do Google, roda localmente via Ollama)

**Por que isso √© importante?**
- Permite buscar documentos por **significado**, n√£o apenas por palavras-chave
- Exemplo: "como fazer caf√©" encontrar√° textos sobre "preparar bebida quente" mesmo sem a palavra "caf√©"

In [65]:
# Cria os embeddings dos chunks (usa EMBEDDING_MODEL simples)
embeddings = OllamaEmbeddings(
    model=EMBEDDING_MODEL, 
    base_url=OLLAMA_BASE_URL
)

print(f"üß† Modelo de embeddings: {EMBEDDING_MODEL}")
print("‚úÖ Embeddings configurados!")

üß† Modelo de embeddings: embeddinggemma
‚úÖ Embeddings configurados!


## Passo 6: Armazenar no Banco Vetorial (FAISS)

**O que √© FAISS?**
- Biblioteca da Meta (Facebook) para busca eficiente de vetores
- Armazena todos os embeddings e permite buscas r√°pidas

**O que acontece aqui?**
1. Cada chunk √© convertido em embedding (vetor)
2. Todos os vetores s√£o indexados no FAISS
3. Agora podemos fazer buscas por similaridade!

**Analogia:** √â como criar um √≠ndice de biblioteca, mas baseado no **significado** ao inv√©s de ordem alfab√©tica

In [66]:
# Cria vectorstore (caminho feliz)
print("‚è≥ Criando √≠ndice FAISS (isso pode demorar alguns minutos...)\n")

vectorstore = FAISS.from_documents(
    documents=chunks, 
    embedding=embeddings
)

print(f"\n‚úÖ Vectorstore criado!")
print(f"üìä Total de vetores indexados: {vectorstore.index.ntotal}")
print(f"üìê Dimens√µes dos embeddings: {vectorstore.index.d}")

‚è≥ Criando √≠ndice FAISS (isso pode demorar alguns minutos...)


‚úÖ Vectorstore criado!
üìä Total de vetores indexados: 33
üìê Dimens√µes dos embeddings: 768


In [78]:
# Cria o retriever (modo simples)
retriever = vectorstore.as_retriever(search_kwargs={"k": 4})
print("üîç Retriever criado (k=4)")

üîç Retriever criado (k=4)


## Passo 7: Buscar Documentos Relevantes (Retrieval)

**O cora√ß√£o do RAG!**

Aqui fazemos a **busca sem√¢ntica**:
1. Transformamos a pergunta em embedding (vetor)
2. Comparamos com todos os embeddings dos chunks
3. Retornamos os `k=4` chunks mais similares

**M√©trica de similaridade:** Dist√¢ncia cosseno (quanto menor, mais similar)

**Resultado:** Os 4 chunks que melhor respondem √† pergunta

In [68]:
# Query de teste (caminho feliz usando retriever quando dispon√≠vel)
query_futebol = "Quais s√£o as principais forma√ß√µes t√°ticas do futebol?"

# Usa retriever.invoke se dispon√≠vel, sen√£o fallback para similarity_search
if hasattr(retriever, 'invoke'):
    relevant_documents = retriever.invoke(query_futebol)
    relevant_scores = [None] * len(relevant_documents)
else:
    relevant_documents = vectorstore.similarity_search(query_futebol, k=K)
    relevant_scores = [None] * len(relevant_documents)

print(f"‚úÖ Documentos retornados: {len(relevant_documents)}")
# Exibe em formato tabular
rows = []
for d in relevant_documents:
    rows.append({'source': d.metadata.get('source', 'N/A'), 'page': d.metadata.get('page', 'N/A'), 'snippet': d.page_content[:200].replace('\n', ' ')})
df = pd.DataFrame(rows)
display(df)

‚úÖ Documentos retornados: 4


Unnamed: 0,source,page,snippet
0,e:\01-projetos\11-work\11.34-engenharia-vetori...,2,Forma√ß√µes T√°ticas Cl√°ssicas 4-4-2 (Forma√ß√£o Eq...
1,e:\01-projetos\11-work\11.34-engenharia-vetori...,3, Mant√©m organiza√ß√£o espacial do time  Dificu...
2,e:\01-projetos\11-work\11.34-engenharia-vetori...,2,Forma√ß√£o ofensiva popularizada pelo Barcelona ...
3,e:\01-projetos\11-work\11.34-engenharia-vetori...,3,4-2-3-1 (Forma√ß√£o Moderna de Controle): Sistem...


## Passo 8: Formatar o Contexto

**Por que fazer isso?**
- O LLM precisa receber os chunks em formato de texto
- Juntamos os 4 chunks recuperados com `\n\n` (quebra de par√°grafo)

**Resultado:** Um √∫nico texto contendo todo o contexto relevante para responder √† pergunta

In [79]:
# Formata os documentos (usa os relevant_documents obtidos acima)
formatted_documents = '\n\n'.join(doc.page_content for doc in relevant_documents)

# Passa os documentos formatados para o contexto
context = formatted_documents
question = query_futebol

# Mostra o prompt gerado (preview)
prompt_result = prompt.invoke({'context': context, 'question': question})
text = getattr(prompt_result, 'text', str(prompt_result))
clean = text.replace('\x7f', '‚Ä¢')
display(Markdown(f"```text\n{clean[:1000]}\n```"))

```text
Use o seguinte contexto para responder √† pergunta.
Se voc√™ n√£o souber a resposta baseado no contexto, diga "N√£o encontrei essa informa√ß√£o nos documentos fornecidos."

Importante: Cite sempre a fonte (nome do arquivo e p√°gina) quando poss√≠vel.

Contexto:
Forma√ß√µes T√°ticas Cl√°ssicas
4-4-2 (Forma√ß√£o Equilibrada Cl√°ssica):
A forma√ß√£o mais tradicional e equilibrada do futebol moderno.
Estrutura:
‚Ä¢ 4 defensores: 2 laterais (direito e esquerdo) + 2 zagueiros centrais
‚Ä¢ 4 meio-campistas: 2 alas (direita e esquerda) + 2 volantes/meias centrais
‚Ä¢ 2 atacantes: dupla de centroavantes
Caracter√≠sticas:
‚Ä¢ Boa cobertura defensiva com linha de 4 zagueiros
‚Ä¢ Meio-campo povoado permite controle do jogo
‚Ä¢ Dupla de ataque facilita cruzamentos e jogadas a√©reas
‚Ä¢ Laterais t√™m liberdade para apoiar o ataque
‚Ä¢ Compacta: dist√¢ncia curta entre linhas (ideal 10-12 metros)
Varia√ß√£o 4-4-2 losango:
‚Ä¢ 1 volante de conten√ß√£o
‚Ä¢ 2 meias laterais
‚Ä¢ 1 meia armador (ponta do losango)
‚Ä¢ Mais controle no meio, menos largura

```

## Passo 9: Criar o Prompt

**O que √© um prompt?**
- √â a instru√ß√£o que damos ao LLM
- Define como o LLM deve responder

**Elementos do nosso prompt:**
1. **Instru√ß√£o:** "Use o seguinte contexto para responder"
2. **Regra:** "Se n√£o souber, diga que n√£o encontrou"
3. **Contexto:** Os chunks recuperados
4. **Pergunta:** A pergunta do usu√°rio

**Template pattern:** Usamos `{context}` e `{question}` como placeholders que ser√£o preenchidos depois

In [70]:

# Template de prompt customizado
template = """Use o seguinte contexto para responder √† pergunta.
Se voc√™ n√£o souber a resposta baseado no contexto, diga "N√£o encontrei essa informa√ß√£o nos documentos fornecidos."

Importante: Cite sempre a fonte (nome do arquivo e p√°gina) quando poss√≠vel.

Contexto:
{context}

Pergunta: {question}

Resposta detalhada:"""

# Cria√ß√£o do PromptTemplate utilizando o template acima
prompt = PromptTemplate(template=template, input_variables=['context', 'question'])

print("üìù Prompt template criado!")



üìù Prompt template criado!


### Preencher o Prompt

Agora substitu√≠mos os placeholders `{context}` e `{question}` pelos valores reais:
- `context` = os chunks formatados
- `question` = a pergunta do usu√°rio

**Resultado:** Um prompt completo, pronto para ser enviado ao LLM

In [71]:
from IPython.display import Markdown, display

# Passa context e question para o prompt e retorna o resultado
prompt_result = prompt.invoke({'context': context, 'question': question})

text = getattr(prompt_result, "text", str(prompt_result))
clean = text.replace("\\x7f", "‚Ä¢")     # substitui caractere de controle por s√≠mbolo vis√≠vel
display(Markdown(f"```text\n{clean}\n```"))

```text
Use o seguinte contexto para responder √† pergunta.
Se voc√™ n√£o souber a resposta baseado no contexto, diga "N√£o encontrei essa informa√ß√£o nos documentos fornecidos."

Importante: Cite sempre a fonte (nome do arquivo e p√°gina) quando poss√≠vel.

Contexto:
Forma√ß√µes T√°ticas Cl√°ssicas
4-4-2 (Forma√ß√£o Equilibrada Cl√°ssica):
A forma√ß√£o mais tradicional e equilibrada do futebol moderno.
Estrutura:
 4 defensores: 2 laterais (direito e esquerdo) + 2 zagueiros centrais
 4 meio-campistas: 2 alas (direita e esquerda) + 2 volantes/meias centrais
 2 atacantes: dupla de centroavantes
Caracter√≠sticas:
 Boa cobertura defensiva com linha de 4 zagueiros
 Meio-campo povoado permite controle do jogo
 Dupla de ataque facilita cruzamentos e jogadas a√©reas
 Laterais t√™m liberdade para apoiar o ataque
 Compacta: dist√¢ncia curta entre linhas (ideal 10-12 metros)
Varia√ß√£o 4-4-2 losango:
 1 volante de conten√ß√£o
 2 meias laterais
 1 meia armador (ponta do losango)
 Mais controle no meio, menos largura
4-3-3 (Forma√ß√£o Ofensiva com Wingers):
Forma√ß√£o ofensiva popularizada pelo Barcelona e Liverpool.
Estrutura:
 4 defensores: mesma linha do 4-4-2
 3 meio-campistas: 1 volante + 2 meias (ou 2 volantes + 1 meia)

 Mant√©m organiza√ß√£o espacial do time
 Dificulta movimenta√ß√£o advers√°ria
Marca√ß√£o Individual:
 Cada defensor marca um atacante espec√≠fico
 Segue o advers√°rio por todo o campo
 Usado em bolas paradas
 Arriscado: pode ser desorganizado com movimenta√ß√µes
Marca√ß√£o Press√£o:
 Pressionar advers√°rio com a bola imediatamente
 Reduzir tempo e espa√ßo para pensar
 For√ßar erros e recuperar bola no campo de ataque
 Exige condicionamento f√≠sico excepcional
 Popularizado por Klopp (Gegenpressing)
Transi√ß√µes R√°pidas (Contra-ataque):
 Velocidade na passagem defesa-ataque
 Aproveitar desorganiza√ß√£o advers√°ria
 Lan√ßamentos longos ou passes r√°pidos
 Jogadores velozes nas pontas
Posse de Bola (Tiki-Taka):
 Manter posse com passes curtos
 Movimenta√ß√£o constante sem bola
 Tri√¢ngulos de passe (3 jogadores pr√≥ximos)
 Cansar advers√°rio e controlar ritmo
 Popularizado pelo Barcelona de Guardiola

Forma√ß√£o ofensiva popularizada pelo Barcelona e Liverpool.
Estrutura:
 4 defensores: mesma linha do 4-4-2
 3 meio-campistas: 1 volante + 2 meias (ou 2 volantes + 1 meia)
 3 atacantes: 1 centroavante + 2 extremos/pontas (abertos)
Caracter√≠sticas:
 Alta amplitude ofensiva (tr√™s atacantes abertos)
 Dom√≠nio de posse com tri√¢ngulos no meio-campo
 Pontas cortam para dentro ou ficam abertos para receber
 Exige laterais com boa condi√ß√£o f√≠sica (cobrem toda a lateral)
 Volante crucial como "piv√¥" entre defesa e ataque
Varia√ß√£o 4-3-3 falso 9:
 Centroavante recua para criar espa√ßo
 Pontas infiltram na √°rea deixada pelo 9
 Meia armador sobe para ocupar posi√ß√£o de 10
3-5-2 (Forma√ß√£o com Ala-defensores):
Sistema com tr√™s zagueiros e dom√≠nio do meio-campo.
Estrutura:
 3 defensores: zagueiro central (l√≠bero) + 2 zagueiros laterais
 5 meio-campistas: 2 alas (wing-backs) + 3 meio-campistas centrais
 2 atacantes: dupla de centroavantes
Caracter√≠sticas:

4-2-3-1 (Forma√ß√£o Moderna de Controle):
Sistema t√°tico mais usado por sele√ß√µes nas √∫ltimas Copas do Mundo.
Estrutura:
 4 defensores: linha tradicional
 2 volantes: dupla de conten√ß√£o
 3 meio-atacantes: 2 meias abertos + 1 meia central (camisa 10)
 1 centroavante: refer√™ncia fixa
Caracter√≠sticas:
 Dupla de volantes protege a defesa
 Meia central (#10) tem liberdade criativa
 Transi√ß√µes r√°pidas com meias abertos em velocidade
 Centroavante segura a bola e finaliza
 Compacto defensivamente, fluido no ataque
Varia para 4-4-2 na defesa:
 Meia central recua para linha do meio
 Meias abertos fecham como alas
 Atacante n√£o fica isolado (meia d√° apoio)
Conceitos T√°ticos Modernos:
Marca√ß√£o por Zona:
 Cada jogador respons√°vel por uma zona do campo
 Marca o advers√°rio que entrar em sua zona
 Mant√©m organiza√ß√£o espacial do time
 Dificulta movimenta√ß√£o advers√°ria
Marca√ß√£o Individual:
 Cada defensor marca um atacante espec√≠fico
 Segue o advers√°rio por todo o campo

Pergunta: Quais s√£o as principais forma√ß√µes t√°ticas do futebol?

Resposta detalhada:
```

### Criar o LLM

**Modelo usado:** `llama3.2:1b` (vers√£o compacta do Llama 3.2)

**Por que usar Ollama?**
- Roda **localmente** (sem enviar dados para a nuvem)
- **Gratuito** (sem custos de API)
- **Privado** (seus documentos ficam no seu computador)

O modelo receber√° o prompt e gerar√° a resposta final!

In [72]:
# Cria o LLM (caminho feliz)
llm = OllamaLLM(model=LLM_MODEL, base_url=OLLAMA_BASE_URL)
print(f"ü§ñ LLM configurado: {LLM_MODEL}")

ü§ñ LLM configurado: llama3.2:1b


## Passo 10: Gerar a Resposta

**O momento final!**

Aqui o LLM:
1. Recebe o prompt completo (instru√ß√£o + contexto + pergunta)
2. Analisa os chunks recuperados
3. Gera uma resposta baseada **apenas** no contexto fornecido

**Importante:** A resposta ser√° espec√≠fica dos seus PDFs, n√£o do conhecimento geral do modelo!

In [73]:
# Invoca o LLM com o prompt completo
response = llm.invoke(prompt_result)

# Exibe a resposta
print("ü§ñ Resposta do LLM:")
print("=" * 80)
print(response)
print("=" * 80)

ü§ñ Resposta do LLM:
Com base no contexto fornecido, aqui est√£o as principais forma√ß√µes t√°ticas do futebol:

1. **4-4-2 (Forma√ß√£o Equilibrada Cl√°ssica)**:
   - 4 defensores: 2 laterais + 2 zagueiros centrais
   - 4 meio-campistas: 2 alas + 2 volantes/meias centrais
   - 2 atacantes: dupla de centroavantes

2. **4-3-3 (Forma√ß√£o Ofensiva com Wingers)**:
   - 4 defensores: linha do 4-4-2
   - 3 meio-campistas: volante + meias laterais
   - 2 atacantes: dupla de centroavantes

3. **4-2-3-1 (Forma√ß√£o Moderna de Controle)**:
   - 4 defensores: linha tradicional
   - 2 volantes: dupla de conten√ß√£o
   - 3 meio-campistas: meias abertos + meia central
   - 1 centroavante

4. **4-4-2 Losango**:
   - 1 volante de conten√ß√£o
   - 2 meias laterais
   - 1 meia armador (ponta do losango)
   - Maior controle no meio, menos largura

5. **3-5-2**:
   - Sistema com tr√™s zagueiros e dom√≠nio do meio-campo
   - 2 atacantes: dupla de centroavantes

6. **3-4-3**:
   - Sistema com tr√™s zagueir

In [74]:
# Quick Run: executa prompt -> llm e exibe resposta
response = llm.invoke(prompt_result)

print("ü§ñ Resposta do LLM:")
print("=" * 80)
print(response)
print("=" * 80)

display(Markdown('**Dica:** para vers√£o com chains e streaming veja: [lab_3.4_microrag_chain_lcel.ipynb](lab_3.4_microrag_chain_lcel.ipynb)'))

ü§ñ Resposta do LLM:
A resposta √† sua pergunta sobre as principais forma√ß√µes t√°ticas do futebol inclui v√°rias estruturas e conceitos que variam em termos de n√∫mero de defensores, meio-campistas e atacantes. Aqui est√° uma resumo detalhado das principais forma√ß√µes mencionadas:

1. **4-2 (Forma√ß√£o Equilibrada Cl√°ssica)**: Esta √© a forma√ß√£o mais tradicional e equilibrada do futebol moderno, com 4 defensores, 2 laterais e 2 zagueiros centrais. Caracteriza-se por uma boa cobertura defensiva, meio-campo povoado para controle do jogo e dupla de ataque com jogadores que podem jogar como alas ou volantes.

2. **4-3-3**: Esta forma√ß√£o popularizada pelo Barcelona e Liverpool mant√©m a organiza√ß√£o espacial do time tradicionalmente, com 4 defensores, 3 meio-campistas e 2 atacantes. O sistema de marca√ß√£o individual permite que cada jogador crie uma zona de controle no campo, enquanto a diferen√ßa entre o centroavante e os extremos cria um elemento de press√£o nos jogadores adver

**Dica:** para vers√£o com chains e streaming veja: [lab_3.4_microrag_chain_lcel.ipynb](lab_3.4_microrag_chain_lcel.ipynb)

## Passo 11 (Opcional): An√°lise das Fontes

Vamos verificar quais chunks foram recuperados e usados como contexto.

In [75]:
# Exibe os documentos recuperados
print("üìö Documentos usados como fonte:\n")

for i, doc in enumerate(relevant_documents, 1):
    print(f"Documento {i}:")
    print(f"Fonte: {doc.metadata.get('source', 'N/A')}")
    print(f"P√°gina: {doc.metadata.get('page', 'N/A')}")
    print(f"Conte√∫do (primeiros 200 chars):\n{doc.page_content[:200]}...")
    print("-" * 80)

üìö Documentos usados como fonte:

Documento 1:
Fonte: e:\01-projetos\11-work\11.34-engenharia-vetorial\data\pdfs\manual_futebol.pdf
P√°gina: 2
Conte√∫do (primeiros 200 chars):
Forma√ß√µes T√°ticas Cl√°ssicas
4-4-2 (Forma√ß√£o Equilibrada Cl√°ssica):
A forma√ß√£o mais tradicional e equilibrada do futebol moderno.
Estrutura:
 4 defensores: 2 laterais (direito e esquerdo) + 2 zagueiro...
--------------------------------------------------------------------------------
Documento 2:
Fonte: e:\01-projetos\11-work\11.34-engenharia-vetorial\data\pdfs\manual_futebol.pdf
P√°gina: 3
Conte√∫do (primeiros 200 chars):
 Mant√©m organiza√ß√£o espacial do time
 Dificulta movimenta√ß√£o advers√°ria
Marca√ß√£o Individual:
 Cada defensor marca um atacante espec√≠fico
 Segue o advers√°rio por todo o campo
 Usado em bolas parad...
--------------------------------------------------------------------------------
Documento 3:
Fonte: e:\01-projetos\11-work\11.34-engenharia-vetorial\data\pdfs\manual_futeb

## Passo 12 (Opcional): Teste com Outra Pergunta

Agora vamos testar com uma pergunta diferente para ver como o sistema se comporta.

In [76]:
# Nova pergunta
query_receita = "Como fazer uma lasanha?"

# Busca documentos relevantes
relevant_documents_2 = vectorstore.similarity_search(query_receita, k=4)

# Formata contexto
context_2 = '\n\n'.join(doc.page_content for doc in relevant_documents_2)

# Preenche o prompt
prompt_result_2 = prompt.invoke({'context': context_2, 'question': query_receita})

# Gera resposta
response_2 = llm.invoke(prompt_result_2)

# Exibe
print(f"Pergunta: {query_receita}\n")
print("ü§ñ Resposta:")
print("=" * 80)
print(response_2)
print("=" * 80)

Pergunta: Como fazer uma lasanha?

ü§ñ Resposta:
Para criar uma lasanha t√≠pica, voc√™ precisar√° seguir os passos abaixo. A seguir est√£o as instru√ß√µes detalhadas para obter resultados finais.

### Para a lasanha:

#### Ingredientes:
- 500g de massa fresca (ou 600g se estiver usando massa fresca)
- 400g de mu√ßarela ralada
- 200g de presunto fatiado
- 100g de parmes√£o ralado

### Modo de Preparo:

1. **Preaque√ßa o forno**: Pr√©-aque√ßa o forno a 180¬∞C.
2. **Montagem da lasanha**: 
   - Pr√©-aque√ßa um refrat√°rio grande (35x25cm) em manteiga, at√© ficar suave e √∫mida.  
   - Espalhe 2 conchas de molho bolonhesa no fundo do refrat√°rio.
   - Fa√ßa a primeira camada de massa para as lasanhas sobrepondo levemente as placas.
   - Espalhe molho bolonhesa, depois molho branco, presunto e mu√ßarela. Repita as camadas: massa, molho branco, presunto, mu√ßarela at√© completar os ingredientes, finalizando com uma camada de queijos.

3. **Finalize**: Espalhe parmes√£o ralado por cima.
4. *

## üìä An√°lise do Sistema RAG

Vamos entender melhor o que nosso sistema criou:

**M√©tricas importantes:**
- **Expans√£o de chunking:** Quantos chunks foram criados por p√°gina
- **Tamanho dos chunks:** Verifica se o chunking est√° balanceado
- **Dimens√µes dos embeddings:** Tamanho dos vetores (maior = mais preciso, mas mais lento)

Essas estat√≠sticas ajudam a **otimizar** o sistema para melhor performance!

In [77]:
# Estat√≠sticas do sistema
print("üìä Estat√≠sticas do Sistema RAG\n")
print("=" * 80)

print(f"Total de PDFs carregados: {len(pdf_paths)}")
print(f"Total de p√°ginas: {len(documents)}")
print(f"Total de chunks criados: {len(chunks)}")
print(f"Expans√£o de chunking: {len(chunks)/len(documents):.1f}x")

# Tamanho m√©dio dos chunks
tamanhos = [len(c.page_content) for c in chunks]
print(f"\nTamanho m√©dio dos chunks: {sum(tamanhos)/len(tamanhos):.0f} caracteres")
print(f"Tamanho m√≠nimo: {min(tamanhos)} caracteres")
print(f"Tamanho m√°ximo: {max(tamanhos)} caracteres")

# Informa√ß√µes do vectorstore
print(f"\nDimens√µes dos embeddings: {vectorstore.index.d}")
print(f"Total de vetores no √≠ndice: {vectorstore.index.ntotal}")

print("=" * 80)

üìä Estat√≠sticas do Sistema RAG

Total de PDFs carregados: 4
Total de p√°ginas: 15
Total de chunks criados: 33
Expans√£o de chunking: 2.2x

Tamanho m√©dio dos chunks: 815 caracteres
Tamanho m√≠nimo: 262 caracteres
Tamanho m√°ximo: 997 caracteres

Dimens√µes dos embeddings: 768
Total de vetores no √≠ndice: 33


---

## üéì Resumo do que Aprendemos

Parab√©ns! Voc√™ acabou de criar um sistema RAG completo do zero!

### O que fizemos:

1. ‚úÖ **Carregamos PDFs** e transformamos em documentos
2. ‚úÖ **Dividimos em chunks** para melhor processamento
3. ‚úÖ **Criamos embeddings** (vetores de significado)
4. ‚úÖ **Armazenamos no FAISS** para busca eficiente
5. ‚úÖ **Buscamos chunks relevantes** usando similaridade sem√¢ntica
6. ‚úÖ **Formatamos o contexto** para o LLM
7. ‚úÖ **Criamos um prompt** com instru√ß√µes claras
8. ‚úÖ **Geramos respostas** baseadas nos documentos

### Por que RAG √© importante?

- üìö **Conhecimento atualizado:** N√£o precisa retreinar o modelo
- üéØ **Respostas espec√≠ficas:** Baseadas nos seus documentos
- üîí **Privacidade:** Tudo roda localmente
- üí∞ **Custo:** Sem APIs pagas (usando Ollama)

### Pr√≥ximos passos:

- Experimente com diferentes `chunk_size` e `chunk_overlap`
- Teste outros modelos de embeddings
- Compare modelos de LLM diferentes
- Adicione mais PDFs e veja como o sistema escala

**Dica:** Para produ√ß√£o, considere usar bancos vetoriais mais robustos como Qdrant ou Pinecone!