## üì¶ Passo 1: Importar Bibliotecas

**Novidades neste notebook:**
- `RunnablePassthrough`: Permite passar dados atrav√©s da chain
- `StrOutputParser`: Formata a sa√≠da do LLM como string limpa
- Usaremos o operador `|` para criar chains!

In [1]:
import os
import requests
from pathlib import Path
from dotenv import load_dotenv

from langchain_community.vectorstores import FAISS
from langchain_ollama import OllamaEmbeddings, OllamaLLM
from langchain_core.prompts import PromptTemplate
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_community.document_loaders import PyPDFLoader

# Imports para LCEL (Chains)
from langchain_core.runnables import RunnablePassthrough
from langchain_core.output_parsers import StrOutputParser

## ‚öôÔ∏è Passo 2: Configurar Ambiente

Mesma configura√ß√£o do notebook anterior.

In [2]:
# Configura√ß√µes iniciais
OLLAMA_BASE_URL = 'http://localhost:11434'
BASE_DIR = Path(__file__).parent if "__file__" in globals() else Path.cwd()
PDF_DIR = BASE_DIR.parent.parent / "data" / "pdfs"

print(f"üìÅ Diret√≥rio de PDFs: {PDF_DIR}")
print(f"ü§ñ Ollama URL: {OLLAMA_BASE_URL}")

üìÅ Diret√≥rio de PDFs: e:\01-projetos\11-work\11.34-engenharia-vetorial\data\pdfs
ü§ñ Ollama URL: http://localhost:11434


## üìÑ Passo 3: Carregar Documentos

Carregamos todos os PDFs da pasta `data/pdfs/`.

In [3]:
# Carrega os documentos
documents = []

pdf_paths = list(PDF_DIR.glob("*.pdf"))
print(f"üìö Encontrados {len(pdf_paths)} PDFs\n")

for pdf_path in pdf_paths:
    loader = PyPDFLoader(str(pdf_path))
    docs = loader.load()
    documents.extend(docs)
    print(f"  ‚úì {pdf_path.name}: {len(docs)} p√°ginas")

print(f"\n‚úÖ Total de p√°ginas carregadas: {len(documents)}")

incorrect startxref pointer(1)
parsing for Object Streams
incorrect startxref pointer(1)
parsing for Object Streams
incorrect startxref pointer(1)
parsing for Object Streams
incorrect startxref pointer(1)
parsing for Object Streams


üìö Encontrados 4 PDFs

  ‚úì api_documentation.pdf: 3 p√°ginas
  ‚úì livro_receitas.pdf: 5 p√°ginas
  ‚úì manual_futebol.pdf: 4 p√°ginas
  ‚úì manual_iphone15.pdf: 3 p√°ginas

‚úÖ Total de p√°ginas carregadas: 15


## ‚úÇÔ∏è Passo 4: Dividir em Chunks

**Chunking strategy:**
- `chunk_size=1000`: Chunks de ~1000 caracteres
- `chunk_overlap=200`: Overlap para n√£o perder contexto nas bordas
- `separators`: Prioriza quebras naturais (par√°grafos ‚Üí linhas ‚Üí espa√ßos)

In [4]:
# Chunking
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000,
    chunk_overlap=200,
    length_function=len,
    separators=["\n\n", "\n", " ", ""]
)

chunks = text_splitter.split_documents(documents=documents)

print(f"‚úÇÔ∏è  Total de chunks criados: {len(chunks)}")
print(f"üìä Expans√£o de chunking: {len(chunks)/len(documents):.1f}x")

‚úÇÔ∏è  Total de chunks criados: 33
üìä Expans√£o de chunking: 2.2x


## üßÆ Passo 5: Criar Embeddings

Usamos o modelo `embeddinggemma` rodando localmente via Ollama.

In [None]:
# Cria embeddings
embeddings = OllamaEmbeddings(
    model='embeddinggemma', 
    base_url=OLLAMA_BASE_URL
    )

print("üß† Modelo de embeddings: embeddinggemma")
print("‚úÖ Embeddings configurados!")

üß† Modelo de embeddings: embeddinggemma
‚úÖ Embeddings configurados!


## üíæ Passo 6: Criar Vectorstore FAISS

Indexamos todos os chunks no FAISS para busca eficiente.

**Aten√ß√£o:** Este passo pode demorar alguns minutos dependendo da quantidade de chunks!

In [None]:
# Cria vectorstore
print("‚è≥ Criando √≠ndice FAISS (isso pode demorar alguns minutos...)\n")

vectorstore = FAISS.from_documents(
    documents=chunks, 
    embedding=embeddings
    )

print(f"\n‚úÖ Vectorstore criado!")
print(f"üìä Total de vetores indexados: {vectorstore.index.ntotal}")
print(f"üìê Dimens√µes dos embeddings: {vectorstore.index.d}")

‚è≥ Criando √≠ndice FAISS (isso pode demorar alguns minutos...)


‚úÖ Vectorstore criado!
üìä Total de vetores indexados: 33
üìê Dimens√µes dos embeddings: 768


## üîç Passo 7: Criar Retriever

### O que √© um Retriever?

Um **retriever** √© um componente do LangChain que encapsula a busca no vectorstore.

**Diferen√ßa:**

```python
# Abordagem manual:
docs = vectorstore.similarity_search(query, k=4)

# Usando Retriever:
retriever = vectorstore.as_retriever(search_kwargs={"k": 4})
docs = retriever.invoke(query)  # Mesmo resultado!
```

### Por que usar Retriever?

‚úÖ **Compat√≠vel com Chains:** Pode ser encadeado com `|`  
‚úÖ **Interface padronizada:** Funciona com qualquer vectorstore  
‚úÖ **Configur√°vel:** F√°cil trocar estrat√©gias de busca  
‚úÖ **Runnable:** Suporta invoke, stream, batch, etc.

**Configura√ß√µes:**
- `search_kwargs={"k": 4}`: Retorna os 4 chunks mais similares
- Pode adicionar `score_threshold`, `fetch_k`, etc.

In [8]:
# Cria o retriever
retriever = vectorstore.as_retriever(
    search_type="similarity",  # Busca por similaridade
    search_kwargs={"k": 4}      # Retorna top 4 chunks
)

print("üîç Retriever criado!")
print(f"üìã Configura√ß√£o: busca os top-4 chunks mais similares")

üîç Retriever criado!
üìã Configura√ß√£o: busca os top-4 chunks mais similares


## üí¨ Passo 8: Criar o Prompt Template

O mesmo template do notebook anterior, mas agora ser√° usado dentro da chain.

In [9]:
# Template de prompt
template = """Use o seguinte contexto para responder √† pergunta.
Se voc√™ n√£o souber a resposta baseado no contexto, diga "N√£o encontrei essa informa√ß√£o nos documentos fornecidos."

Importante: Cite sempre a fonte (nome do arquivo e p√°gina) quando poss√≠vel.

Contexto:
{context}

Pergunta: {question}

Resposta detalhada:"""

prompt = PromptTemplate(
    template=template,
    input_variables=['context', 'question']
)

print("üìù Prompt template criado!")

üìù Prompt template criado!


## ü§ñ Passo 9: Criar o LLM

Modelo Ollama que gerar√° as respostas.

In [10]:
# Cria o LLM
llm = OllamaLLM(
    model='llama3.2:1b', 
    base_url=OLLAMA_BASE_URL
    )

print("ü§ñ LLM configurado: llama3.2:1b")

ü§ñ LLM configurado: llama3.2:1b


In [11]:
# Fun√ß√£o helper para formatar documentos
def format_docs(docs):
    """Formata lista de documentos em string √∫nica."""
    return "\n\n".join(doc.page_content for doc in docs)



## üîó Passo 10: Criar a Chain RAG com LCEL

### üéØ Este √© o cora√ß√£o do notebook!

Vamos criar uma **chain** que automatiza todo o processo RAG usando o operador `|` (pipe).

### Anatomia da Chain:

```python
chain = (
    {
     "context": retriever | format_docs, 
     "question": RunnablePassthrough()
    }
    | prompt
    | llm
    | StrOutputParser()
)
```

### O que cada parte faz?

1Ô∏è‚É£ `{"context": ..., "question": ...}`
Cria um dicion√°rio com as vari√°veis que o prompt precisa:

- **`"context": retriever | format_docs`**
  - Pega a pergunta ‚Üí busca no vectorstore ‚Üí formata os docs
  - `retriever`: Busca os 4 chunks mais similares
  - `|`: Passa os docs para a pr√≥xima fun√ß√£o
  - `format_docs`: Junta os chunks com `\n\n`

- **`"question": RunnablePassthrough()`**
  - Passa a pergunta original sem modificar
  - `RunnablePassthrough()` = "deixa passar como est√°"

2Ô∏è‚É£ `| prompt`
- Recebe o dicion√°rio `{context: ..., question: ...}`
- Substitui os placeholders no template
- Retorna o prompt completo preenchido

3Ô∏è‚É£ `| llm`
- Recebe o prompt completo
- Gera a resposta usando o LLM
- Retorna o texto bruto

4Ô∏è‚É£ `| StrOutputParser()`
- Converte a sa√≠da do LLM em string limpa
- Remove metadados extras
- Retorna s√≥ o texto da resposta

### üé≠ Fluxo Completo:

```text
"Quais s√£o as forma√ß√µes do futebol?"
         ‚Üì
    retriever ‚Üí [doc1, doc2, doc3, doc4]
         ‚Üì
    format_docs ‚Üí "doc1\n\ndoc2\n\ndoc3\n\ndoc4"
         ‚Üì
    {context: "...", question: "Quais s√£o..."}
         ‚Üì
    prompt ‚Üí "Use o seguinte contexto... Pergunta: Quais s√£o..."
         ‚Üì
    llm ‚Üí "As principais forma√ß√µes s√£o..."
         ‚Üì
    StrOutputParser ‚Üí "As principais forma√ß√µes s√£o..."
```

### ‚ú® Vantagens:

1. **Uma linha invoca tudo:** `chain.invoke("pergunta")`
2. **Compos√°vel:** Pode adicionar mais etapas facilmente
3. **Reutiliz√°vel:** Salva e usa em outros projetos
4. **Streaming:** `chain.stream()` para respostas progressivas
5. **Async:** `await chain.ainvoke()` para execu√ß√£o ass√≠ncrona

Vamos criar!

In [12]:

# üîó Criando a Chain RAG com LCEL
rag_chain = (
    {
        "context": retriever | format_docs, 
        "question": RunnablePassthrough()
    }
    | prompt
    | llm
    | StrOutputParser()
)

print("üîó Chain RAG criada com sucesso!")
print("\nüìã Componentes da chain:")
print("  1Ô∏è‚É£  Retriever (busca documentos)")
print("  2Ô∏è‚É£  Format Docs (formata contexto)")
print("  3Ô∏è‚É£  Prompt Template (monta prompt)")
print("  4Ô∏è‚É£  LLM (gera resposta)")
print("  5Ô∏è‚É£  String Parser (formata sa√≠da)")
print("\n‚úÖ Pronta para uso!")

üîó Chain RAG criada com sucesso!

üìã Componentes da chain:
  1Ô∏è‚É£  Retriever (busca documentos)
  2Ô∏è‚É£  Format Docs (formata contexto)
  3Ô∏è‚É£  Prompt Template (monta prompt)
  4Ô∏è‚É£  LLM (gera resposta)
  5Ô∏è‚É£  String Parser (formata sa√≠da)

‚úÖ Pronta para uso!


## üöÄ Passo 11: Invocar a Chain

### Compare a simplicidade!

**Abordagem procedural (lab 3.3):**
```python
# 6 linhas de c√≥digo
relevant_documents = vectorstore.similarity_search(query, k=4)
context = '\n\n'.join(doc.page_content for doc in relevant_documents)
question = query
prompt_result = prompt.invoke({'context': context, 'question': question})
response = llm.invoke(prompt_result)
print(response)
```

**Abordagem com Chain (agora):**
```python
# 1 linha de c√≥digo!
response = rag_chain.invoke(query)
```

‚ú® **6 linhas ‚Üí 1 linha!**

In [13]:
# Pergunta de teste
query_futebol = "Quais s√£o as principais forma√ß√µes t√°ticas do futebol?"

print(f"‚ùì Pergunta: {query_futebol}\n")
print("‚è≥ Processando...\n")
print("=" * 80)

# üéØ Uma linha invoca toda a chain!
response = rag_chain.invoke(query_futebol)

print("\nü§ñ Resposta:")
print("=" * 80)
print(response)
print("=" * 80)

‚ùì Pergunta: Quais s√£o as principais forma√ß√µes t√°ticas do futebol?

‚è≥ Processando...


ü§ñ Resposta:
A resposta completa √† sua pergunta seria:

As principais forma√ß√µes t√°ticas do futebol moderno incluem:

1. 4-3-3 (Forma√ß√£o Ofensiva com Wingers): √© uma das mais conhecidas e popularizadas na atualidade. Ela combina a for√ßa vertical de dois zagueiros centrais com a agressividade de quatro atacantes que podem se encontrar juntos no meio do campo.
2. 4-4-2 (Forma√ß√£o Equilibrada Cl√°ssica): √© uma das mais tradicionais, caracterizada por uma boa cobertura defensiva com linha de 4 zagueiros e um fogo ofensivo ao ar livre com dois volantes e duas alas.
3. 4-2-3-1 (Forma√ß√£o Moderna de Controle): uma estrutura que combina a for√ßa defensiva em frente, o controle do meio-campo e um ataque bem estruturado com duplas de centroavantes.
4. 4-3-2: √© uma vers√£o mais compacta da 4-3-3, sem dois zagueiros centrais.
5. 4-2-3-1 (Forma√ß√£o Ofensiva com Press√£o): combina a organiza√ß

## üîç Passo 12: Inspecionar Documentos Recuperados

Vamos verificar quais documentos o retriever encontrou para essa pergunta.

In [14]:
# Busca manual para inspe√ß√£o
relevant_docs = retriever.invoke(query_futebol)

print(f"üìö Documentos recuperados: {len(relevant_docs)}\n")
print("=" * 80)

for i, doc in enumerate(relevant_docs, 1):
    print(f"\nüìÑ Documento {i}:")
    print(f"   Fonte: {doc.metadata.get('source', 'N/A')}")
    print(f"   P√°gina: {doc.metadata.get('page', 'N/A')}")
    print(f"   Conte√∫do (primeiros 150 chars):\n   {doc.page_content[:150]}...")
    print("-" * 80)

üìö Documentos recuperados: 4


üìÑ Documento 1:
   Fonte: e:\01-projetos\11-work\11.34-engenharia-vetorial\data\pdfs\manual_futebol.pdf
   P√°gina: 2
   Conte√∫do (primeiros 150 chars):
   Forma√ß√µes T√°ticas Cl√°ssicas
4-4-2 (Forma√ß√£o Equilibrada Cl√°ssica):
A forma√ß√£o mais tradicional e equilibrada do futebol moderno.
Estrutura:
 4 defens...
--------------------------------------------------------------------------------

üìÑ Documento 2:
   Fonte: e:\01-projetos\11-work\11.34-engenharia-vetorial\data\pdfs\manual_futebol.pdf
   P√°gina: 3
   Conte√∫do (primeiros 150 chars):
    Mant√©m organiza√ß√£o espacial do time
 Dificulta movimenta√ß√£o advers√°ria
Marca√ß√£o Individual:
 Cada defensor marca um atacante espec√≠fico
 Segue o ...
--------------------------------------------------------------------------------

üìÑ Documento 3:
   Fonte: e:\01-projetos\11-work\11.34-engenharia-vetorial\data\pdfs\manual_futebol.pdf
   P√°gina: 2
   Conte√∫do (primeiros 150 chars):
   

## üß™ Passo 13: Testar com M√∫ltiplas Perguntas

Vamos testar a chain com diferentes tipos de perguntas.

In [15]:
# Lista de perguntas de teste
test_queries = [
    "Como fazer uma lasanha?",
    "Qual a diferen√ßa entre 4-4-2 e 4-3-3 no futebol?",
    "Quais s√£o as regras do basquete?"
]

print("üß™ Testando m√∫ltiplas perguntas...\n")
print("=" * 80)

for i, query in enumerate(test_queries, 1):
    print(f"\n‚ùì Pergunta {i}: {query}")
    print("-" * 80)
    
    # Invoca a chain
    response = rag_chain.invoke(query)
    
    print(f"ü§ñ Resposta:\n{response}")
    print("=" * 80)

üß™ Testando m√∫ltiplas perguntas...


‚ùì Pergunta 1: Como fazer uma lasanha?
--------------------------------------------------------------------------------
ü§ñ Resposta:
Para fazer uma lasanha, voc√™ precisa seguir os passos descritos abaixo:

1. Pr√©-aque√ßa o forno a 180¬∞C.
2. Unte um refrat√°rio grande com manteiga.
3. Espalhe 2 conchas de molho bolonhesa no fundo do refrat√°rio.
4. Fa√ßa a primeira camada de massa para lasanha, sobrepondo levemente as placas.
5. Espalhe o molho branco (bechamel) em cima da primeira camada de massa.
6. Fa√ßa a segunda camada de massa e espalhe o molho bolonhesa por cima dela.
7. Repita as camadas: massa, molho branco, molho bolonhesa, presunto, mu√ßarela at√© terminar os ingredientes.
8. Continue at√© completar todos os ingredientes, finalizando com uma camada de massa e bechamel por √∫ltimo.
9. Polvilhe parmes√£o ralado por cima da lasanha.
10. Cubra com papel alum√≠nio e leve ao forno por 30 minutos.
11. Retire o papel alum√≠nio e deixe gra

## üåä Passo 14: Streaming de Respostas (Bonus!)

Uma das grandes vantagens de usar chains √© o suporte nativo a **streaming**!

### O que √© Streaming?

Ao inv√©s de esperar a resposta completa, voc√™ recebe **palavra por palavra** em tempo real.

**Benef√≠cios:**
- üöÄ **UX melhor:** Usu√°rio v√™ progresso imediato
- ‚è±Ô∏è **Lat√™ncia percebida:** Parece mais r√°pido
- üí¨ **Chat-like:** Experi√™ncia tipo ChatGPT

**Uso:**
```python
for chunk in rag_chain.stream(query):
    print(chunk, end="", flush=True)
```

In [16]:
# Teste com streaming
query_stream = "Quais s√£o as principais forma√ß√µes t√°ticas do futebol?"

print(f"‚ùì Pergunta: {query_stream}\n")
print("üåä Resposta (streaming):")
print("=" * 80)

# Stream da resposta palavra por palavra
for chunk in rag_chain.stream(query_stream):
    print(chunk, end="", flush=True)

print("\n" + "=" * 80)
print("\n‚úÖ Streaming conclu√≠do!")

‚ùì Pergunta: Quais s√£o as principais forma√ß√µes t√°ticas do futebol?

üåä Resposta (streaming):
As principais forma√ß√µes t√°ticas do futebol s√£o:

1. **4-2-2 (Forma√ß√£o Equilibrada Cl√°ssica)**: Com 4 defensores, 4 meio-campistas e 2 atacantes, essa forma√ß√£o √© considerada uma das mais tradicionais e equilibradas.

2. **4-3-3**: Esta forma√ß√£o mant√©m organiza√ß√£o espacial do time e difere da 4-2-2 em que as duas laterais s√£o iguais. O sistema de marca√ß√£o press√£o, popularizado pelo Barcelona de Guardiola, permite uma maior liberdade no meio-campo.

3. **4-3-1**: Usada por sele√ß√µes nas Copas do Mundo e com um foco na defesa, essa forma√ß√£o √© conhecida por sua concentra√ß√£o na linha defensiva e menos flexibilidade no ataque.

4. **5-2**: Com a presen√ßa de dois meias laterais e uma dupla de centroavantes, esta forma√ß√£o requer uma boa condi√ß√£o f√≠sica em cada um dos jogadores envolvidos e pode ser dif√≠ceis de manter em campo.

5. **3-5-2 (Forma√ß√£o com Ala-defens

## üìä Passo 15: An√°lise do Sistema

Estat√≠sticas sobre nosso sistema RAG com chains.

In [17]:
# Estat√≠sticas
print("üìä Estat√≠sticas do Sistema RAG com Chains\n")
print("=" * 80)

print(f"\nüìö Dados:")
print(f"   Total de PDFs: {len(pdf_paths)}")
print(f"   Total de p√°ginas: {len(documents)}")
print(f"   Total de chunks: {len(chunks)}")
print(f"   Expans√£o de chunking: {len(chunks)/len(documents):.1f}x")

# Tamanho dos chunks
tamanhos = [len(c.page_content) for c in chunks]
print(f"\nüìè Chunks:")
print(f"   Tamanho m√©dio: {sum(tamanhos)/len(tamanhos):.0f} caracteres")
print(f"   Tamanho m√≠nimo: {min(tamanhos)} caracteres")
print(f"   Tamanho m√°ximo: {max(tamanhos)} caracteres")

# Vectorstore
print(f"\nüóÑÔ∏è  Vectorstore FAISS:")
print(f"   Dimens√µes dos embeddings: {vectorstore.index.d}")
print(f"   Total de vetores: {vectorstore.index.ntotal}")

# Chain
print(f"\nüîó Chain RAG:")
print(f"   Componentes: 5 (retriever ‚Üí format ‚Üí prompt ‚Üí llm ‚Üí parser)")
print(f"   Suporte a streaming: ‚úÖ Sim")
print(f"   Suporte a batch: ‚úÖ Sim")
print(f"   Suporte a async: ‚úÖ Sim")

print("\n" + "=" * 80)

üìä Estat√≠sticas do Sistema RAG com Chains


üìö Dados:
   Total de PDFs: 4
   Total de p√°ginas: 15
   Total de chunks: 33
   Expans√£o de chunking: 2.2x

üìè Chunks:
   Tamanho m√©dio: 815 caracteres
   Tamanho m√≠nimo: 262 caracteres
   Tamanho m√°ximo: 997 caracteres

üóÑÔ∏è  Vectorstore FAISS:
   Dimens√µes dos embeddings: 768
   Total de vetores: 33

üîó Chain RAG:
   Componentes: 5 (retriever ‚Üí format ‚Üí prompt ‚Üí llm ‚Üí parser)
   Suporte a streaming: ‚úÖ Sim
   Suporte a batch: ‚úÖ Sim
   Suporte a async: ‚úÖ Sim



## üéì Resumo: O que Aprendemos?

### ‚úÖ Conceitos Principais

1. **LangChain Expression Language (LCEL)**
   - Sintaxe de pipeline usando `|`
   - Composi√ß√£o de componentes reutiliz√°veis
   - Padr√£o moderno para RAG

2. **Retriever**
   - Abstra√ß√£o sobre vectorstore
   - Interface `Runnable` compat√≠vel com chains
   - Configur√°vel e padronizado

3. **Chain RAG**
   - Pipeline autom√°tico: retrieval ‚Üí format ‚Üí prompt ‚Üí llm
   - Uma linha substitui 6+ linhas de c√≥digo procedural
   - Suporte nativo a streaming, batch, async

4. **RunnablePassthrough**
   - Passa dados atrav√©s da chain sem modificar
   - √ötil para manter vari√°veis originais

5. **StrOutputParser**
   - Converte sa√≠da do LLM em string limpa
   - Remove metadados extras

### üÜö Compara√ß√£o: Procedural vs Chain

| Aspecto | Procedural (lab 3.3) | Chain (este lab) |
|---------|---------------------|------------------|
| **Linhas de c√≥digo** | ~6 linhas | 1 linha |
| **Legibilidade** | Verboso | Conciso |
| **Streaming** | Manual | Nativo (`stream()`) |
| **Reutiliza√ß√£o** | Dif√≠cil | F√°cil (salva chain) |
| **Manuten√ß√£o** | Repetitivo | DRY (Don't Repeat) |
| **Produ√ß√£o** | N√£o recomendado | Padr√£o da ind√∫stria |

### üéØ Quando Usar Cada Abordagem?

**Procedural (lab 3.3):**
- ‚úÖ Aprendizado e did√°tica
- ‚úÖ Debugging detalhado
- ‚úÖ Entender cada etapa do RAG

**Chain (este lab):**
- ‚úÖ Produ√ß√£o
- ‚úÖ Projetos reais
- ‚úÖ C√≥digo limpo e manuten√≠vel
- ‚úÖ Performance e escalabilidade

### üöÄ Pr√≥ximos Passos

1. **Experimente diferentes retrievers:**
   - `search_type="mmr"` (Maximum Marginal Relevance)
   - `search_type="similarity_score_threshold"`

2. **Adicione mais componentes √† chain:**
   - Re-ranking de documentos
   - Filtros de metadados
   - Fallbacks e error handling

3. **Explore recursos avan√ßados:**
   - `chain.batch([query1, query2])`: Processar m√∫ltiplas queries
   - `await chain.ainvoke(query)`: Execu√ß√£o ass√≠ncrona
   - `chain.with_config(...)`: Configura√ß√£o din√¢mica

4. **Otimize para produ√ß√£o:**
   - Cache de embeddings
   - Monitoramento e logging
   - Rate limiting

### üí° Dica Final

**Chain = Composabilidade**

```python
# Voc√™ pode criar chains complexas facilmente:
chain = (
    preprocessor
    | retriever
    | reranker
    | prompt
    | llm
    | postprocessor
    | validator
)
```

Cada etapa √© um componente reutiliz√°vel que pode ser testado isoladamente!

---

üéâ **Parab√©ns!** Voc√™ dominou RAG com Chains usando LCEL!