# Aprofundando o RAG: Base de Conhecimento e Banco Vetorial

## ‚úÖ 1. Revis√£o R√°pida do RAG com LangChain

#### O que √© um RAG?

RAG = Retrieval-Augmented Generation

Ele busca informa√ß√µes relevantes antes de gerar a resposta.

Usa LLM + banco de vetores.

#### Como funciona na pr√°tica:

O usu√°rio envia uma pergunta.

A pergunta √© vetorizada.

O sistema busca vetores semelhantes na base.

As informa√ß√µes encontradas s√£o repassadas para a LLM, que responde com contexto.

#### Componentes principais:

Embeddings (vetoriza√ß√£o): convertem texto em vetores num√©ricos.

Vector Store (FAISS): armazena e busca os vetores.

Retriever + LLM: fazem a m√°gica acontecer.



In [3]:
# EXEMPLO
from langchain.vectorstores import FAISS
from langchain.embeddings import OllamaEmbeddings
from langchain.docstore.document import Document

# Base de conhecimento
documentos = [
    Document(page_content="Nosso suporte funciona das 9h √†s 18h, de segunda a sexta."),
    Document(page_content="O prazo de reembolso √© de at√© 7 dias √∫teis."),
]

# Vetoriza√ß√£o
embedding_function = OllamaEmbeddings(model="mistral")
vectorstore = FAISS.from_documents(documentos, embedding_function)


  embedding_function = OllamaEmbeddings(model="mistral")


## üìå 2. Vetorizando Documentos Reais

### Fontes de dados que podem ser usados:

- Textos soltos em Python.

- PDFs.

- Arquivos .txt, .csv, .md.

- FAQs e pol√≠ticas da empresa.

#### Exemplo 1: Vetorizando textos simples




In [None]:
from langchain.text_splitter import CharacterTextSplitter
from langchain.embeddings import OllamaEmbeddings

textos = """
A loja funciona de segunda a sexta-feira, das 8h √†s 17h.
Para trocas ou devolu√ß√µes, √© necess√°rio entrar em contato em at√© 7 dias.
""".strip()

# Quebrar o texto em blocos
splitter = CharacterTextSplitter(separator="\n", chunk_size=100, chunk_overlap=20)
blocos = splitter.create_documents([textos])

# Vetorizando
vectorstore = FAISS.from_documents(blocos, OllamaEmbeddings(model="mistral"))


#### Exemplo 2: Vetorizando um arquivo .txt ou .pdf



In [None]:
from langchain.document_loaders import TextLoader, PyPDFLoader
from langchain.embeddings import OllamaEmbeddings

# Carregar texto ou PDF
loader = TextLoader("documentos/politicas.txt")  # ou PyPDFLoader("documentos/manual.pdf")
documentos = loader.load()

# Dividir e vetorizar
blocos = splitter.split_documents(documentos)
vectorstore = FAISS.from_documents(blocos, OllamaEmbeddings(model="mistral"))


‚úÖ Agora temos uma base de conhecimento vetorizada a partir de arquivos reais.


## üìå 3. Buscando informa√ß√µes na base de vetores



In [7]:
# Pergunta do usu√°rio
pergunta = "Qual o hor√°rio de atendimento?"

# Transformar a pergunta em vetor e buscar similaridade
docs_relevantes = vectorstore.similarity_search(pergunta)

for doc in docs_relevantes:
    print(doc.page_content)


A loja funciona de segunda a sexta-feira, das 8h √†s 17h.
Para trocas ou devolu√ß√µes, √© necess√°rio entrar em contato em at√© 7 dias.


## üìå Tecnologias para Armazenamento Vetorial (Banco de Dados de Vetores)

### ‚úÖ O que √© um Banco Vetorial?

√â um sistema de armazenamento e recupera√ß√£o que, em vez de fazer buscas por igualdade (=, LIKE), usa dist√¢ncia entre vetores para encontrar os itens mais semelhantes a um texto, imagem ou outro vetor.

üß† √ötil em:

- RAG (LangChain, LlamaIndex).

- Busca sem√¢ntica.

- Recomenda√ß√£o de conte√∫do.

- Sistemas de IA que precisam entender o "significado" de algo.



### üß© 1. FAISS (Facebook AI Similarity Search)

- üí° Tipo: Biblioteca local para busca vetorial r√°pida.

- üíª Armazenamento: Em mem√≥ria ou persist√™ncia simples (via pickle).

- üèÉ‚Äç‚ôÄÔ∏è Velocidade: Extremamente r√°pido para uso local.

- ‚ùå N√£o possui interface tipo SQL nativa.

- ‚úÖ Ideal para: prot√≥tipos locais, projetos de pequeno/m√©dio porte.

üì¶ Suportado por: LangChain, LlamaIndex, Haystack

In [None]:
from langchain.vectorstores import FAISS
vectorstore = FAISS.from_documents(docs, OllamaEmbeddings(model="mistral"))


### üß© 2. ChromaDB

- üí° Tipo: Banco vetorial open-source, com API local e persist√™ncia em disco.

- üì¶ Armazena vetores + metadados estruturados (como um SQL simplificado).

- üß† Suporta filtros por metadados!

- üåê Pode ser usado como servidor ou localmente.

- ‚úÖ Ideal para: projetos persistentes, com m√∫ltiplos usu√°rios e filtros.

üì¶ Suportado por: LangChain, LlamaIndex


In [None]:
from langchain.vectorstores import Chroma
vectorstore = Chroma.from_documents(docs, OllamaEmbeddings(model="mistral"), persist_directory="./db")


### üß© 3. Weaviate

- üí° Tipo: Banco de dados vetorial com estrutura sem√¢ntica tipo GraphQL.

- üîç Suporte a queries estruturadas (por texto e metadados).

- üß† Usa filtros e contexto no estilo SQL + AI.

- **üåê Hosped√°vel via Docker, Cloud ou API.

- ‚úÖ Ideal para: solu√ß√µes corporativas, sistemas em produ√ß√£o com m√∫ltiplos tipos de dados.

üì¶ Suportado por: LangChain, LlamaIndex, diretamente via SDK Python

### üß© 4. Pinecone

- üí° Tipo: SaaS (servi√ßo em nuvem especializado em vetores).

- üåê R√°pido, escal√°vel, com alta disponibilidade.

- üìò Interface parecida com banco de dados, mas voltado para similaridade.

- üß† Suporta metadados e filtros.

- üí∞ Plano gratuito com limita√ß√µes.

üì¶ Suportado por: LangChain, LlamaIndex, OpenAI

In [None]:
import pinecone
pinecone.init(api_key="SUA_CHAVE", environment="us-west1-gcp")
index = pinecone.Index("meu_index")


### üß© 5. Milvus

- üí° Tipo: Banco de dados vetorial open-source e altamente escal√°vel.

- üîß Suporte a estrutura tipo SQL via MilvusQL.

- üìä Pode armazenar bilh√µes de vetores com metadados.

- ‚öôÔ∏è Requer mais setup (Docker, container).

üì¶ Suportado por: LangChain, Zilliz Cloud

### üß© 6. Qdrant

- üí° Tipo: Banco vetorial moderno, open-source e r√°pido.

- üß† Excelente suporte a filtros por metadados.

- üåê Acess√≠vel por API REST ou client Python.

- ‚úÖ Interface simples + persist√™ncia.

üì¶ Suportado por: LangChain

![tabeladbb](images/tabeladb.png)

![cenarios](images/cenarios.png)

# Vamos usar o ChromaDB

O ChromaDB √© um banco de dados vetorial open-source que armazena e busca documentos vetorizados com base em similaridade sem√¢ntica.

üëâ Ele funciona como um ‚Äúbanco de dados de significados‚Äù, em vez de palavras exatas.

Imagine que voc√™ tem uma FAQ com dezenas de perguntas/respostas, mas o usu√°rio escreve a d√∫vida com outras palavras.

üí° Com o ChromaDB, voc√™ pode vetorizar essas perguntas e permitir que a IA encontre a resposta certa com base no significado, n√£o nas palavras.



### ‚úÖ Passo a Passo: Como funciona o ChromaDB na pr√°tica

#### ü•á Etapa 1: Instala√ß√£o
```bash
pip install chromadb langchain
```


#### ü•à Etapa 2: O que √© necess√°rio para usar o ChromaDB com LangChain?

![cromaneed](images/cromaneed.png)




#### ü•â Etapa 3: Criando o Banco Vetorial com ChromaDB


üìÅ Suponha que voc√™ tenha um documento de conhecimento:

In [None]:
from langchain.docstore.document import Document

documentos = [
    Document(page_content="O prazo para reembolso √© de at√© 7 dias √∫teis."),
    Document(page_content="Nosso hor√°rio de atendimento √© de segunda a sexta, das 9h √†s 18h."),
    Document(page_content="O suporte pode ser contatado via suporte@empresa.com.br"),
]


üî° Vetorizando os documentos

In [10]:
from langchain.embeddings import OllamaEmbeddings  # ou OpenAIEmbeddings HuggingFaceEmbeddings
embeddings = OllamaEmbeddings(model="mistral")


üíæ Criando o VectorStore com Chroma

In [11]:
from langchain.vectorstores import Chroma

vectorstore = Chroma.from_documents(
    documentos,
    embedding=embeddings,
    persist_directory="./meu_banco_chroma"
)


üìå O Chroma agora criou uma base vetorial persistente em disco!

#### üß™ Etapa 4: Consultando o banco com uma pergunta


Pergunta de exemplo: 

```python
pergunta = "Como fa√ßo para pedir reembolso?"
```


Buscar documentos similares:

```python
resultados = vectorstore.similarity_search(pergunta, k=2)

for doc in resultados:
    print(doc.page_content)

```

üí° O Chroma retorna os documentos mais parecidos em significado, n√£o em palavras!



In [12]:
pergunta = "Como fa√ßo para pedir reembolso?"

resultados = vectorstore.similarity_search(pergunta, k=2)

for doc in resultados:
    print(doc.page_content)


O prazo para reembolso √© de at√© 7 dias √∫teis.
Nosso hor√°rio de atendimento √© de segunda a sexta, das 9h √†s 18h.


#### üß† Etapa 5: Integrando com um modelo de IA (RAG)

Agora que temos os documentos mais relevantes, vamos pedir a uma IA que gere uma resposta com base neles.



In [13]:
from langchain.chains import RetrievalQA
from langchain_community.llms import Ollama  # modelo local via Ollama

# Inicializa o modelo local Mistral via Ollama
llm = Ollama(model="mistral", temperature=0)

# Cria a cadeia de perguntas e respostas
qa = RetrievalQA.from_chain_type(
    llm=llm,
    retriever=vectorstore.as_retriever()
)

# Faz a pergunta
resposta = qa.run("Como posso solicitar reembolso?")
print(resposta)


  llm = Ollama(model="mistral", temperature=0)
  resposta = qa.run("Como posso solicitar reembolso?")
Number of requested results 4 is greater than number of elements in index 3, updating n_results = 3


 Voc√™ pode solicitar o reembolso enviando um email para o endere√ßo de suporte da empresa, que √© suporte@empresa.com. Certifique-se de fazer isso dentro do prazo de 7 dias √∫teis ap√≥s a data em que foi realizado o pagamento.


üß± Resumo de Componentes Chave do ChromaDB

![resumo](images/resumo.png)

## Como fazer para inserir documentos para serem vetorizados?

√â poss√≠vel transformar arquivos como PDF, Word, TXT e at√© HTML em vetores para o ChromaDB, e voc√™ pode fazer isso de forma manual via c√≥digo ou usando loaders autom√°ticos do LangChain.

LangChain tem loaders prontos para arquivos como:

![loaders](images/loaders.png)



### PDF ‚Üí vetores no Chroma



In [None]:
from langchain.document_loaders import PyPDFLoader
from langchain.text_splitter import CharacterTextSplitter
from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import Chroma

# 1. Carregando o PDF
loader = PyPDFLoader("politica_reembolso.pdf")
documentos = loader.load()

# 2. Separando o conte√∫do em blocos pequenos (chunking)
splitter = CharacterTextSplitter(chunk_size=500, chunk_overlap=50)
blocos = splitter.split_documents(documentos)

# 3. Vetorizando e salvando no Chroma
vectorstore = Chroma.from_documents(
    documentos=blocos,
    embedding=OpenAIEmbeddings(),
    persist_directory="./meu_banco_vetorial"
)



## ‚öñÔ∏è Comparando: Inserir via C√≥digo vs Arquivos Carregados

![comparativo](images/comparativo.png)



## üö¶ Quando usar cada abordagem?

![comparativo2](images/comparativo2.png)

### üí° Dica Extra: Combinando os dois m√©todos

Voc√™ pode:

- Criar uma base com alguns textos no c√≥digo.
- Acrescentar arquivos reais (PDF, CSV, etc).
- Misturar tudo antes de vetorizar.

In [None]:
documentos_combinados = textos_do_codigo + pdfs_carregados
vectorstore = Chroma.from_documents(documentos_combinados, OpenAIEmbeddings())


## Vamos testar a vetoriza√ß√£o de coumentos:

### 1. RAG com ChromaDB

üìÑ PDF fict√≠cio de uma pol√≠tica de reembolso da empresa "Infinity Tech".

üß† Script Python que:

Carrega o PDF.

Divide em blocos de texto (chunking).

Vetoriza os blocos com embeddings.

Armazena tudo no ChromaDB.

üß™ Atividade pr√°tica para os alunos, com perguntas para testar o RAG.

### 2. Script Python ‚Äì Carregando e Vetorizando o PDF

In [None]:
!pip install pypdf

In [19]:
from langchain.document_loaders import PyPDFLoader
from langchain.text_splitter import CharacterTextSplitter
from langchain.embeddings import OllamaEmbeddings
from langchain.vectorstores import Chroma

# 1. Carregar o PDF
loader = PyPDFLoader("politica_reembolso_infinitytech.pdf")
documentos = loader.load()

# 2. Dividir em blocos (chunking)
splitter = CharacterTextSplitter(chunk_size=300, chunk_overlap=50)
blocos = splitter.split_documents(documentos)

# 3. Vetorizar com OpenAI embeddings e salvar no ChromaDB
vectorstore = Chroma.from_documents(
    documents=blocos,
    embedding=OllamaEmbeddings(model="mistral"),  # ou HuggingFaceEmbeddings()
    persist_directory="./chroma_db_infinity"
)

print("Base vetorial criada com sucesso!")


Base vetorial criada com sucesso!


### 3. Script de Consulta



In [21]:
from langchain.chains import ConversationalRetrievalChain

qa = ConversationalRetrievalChain.from_llm(
    llm=llm,
    retriever=vectorstore.as_retriever(),
)

# 7. Consulta
pergunta = "Como posso pedir a segunda via do boleto?"
resposta = qa.invoke({
    "question": pergunta,
    "chat_history":[]
})
print("üß† Resposta:", resposta["answer"])


# from langchain.chains import RetrievalQA
# from langchain.chat_models import ChatOpenAI

# qa = RetrievalQA.from_chain_type(
#     llm=ChatOpenAI(openai_api_key="SUA_API_KEY"),
#     retriever=vectorstore.as_retriever()
# )

# pergunta = "Como posso pedir um reembolso?"
# resposta = qa.run(pergunta)
# print("Resposta do chatbot:", resposta)


Number of requested results 4 is greater than number of elements in index 2, updating n_results = 2


üß† Resposta:  Para pedir uma segunda via do boleto, voc√™ precisa entrar em contato com o nosso suporte de atendimento. Voc√™ pode enviar um e-mail para [suporte@infinitytech.com](mailto:suporte@infinitytech.com) com a solicita√ß√£o espec√≠fica, incluindo o n√∫mero do pedido. O time de atendimento ser√° feliz em ajudar voc√™.


## Como estruturar um PDF ideal para uso em RAG (Chatbot IA)

Uma das principais dores de quem trabalha com RAG √© receber PDFs mal formatados, com muito ru√≠do ou estrutura desorganizada, o que prejudica a vetoriza√ß√£o e a recupera√ß√£o de informa√ß√µes.

Voc√™ pode resolver isso criando um modelo-padr√£o de estrutura de PDF, com boas pr√°ticas e instru√ß√µes claras para o cliente preencher. Vamos fazer isso agora!

üìå Objetivo:

Orientar seu cliente a montar um PDF limpo, bem dividido e estruturado, que facilite a vetoriza√ß√£o com ferramentas como LangChain + ChromaDB.

## üìÑ Modelo de Estrutura Padr√£o do PDF

#### 1 Use T√≠tulos Claros e Numerados
Evite blocos gigantes de texto. Use se√ß√µes com numera√ß√£o.


```bash
1. SOBRE A EMPRESA
A Infinity Tech √© uma empresa especializada em solu√ß√µes digitais...

2. POL√çTICA DE REEMBOLSO
2.1 O cliente tem at√© 7 dias √∫teis para solicitar reembolso.
2.2 O reembolso ser√° feito via o mesmo m√©todo de pagamento.

3. CONTATO
3.1 E-mail: suporte@infinitytech.com.br
3.2 Telefone: (11) 4000-1234
```


#### 2 N√£o misture temas

‚úÖ Use 1 tema por par√°grafo.
‚ùå N√£o agrupe v√°rios assuntos no mesmo bloco.
Isso ajuda o RAG a dividir corretamente os chunks.

#### 3 Evite elementos gr√°ficos

‚ùå Tabelas com muitas colunas.
‚ùå Imagens com informa√ß√µes importantes.
‚úÖ Texto plano e estruturado √© mais confi√°vel para extra√ß√£o.

#### 4 Use frases completas

Evite frases curtas tipo bullet points soltos.

```bash
‚úÖ O cliente deve enviar o comprovante por e-mail para dar in√≠cio ao processo de troca.
‚ùå Enviar comprovante. E-mail. Troca.
```



#### 5 D√™ prefer√™ncia a formatos edit√°veis

Se poss√≠vel, pe√ßa o conte√∫do em .docx ou .txt para facilitar o pr√©-processamento.
Voc√™ pode converter para PDF posteriormente com controle.


üìù Texto de instru√ß√£o para enviar ao cliente

```bash
Prezado(a),
Para que possamos integrar suas informa√ß√µes ao nosso sistema de IA com maior precis√£o e efici√™ncia, solicitamos que o documento enviado atenda ao seguinte modelo:

Use t√≠tulos e subt√≠tulos numerados para cada tema.

Mantenha os textos em blocos coerentes, com um t√≥pico por par√°grafo.

Evite gr√°ficos ou tabelas complexas.

Use frases completas, evite anota√ß√µes soltas.

Envie preferencialmente em .docx, .txt ou .pdf gerado a partir de texto puro (n√£o escaneado).

Voc√™ pode seguir o modelo que enviamos como base:
(anexe o PDF de exemplo que posso gerar para voc√™ agora)