# Vector Database



Um Vector Database (ou banco de dados vetorial) √© um tipo de banco de dados especializado no armazenamento, indexa√ß√£o e busca eficiente de vetores de alta dimens√£o ‚Äî representa√ß√µes num√©ricas densas, geralmente extra√≠das de dados como textos, imagens, v√≠deos ou √°udio.

Esses vetores s√£o a base de aplica√ß√µes de IA modernas, como:

- Busca sem√¢ntica (semantic search)

- Recupera√ß√£o aumentada por gera√ß√£o (RAG)

- Recomenda√ß√£o de conte√∫do

- Detec√ß√£o de similaridade

## Por que vetores?
Modelos de machine learning (como BERT, CLIP, OpenAI embeddings etc.) convertem entradas complexas (como textos) em vetores num√©ricos. Cada vetor representa o "significado" daquele dado em um espa√ßo matem√°tico. Com isso, √© poss√≠vel medir semelhan√ßa sem√¢ntica usando m√©tricas como:

- Dist√¢ncia Euclidiana

- Cosseno

- Inner product

## Pinecone ‚Äì O que √©?

Pinecone √© uma Vector Database as a Service, gerenciada, escal√°vel e de alta performance. Ela permite que voc√™:

- Armazene bilh√µes de vetores

- Fa√ßa buscas vetoriais r√°pidas

- Integre facilmente com LLMs (ex: OpenAI, Cohere)

- Use com frameworks como LangChain, LlamaIndex, Haystack

## Como funciona a arquitetura b√°sica?

- Cria√ß√£o de vetores: Um modelo de IA transforma dados (como textos) em vetores.

- Indexa√ß√£o: Esses vetores s√£o armazenados em Pinecone.

- Consulta: Voc√™ envia um vetor de consulta, e Pinecone retorna os vetores mais semelhantes.

- Integra√ß√£o com contexto: Em sistemas RAG, os resultados recuperados podem ser usados como contexto para LLMs.




# üîç RAG com Pinecone + MongoDB + OpenAI

Este notebook demonstra como construir um sistema de **Pergunta e Resposta com Busca Sem√¢ntica** (RAG - Retrieval-Augmented Generation), integrando:
- Vetores sem√¢nticos com OpenAI
- Armazenamento vetorial com Pinecone
- Persist√™ncia dos documentos em MongoDB
- Gera√ß√£o de resposta com contexto usando ChatGPT (GPT-3.5-turbo)

Ideal para casos de uso como:
- FAQ inteligentes
- Chatbots com mem√≥ria contextual
- Sistemas de suporte baseados em conhecimento

Para obter suas chaves de API do **Pinecone** e **OpenAI**, siga os passos abaixo:

---

### **1. Como obter a API Key do Pinecone**

1. Acesse: [https://www.pinecone.io](https://www.pinecone.io)
2. Clique em **‚ÄúStart for free‚Äù** e crie uma conta (ou fa√ßa login).
3. No Dashboard:

   * V√° para **API Keys** (menu lateral esquerdo).
   * Copie a **API Key** (ex: `a1b2c3d4...`) e o **Environment** (ex: `gcp-starter`, `us-west1-gcp`).

##--> Guarde essas informa√ß√µes, voc√™ usar√° assim:

```python
pinecone_api_key = "SUA_PINECONE_API_KEY"
pinecone_env = "us-west1-gcp"
```

---

### **2. Como obter a OpenAI API Key**

1. Acesse: [https://platform.openai.com/account/api-keys](https://platform.openai.com/account/api-keys)
2. Fa√ßa login com sua conta da OpenAI.
3. Clique em **‚ÄúCreate new secret key‚Äù**.
4. Copie e salve a chave (voc√™ s√≥ ver√° uma vez!).

Exemplo:

```python
openai_api_key = "sk-..."
```

---

### üí° Dica de seguran√ßa:

* Nunca compartilhe suas chaves publicamente.
* Use vari√°veis de ambiente (como `os.getenv`) ou arquivos `.env` para maior seguran√ßa em produ√ß√£o.

Se quiser, posso mostrar como armazenar essas chaves com seguran√ßa em um projeto Colab ou Python local. Deseja isso tamb√©m?


In [None]:
# Instalar depend√™ncias
!pip install openai pinecone-client pymongo --quiet

In [None]:
# Configura√ß√µes (edite com suas chaves)
openai_api_key = "SUA_OPENAI_API_KEY"
pinecone_api_key = "SUA_PINECONE_API_KEY"
pinecone_env = "us-west1-gcp"
pinecone_index_name = "rag-index"

mongodb_uri = "mongodb://localhost:27017"
db_name = "ragdb"
collection_name = "faq"

In [None]:
# Inicializa√ß√µes
import openai
import pinecone
from pymongo import MongoClient
import uuid

openai.api_key = openai_api_key
pinecone.init(api_key=pinecone_api_key, environment=pinecone_env)

# Pinecone
if pinecone_index_name not in pinecone.list_indexes():
    pinecone.create_index(pinecone_index_name, dimension=1536)
index = pinecone.Index(pinecone_index_name)

# MongoDB
mongo = MongoClient(mongodb_uri)
collection = mongo[db_name][collection_name]

def gerar_embedding(texto):
    response = openai.Embedding.create(input=[texto], model="text-embedding-ada-002")
    return response["data"][0]["embedding"]

In [None]:
# Inserir base de conhecimento
faq_data = [
    {"pergunta": "Como redefinir minha senha?", "resposta": "Acesse configura√ß√µes e clique em 'Redefinir Senha'."},
    {"pergunta": "Qual √© o hor√°rio de atendimento?", "resposta": "Das 8h √†s 18h, de segunda a sexta."},
    {"pergunta": "Onde posso baixar minha fatura?", "resposta": "Na √°rea do cliente, se√ß√£o 'Faturas'."}
]

for item in faq_data:
    item_id = str(uuid.uuid4())
    vetor = gerar_embedding(item["pergunta"])
    item["_id"] = item_id
    collection.insert_one(item)
    index.upsert([(item_id, vetor)])

In [None]:
# Fun√ß√£o de busca com recupera√ß√£o sem√¢ntica
def buscar_contexto(pergunta, top_k=1):
    embedding = gerar_embedding(pergunta)
    results = index.query(vector=embedding, top_k=top_k)
    contextos = []
    for match in results["matches"]:
        doc = collection.find_one({"_id": match["id"]})
        if doc:
            contextos.append(doc["resposta"])
    return "\n".join(contextos)

In [None]:
# Fun√ß√£o de resposta com contexto RAG
def responder(pergunta):
    contexto = buscar_contexto(pergunta)
    prompt = f"""
Contexto:
{contexto}

Pergunta:
{pergunta}

Responda com base apenas no contexto acima.
"""
    resposta = openai.ChatCompletion.create(
        model="gpt-3.5-turbo",
        messages=[{"role": "user", "content": prompt}],
        temperature=0.3
    )
    return resposta["choices"][0]["message"]["content"]

In [None]:
# Teste interativo
while True:
    pergunta = input("Voc√™: ")
    if pergunta.lower() in ["sair", "exit", "quit"]:
        break
    resposta = responder(pergunta)
    print("Bot:", resposta)

---

## üöÄ Como utilizar o notebook RAG com Pinecone + MongoDB + OpenAI

### üîß Pr√©-requisitos

Antes de rodar o notebook, voc√™ precisa:

1. **Criar contas e obter chaves:**

   * [OpenAI](https://platform.openai.com/account/api-keys): gere sua `openai_api_key`
   * [Pinecone](https://app.pinecone.io): gere sua `pinecone_api_key` e anote o `environment` (ex: `us-west1-gcp`)

2. **Instalar o MongoDB:**

   * Localmente ou via [MongoDB Atlas](https://www.mongodb.com/cloud/atlas)

---

### üìå Etapas no notebook

#### ‚úÖ 1. Instalar depend√™ncias

Executa `pip install` para instalar:

* `openai`
* `pinecone-client`
* `pymongo`

#### ‚úÖ 2. Definir vari√°veis de configura√ß√£o

Voc√™ deve substituir:

```python
openai_api_key = "SUA_OPENAI_API_KEY"
pinecone_api_key = "SUA_PINECONE_API_KEY"
pinecone_env = "SUA_PINECONE_ENV"
mongodb_uri = "mongodb://localhost:27017"
```

#### ‚úÖ 3. Inicializa√ß√µes

* Conecta √† API do OpenAI
* Conecta ao Pinecone (cria √≠ndice se n√£o existir)
* Conecta ao MongoDB (banco + cole√ß√£o para persist√™ncia textual)

#### ‚úÖ 4. Inserir documentos de base

Voc√™ pode inserir perguntas e respostas como esta:

```python
{ "pergunta": "Como redefinir minha senha?", "resposta": "Acesse configura√ß√µes e clique em 'Redefinir Senha'." }
```

Cada pergunta √© transformada em um vetor sem√¢ntico via `text-embedding-ada-002` e enviada ao Pinecone + MongoDB.

#### ‚úÖ 5. Buscar contexto

A fun√ß√£o `buscar_contexto(pergunta)` realiza:

* Convers√£o da pergunta em vetor
* Consulta sem√¢ntica no Pinecone
* Recupera√ß√£o do texto correspondente no MongoDB

#### ‚úÖ 6. Gerar resposta com GPT

A fun√ß√£o `responder(pergunta)` monta um prompt com:

* Contexto recuperado
* Pergunta original

E envia ao modelo `gpt-3.5-turbo` da OpenAI.

#### ‚úÖ 7. Intera√ß√£o final

Um loop `input()` permite que voc√™ converse com o sistema e ele responda com base no conhecimento armazenado.

---

### üì¶ Dica: Atualizar a base de conhecimento

Voc√™ pode adicionar dinamicamente novos documentos no MongoDB e no Pinecone executando novamente a c√©lula de inser√ß√£o.

---

### üîê Seguran√ßa

* Nunca exponha suas chaves diretamente em c√≥digo p√∫blico.
* Para projetos reais, use vari√°veis de ambiente (`os.getenv`) ou arquivos `.env`.

---
