# üß† Vector Store e Embeddings: A Mem√≥ria Inteligente da IA

**M√≥dulo 9 - Curso LangChain v0.3**

*Por Pedro Guth*

![](https://s3.us-east-1.amazonaws.com/turing.education/notebooks/imagens/langchain-modulo-09_img_01.png)

Bora entender como a IA consegue "lembrar" e encontrar informa√ß√µes relevantes de forma inteligente! üöÄ

At√© agora no nosso curso j√° vimos:
- Como conversar com LLMs (ChatModel)
- Como criar prompts inteligentes (Prompt Templates) 
- Como carregar e dividir documentos (Document Loading e Splitters)

Agora vamos aprender como fazer a IA "lembrar" dessas informa√ß√µes de forma eficiente!

## ü§î T√°, mas o que √© um Vector Store?

Imagina que voc√™ tem uma biblioteca gigante com milh√µes de livros. Como voc√™ encontraria rapidamente todos os livros sobre "culin√°ria italiana"?

Um **Vector Store** √© como um bibliotec√°rio super inteligente que:
1. L√™ cada livro e entende o "significado" dele
2. Organiza os livros n√£o por ordem alfab√©tica, mas por **similaridade de conte√∫do**
3. Quando voc√™ pergunta algo, ele encontra os livros mais relevantes instantaneamente

### Como funciona na pr√°tica:
- Cada texto √© convertido em **n√∫meros** (vetores)
- Textos similares ficam "pr√≥ximos" no espa√ßo matem√°tico
- Busca por similaridade ao inv√©s de palavras exatas

**Dica!** Vector Stores s√£o essenciais para RAG (Retrieval Augmented Generation) que vamos ver no pr√≥ximo m√≥dulo!

## üéØ E o que s√£o Embeddings?

**Embeddings** s√£o a m√°gica por tr√°s dos Vector Stores!

Pensa assim: como voc√™ explicaria para um computador a diferen√ßa entre "cachorro" e "gato"? 

Embeddings fazem exatamente isso - eles convertem **palavras e textos em n√∫meros** que capturam o significado sem√¢ntico.

### Exemplo conceitual:
- "Rei" - "Homem" + "Mulher" = "Rainha"
- "Paris" - "Fran√ßa" + "Brasil" = "Bras√≠lia"

### Representa√ß√£o matem√°tica:
$$\text{Embedding} = [0.1, -0.3, 0.7, 0.2, \ldots, 0.5]$$

Cada texto vira um vetor com centenas ou milhares de dimens√µes!

**Dica!** Similaridade √© calculada usando dist√¢ncia coseno: $$\text{similarity} = \frac{A \cdot B}{|A| \times |B|}$$

In [None]:
# Vamos come√ßar instalando as bibliotecas que vamos usar
!pip install langchain langchain-community langchain-openai faiss-cpu sentence-transformers python-dotenv

# Imports b√°sicos
import numpy as np
import matplotlib.pyplot as plt
from sklearn.decomposition import PCA
from sklearn.metrics.pairwise import cosine_similarity
import warnings
warnings.filterwarnings('ignore')

print("‚úÖ Bibliotecas instaladas com sucesso!")

## üîß Setup do Ambiente LangChain

Agora vamos configurar nosso ambiente para trabalhar com embeddings no LangChain. Vamos usar modelos gratuitos para come√ßar!

In [None]:
# Imports do LangChain para embeddings e vector stores
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import FAISS
from langchain.schema import Document
from langchain.text_splitter import RecursiveCharacterTextSplitter

# Vamos usar um modelo de embedding gratuito e bom em portugu√™s
print("üîÑ Carregando modelo de embeddings...")
embeddings_model = HuggingFaceEmbeddings(
    model_name="sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2"
)

print("‚úÖ Modelo carregado! Este modelo entende portugu√™s e mais 49 idiomas!")
print(f"Dimens√µes do vetor: {len(embeddings_model.embed_query('teste'))}")

## üß™ Primeiro Experimento: Visualizando Embeddings

Vamos ver como palavras similares ficam pr√≥ximas no espa√ßo vetorial!

In [None]:
# Vamos testar com algumas palavras relacionadas
palavras = [
    "cachorro", "gato", "animal", "pet",
    "carro", "bicicleta", "transporte", "ve√≠culo",
    "pizza", "macarr√£o", "comida", "restaurante",
    "programa√ß√£o", "c√≥digo", "python", "desenvolvimento"
]

print("üîÑ Gerando embeddings para as palavras...")
embeddings_list = []
for palavra in palavras:
    embedding = embeddings_model.embed_query(palavra)
    embeddings_list.append(embedding)
    
# Convertendo para numpy array para facilitar os c√°lculos
embeddings_array = np.array(embeddings_list)
print(f"‚úÖ Gerados {len(embeddings_list)} embeddings de {len(embeddings_list[0])} dimens√µes cada")

In [None]:
# Vamos reduzir as dimens√µes para conseguir visualizar em 2D
pca = PCA(n_components=2)
embeddings_2d = pca.fit_transform(embeddings_array)

# Criando o gr√°fico
plt.figure(figsize=(12, 8))
colors = ['red', 'red', 'red', 'red',      # animais
         'blue', 'blue', 'blue', 'blue',   # transporte
         'green', 'green', 'green', 'green', # comida
         'orange', 'orange', 'orange', 'orange'] # programa√ß√£o

for i, (palavra, cor) in enumerate(zip(palavras, colors)):
    plt.scatter(embeddings_2d[i, 0], embeddings_2d[i, 1], c=cor, s=100)
    plt.annotate(palavra, (embeddings_2d[i, 0], embeddings_2d[i, 1]), 
                xytext=(5, 5), textcoords='offset points', fontsize=10)

plt.title('Visualiza√ß√£o de Embeddings - Palavras Similares Ficam Pr√≥ximas!', fontsize=14)
plt.xlabel('Dimens√£o 1')
plt.ylabel('Dimens√£o 2')
plt.grid(True, alpha=0.3)
plt.legend(['Animais', 'Transporte', 'Comida', 'Programa√ß√£o'])
plt.show()

print("üéØ Liiindo! Veja como palavras do mesmo contexto ficam agrupadas!")

## üìä Calculando Similaridade

Agora vamos calcular a similaridade entre palavras usando a **dist√¢ncia coseno**. Quanto mais pr√≥ximo de 1, mais similares s√£o as palavras!

In [None]:
# Calculando matriz de similaridade
similarity_matrix = cosine_similarity(embeddings_array)

# Vamos ver alguns exemplos interessantes
print("üîç SIMILARIDADES MAIS INTERESSANTES:")
print("="*50)

for i in range(len(palavras)):
    for j in range(i+1, len(palavras)):
        sim = similarity_matrix[i][j]
        if sim > 0.5:  # S√≥ mostra similaridades altas
            print(f"{palavras[i]:12} ‚Üî {palavras[j]:12} | Similaridade: {sim:.3f}")

print("\nüí° Valores pr√≥ximos de 1 = muito similares")
print("üí° Valores pr√≥ximos de 0 = pouco similares")

## üóÉÔ∏è Criando nosso Primeiro Vector Store

Agora vamos criar um Vector Store de verdade! Vamos simular uma base de conhecimento sobre tecnologia.

Lembra do m√≥dulo anterior onde aprendemos sobre Document Loading? Agora vamos usar esses conceitos!

In [None]:
# Vamos criar alguns documentos sobre tecnologia
documentos_texto = [
    "Python √© uma linguagem de programa√ß√£o interpretada, de alto n√≠vel e de prop√≥sito geral.",
    "Machine Learning √© um ramo da intelig√™ncia artificial que usa algoritmos para aprender padr√µes.",
    "O LangChain √© um framework para desenvolvimento de aplica√ß√µes com Large Language Models.",
    "JavaScript √© a linguagem de programa√ß√£o mais popular para desenvolvimento web frontend.",
    "Deep Learning usa redes neurais artificiais com m√∫ltiplas camadas para resolver problemas complexos.",
    "React √© uma biblioteca JavaScript para constru√ß√£o de interfaces de usu√°rio interativas.",
    "Natural Language Processing permite que computadores entendam e processem linguagem humana.",
    "AWS √© a plataforma de computa√ß√£o em nuvem mais popular do mundo.",
    "Docker √© uma plataforma que usa containers para facilitar o deployment de aplica√ß√µes.",
    "Git √© um sistema de controle de vers√£o distribu√≠do usado para gerenciar c√≥digo fonte."
]

# Convertendo textos em objetos Document (como vimos no m√≥dulo anterior)
documents = []
for i, texto in enumerate(documentos_texto):
    doc = Document(
        page_content=texto,
        metadata={"id": i, "categoria": "tecnologia"}
    )
    documents.append(doc)

print(f"‚úÖ Criados {len(documents)} documentos para indexar no vector store")

In [None]:
# Agora vamos criar nosso Vector Store usando FAISS
print("üîÑ Criando Vector Store...")
print("Isso pode demorar um pouquinho na primeira vez...")

# FAISS √© uma biblioteca super eficiente para busca por similaridade
vector_store = FAISS.from_documents(
    documents=documents,
    embedding=embeddings_model
)

print("‚úÖ Vector Store criado com sucesso!")
print(f"üìö Indexados {len(documents)} documentos")
print("üéØ Agora podemos fazer buscas sem√¢nticas!")

## üîç Fazendo Buscas Sem√¢nticas

Agora vem a parte mais legal! Vamos fazer perguntas e ver como o Vector Store encontra documentos relevantes baseado no **significado**, n√£o apenas nas palavras exatas.

In [None]:
# Vamos fazer algumas consultas interessantes
consultas = [
    "Como funciona intelig√™ncia artificial?",
    "Qual linguagem usar para sites?", 
    "Como fazer deploy de aplica√ß√µes?",
    "Ferramentas para gerenciar c√≥digo",
    "Desenvolvimento de interfaces web"
]

for consulta in consultas:
    print(f"\nüîç BUSCA: '{consulta}'")
    print("="*60)
    
    # Busca pelos 2 documentos mais similares
    docs_similares = vector_store.similarity_search(consulta, k=2)
    
    for i, doc in enumerate(docs_similares, 1):
        print(f"{i}. {doc.page_content}")
        
    print("\nüí° Veja como encontrou documentos relevantes mesmo sem usar as palavras exatas!")

## üìà Busca com Scores de Similaridade

Vamos ver exatamente **qu√£o similares** s√£o os documentos encontrados atrav√©s dos scores de similaridade.

In [None]:
# Fazendo busca com scores de similaridade
consulta_teste = "programa√ß√£o e desenvolvimento de software"

print(f"üéØ AN√ÅLISE DETALHADA DA BUSCA: '{consulta_teste}'")
print("="*70)

# similarity_search_with_score retorna documentos E seus scores
docs_com_score = vector_store.similarity_search_with_score(consulta_teste, k=5)

for i, (doc, score) in enumerate(docs_com_score, 1):
    print(f"\n{i}. SCORE: {score:.4f}")
    print(f"   TEXTO: {doc.page_content}")
    
    # Vamos interpretar o score
    if score < 0.5:
        interpretacao = "üü¢ Muito relevante"
    elif score < 1.0:
        interpretacao = "üü° Relevante"
    else:
        interpretacao = "üî¥ Pouco relevante"
    
    print(f"   RELEV√ÇNCIA: {interpretacao}")

print("\nüìä No FAISS, scores MENORES = mais similares (√© uma dist√¢ncia!)")

## ‚ö° Diferentes Tipos de Vector Stores

Existem v√°rios tipos de Vector Stores, cada um com suas vantagens:

### üìã Principais op√ß√µes no LangChain:
- **FAISS**: R√°pido, local, √≥timo para prototipagem
- **Chroma**: Persistente, f√°cil de usar
- **Pinecone**: Gerenciado, escal√°vel (pago)
- **Weaviate**: Open source, recursos avan√ßados
- **Qdrant**: Russo, muito r√°pido

**Dica!** Para produ√ß√£o, considere options que persistem dados automaticamente!

In [None]:
# Vamos tamb√©m testar com Chroma (se dispon√≠vel)
try:
    from langchain_community.vectorstores import Chroma
    
    print("üîÑ Testando Chroma Vector Store...")
    
    # Criando vector store com Chroma
    chroma_store = Chroma.from_documents(
        documents=documents[:3],  # S√≥ os primeiros 3 para testar
        embedding=embeddings_model
    )
    
    # Testando uma busca
    resultado = chroma_store.similarity_search("linguagem de programa√ß√£o", k=2)
    
    print("‚úÖ Chroma funcionando!")
    print("üîç Resultado da busca no Chroma:")
    for doc in resultado:
        print(f"   ‚Ä¢ {doc.page_content}")
        
except Exception as e:
    print(f"‚ö†Ô∏è Chroma n√£o dispon√≠vel: {e}")
    print("üí° Isso √© normal! FAISS j√° √© suficiente para aprender")

## üíæ Persistindo e Carregando Vector Stores

Na vida real, voc√™ n√£o quer recriar seu Vector Store toda vez! Vamos aprender a salvar e carregar.

In [None]:
# Salvando nosso Vector Store
import os

# Criando diret√≥rio para salvar
save_directory = "meu_vector_store"
if not os.path.exists(save_directory):
    os.makedirs(save_directory)

print("üíæ Salvando Vector Store...")

# FAISS permite salvar localmente
vector_store.save_local(save_directory)

print(f"‚úÖ Vector Store salvo em: {save_directory}")
print(f"üìÅ Arquivos criados: {os.listdir(save_directory)}")

In [None]:
# Carregando Vector Store salvo
print("üìÇ Carregando Vector Store salvo...")

# Carregando de volta
vector_store_carregado = FAISS.load_local(
    save_directory,
    embeddings_model,
    allow_dangerous_deserialization=True  # Necess√°rio para vers√µes mais recentes
)

print("‚úÖ Vector Store carregado com sucesso!")

# Testando se funciona
teste = vector_store_carregado.similarity_search("intelig√™ncia artificial", k=1)
print(f"üß™ Teste: {teste[0].page_content}")

print("\nüéØ Liiindo! Agora voc√™ pode salvar e carregar seus Vector Stores!")

## üîÑ Adicionando Novos Documentos

Vector Stores n√£o s√£o est√°ticos! Voc√™ pode adicionar novos documentos dinamicamente.

In [None]:
# Vamos adicionar alguns documentos novos
novos_textos = [
    "Kubernetes √© uma plataforma de orquestra√ß√£o de containers open-source.",
    "FastAPI √© um framework web moderno e r√°pido para construir APIs com Python.",
    "Pandas √© uma biblioteca Python essencial para an√°lise e manipula√ß√£o de dados."
]

# Convertendo em Documents
novos_docs = []
for i, texto in enumerate(novos_textos):
    doc = Document(
        page_content=texto,
        metadata={"id": len(documents) + i, "categoria": "tecnologia", "novo": True}
    )
    novos_docs.append(doc)

print(f"‚ûï Adicionando {len(novos_docs)} novos documentos...")

# Adicionando ao vector store existente
vector_store.add_documents(novos_docs)

print("‚úÖ Documentos adicionados com sucesso!")

# Testando busca com os novos documentos
resultado = vector_store.similarity_search("an√°lise de dados", k=2)
print("\nüîç Testando busca com novos documentos:")
for doc in resultado:
    print(f"   ‚Ä¢ {doc.page_content}")

## üé® Visualizando o Vector Store Completo

Vamos criar uma visualiza√ß√£o legal de todo nosso vector store para entender como os documentos se organizam no espa√ßo vetorial.

In [None]:
# Vamos buscar todos os embeddings do nosso vector store
# Para isso, vamos fazer uma busca bem gen√©rica que retorne muitos documentos
todos_docs = vector_store.similarity_search("tecnologia programa√ß√£o", k=20)

print(f"üìä Coletando embeddings de {len(todos_docs)} documentos...")

# Gerando embeddings de todos os documentos para visualizar
doc_embeddings = []
doc_labels = []

for doc in todos_docs:
    # Pegando s√≥ as primeiras palavras para o label
    label = ' '.join(doc.page_content.split()[:3]) + '...'
    doc_labels.append(label)
    
    # Gerando embedding
    embedding = embeddings_model.embed_query(doc.page_content)
    doc_embeddings.append(embedding)

# Reduzindo dimensionalidade para visualizar
doc_embeddings_array = np.array(doc_embeddings)
pca_docs = PCA(n_components=2)
docs_2d = pca_docs.fit_transform(doc_embeddings_array)

print("‚úÖ Embeddings coletados! Criando visualiza√ß√£o...")

In [None]:
# Criando visualiza√ß√£o dos documentos no espa√ßo vetorial
plt.figure(figsize=(15, 10))

# Definindo cores baseadas no tipo de tecnologia
cores_por_tema = []
for label in doc_labels:
    if any(word in label.lower() for word in ['python', 'javascript', 'linguagem']):
        cores_por_tema.append('red')
    elif any(word in label.lower() for word in ['machine', 'deep', 'artificial', 'natural']):
        cores_por_tema.append('blue')
    elif any(word in label.lower() for word in ['react', 'web', 'interface']):
        cores_por_tema.append('green')
    elif any(word in label.lower() for word in ['aws', 'docker', 'kubernetes']):
        cores_por_tema.append('orange')
    else:
        cores_por_tema.append('gray')

# Plotando os pontos
for i, (x, y) in enumerate(docs_2d):
    plt.scatter(x, y, c=cores_por_tema[i], s=100, alpha=0.7)
    plt.annotate(doc_labels[i], (x, y), xytext=(5, 5), 
                textcoords='offset points', fontsize=8, 
                bbox=dict(boxstyle='round,pad=0.3', facecolor='white', alpha=0.7))

plt.title('Mapa do Vector Store - Documentos Similares Ficam Pr√≥ximos!', fontsize=16)
plt.xlabel('Dimens√£o 1 (PCA)', fontsize=12)
plt.ylabel('Dimens√£o 2 (PCA)', fontsize=12)
plt.grid(True, alpha=0.3)

# Criando legenda
from matplotlib.patches import Patch
legend_elements = [
    Patch(facecolor='red', label='Linguagens de Programa√ß√£o'),
    Patch(facecolor='blue', label='Intelig√™ncia Artificial'),
    Patch(facecolor='green', label='Desenvolvimento Web'),
    Patch(facecolor='orange', label='Infraestrutura/Cloud'),
    Patch(facecolor='gray', label='Outros')
]
plt.legend(handles=legend_elements, loc='upper right')

plt.tight_layout()
plt.show()

print("üéØ Liiindo! Veja como documentos similares se agrupam naturalmente!")

## üõ†Ô∏è Exerc√≠cio Pr√°tico 1: Criando seu Vector Store

Agora √© sua vez! Vamos criar um vector store sobre um tema diferente.

In [None]:
# üéØ EXERC√çCIO: Complete o c√≥digo abaixo
# Crie um vector store sobre culin√°ria brasileira

# 1. Crie uma lista com pelo menos 5 frases sobre culin√°ria brasileira
culinaria_textos = [
    # Adicione suas frases aqui!
    "Feijoada √© um dos pratos mais tradicionais da culin√°ria brasileira.",
    # ... adicione mais 4 frases
]

# 2. Converta em Documents
# Seu c√≥digo aqui...

# 3. Crie o vector store
# Seu c√≥digo aqui...

# 4. Teste com uma busca sobre "sobremesa brasileira"
# Seu c√≥digo aqui...

print("üçΩÔ∏è Complete este exerc√≠cio para praticar!")

## üîó Integrando com Chains (Prepara√ß√£o para RAG)

Lembra das Chains que vimos no m√≥dulo 6? Agora vamos conectar vector stores com chains, preparando o terreno para RAG no pr√≥ximo m√≥dulo!

In [None]:
# Criando uma chain simples que usa vector store
from langchain.schema.runnable import RunnablePassthrough
from langchain.schema.output_parser import StrOutputParser
from langchain_core.prompts import PromptTemplate

# Fun√ß√£o simples para buscar documentos relevantes
def buscar_documentos(query):
    docs = vector_store.similarity_search(query, k=2)
    # Juntando o conte√∫do dos documentos
    contexto = "\n".join([doc.page_content for doc in docs])
    return contexto

# Criando um template que usa o contexto do vector store
template = """Com base no seguinte contexto sobre tecnologia:

CONTEXTO:
{contexto}

PERGUNTA: {pergunta}

Responda de forma clara e baseada no contexto fornecido.
RESPOSTA:"""

prompt = PromptTemplate(
    template=template,
    input_variables=["contexto", "pergunta"]
)

print("üîó Chain preparada para usar com vector store!")
print("üí° No pr√≥ximo m√≥dulo vamos ver como fazer isso com LLMs de verdade!")

# Testando a busca
pergunta_teste = "O que √© Python?"
contexto_encontrado = buscar_documentos(pergunta_teste)

print(f"\nüîç Para a pergunta: '{pergunta_teste}'")
print(f"üìö Contexto encontrado:\n{contexto_encontrado}")

## ‚öôÔ∏è Configura√ß√µes Avan√ßadas de Vector Stores

Vamos ver algumas configura√ß√µes mais avan√ßadas que voc√™ pode usar para otimizar seus vector stores.

In [None]:
# Testando diferentes algoritmos de busca
print("üî¨ COMPARANDO DIFERENTES ALGORITMOS DE BUSCA")
print("="*60)

query_teste = "desenvolvimento de aplica√ß√µes web"

# 1. Busca padr√£o por similaridade
docs_similarity = vector_store.similarity_search(query_teste, k=3)
print("\n1Ô∏è‚É£ SIMILARITY SEARCH (padr√£o):")
for i, doc in enumerate(docs_similarity, 1):
    texto_resumido = doc.page_content[:50] + "..."
    print(f"   {i}. {texto_resumido}")

# 2. Busca com MMR (Maximum Marginal Relevance)
# MMR balanceia relev√¢ncia e diversidade
try:
    docs_mmr = vector_store.max_marginal_relevance_search(query_teste, k=3)
    print("\n2Ô∏è‚É£ MMR SEARCH (mais diverso):")
    for i, doc in enumerate(docs_mmr, 1):
        texto_resumido = doc.page_content[:50] + "..."
        print(f"   {i}. {texto_resumido}")
except:
    print("\n2Ô∏è‚É£ MMR n√£o dispon√≠vel nesta vers√£o")

print("\nüí° MMR √© √∫til quando voc√™ quer resultados relevantes MAS diversos!")

## üìä M√©tricas e Avalia√ß√£o de Vector Stores

Como saber se seu vector store est√° funcionando bem? Vamos criar algumas m√©tricas simples!

In [None]:
# Criando fun√ß√£o para avaliar qualidade das buscas
def avaliar_vector_store(vector_store, queries_teste, respostas_esperadas):
    """
    Avalia a qualidade de um vector store
    """
    scores = []
    
    print("üìä AVALIANDO QUALIDADE DO VECTOR STORE")
    print("="*50)
    
    for i, (query, palavras_esperadas) in enumerate(zip(queries_teste, respostas_esperadas)):
        # Busca o documento mais relevante
        docs = vector_store.similarity_search(query, k=1)
        
        if docs:
            documento_encontrado = docs[0].page_content.lower()
            
            # Conta quantas palavras-chave esperadas aparecem no resultado
            palavras_encontradas = 0
            for palavra in palavras_esperadas:
                if palavra.lower() in documento_encontrado:
                    palavras_encontradas += 1
            
            score = palavras_encontradas / len(palavras_esperadas)
            scores.append(score)
            
            print(f"\nüîç Query {i+1}: '{query}'")
            print(f"üìÑ Documento: {docs[0].page_content[:60]}...")
            print(f"üéØ Score: {score:.2f} ({palavras_encontradas}/{len(palavras_esperadas)} palavras-chave)")
        else:
            scores.append(0)
    
    score_medio = sum(scores) / len(scores) if scores else 0
    print(f"\nüìä SCORE M√âDIO DO VECTOR STORE: {score_medio:.2f}")
    
    return score_medio, scores

# Definindo queries de teste
queries_teste = [
    "linguagem para programar",
    "intelig√™ncia artificial e aprendizado", 
    "desenvolvimento web frontend"
]

# Palavras que esperamos encontrar em cada resposta
respostas_esperadas = [
    ["python", "javascript", "linguagem"],
    ["machine", "learning", "artificial", "deep"],
    ["javascript", "react", "web", "frontend"]
]

# Executando avalia√ß√£o
score_final, scores_individuais = avaliar_vector_store(vector_store, queries_teste, respostas_esperadas)

## üéØ Exerc√≠cio Final: Vector Store Completo

Hora do exerc√≠cio final! Vamos criar um vector store completo do zero.

In [None]:
# üéØ EXERC√çCIO FINAL: Vector Store sobre Esportes
# Sua miss√£o: criar um sistema completo de busca sobre esportes

print("üèÜ EXERC√çCIO FINAL: Sistema de Busca sobre Esportes")
print("="*60)
print("\nüìù TAREFAS:")
print("1. Criar pelo menos 8 documentos sobre diferentes esportes")
print("2. Criar o vector store")
print("3. Fazer 3 buscas diferentes")
print("4. Salvar o vector store")
print("5. Adicionar 2 novos documentos")
print("6. Testar uma busca final")

# Comece aqui!
# Dica: use esportes como futebol, basquete, t√™nis, nata√ß√£o, etc.

# 1. Seus documentos sobre esportes:
esportes_docs = [
    # Complete com pelo menos 8 frases sobre esportes!
]

print("\nüöÄ Complete este exerc√≠cio para dominar vector stores!")
print("üí° Dica: pense em diferentes aspectos - regras, equipamentos, hist√≥ria...")

## üéä Resumo e Pr√≥ximos Passos

**Parab√©ns! Voc√™ dominou Vector Stores e Embeddings! üéâ**

### üìö O que aprendemos:
- ‚úÖ **Embeddings**: Como transformar texto em vetores num√©ricos
- ‚úÖ **Vector Stores**: Como armazenar e buscar por similaridade sem√¢ntica
- ‚úÖ **FAISS**: Vector store r√°pido para prototipagem
- ‚úÖ **Busca Sem√¢ntica**: Encontrar documentos por significado, n√£o palavras exatas
- ‚úÖ **Persist√™ncia**: Salvar e carregar vector stores
- ‚úÖ **M√©tricas**: Avaliar a qualidade das buscas

### üîÑ Conex√£o com o curso:
- **M√≥dulos anteriores**: Usamos Documents do m√≥dulo 8
- **Pr√≥ximo m√≥dulo**: RAG (Retrieval Augmented Generation) - onde vamos conectar vector stores com LLMs!

### üéØ **No pr√≥ximo m√≥dulo (RAG)** vamos:
- Conectar vector stores com Gemini/ChatGPT
- Fazer perguntas e obter respostas baseadas em nossos documentos
- Criar um sistema completo de Q&A

**Dica!** Vector Stores s√£o a base de quase todas as aplica√ß√µes modernas de IA que trabalham com documentos!

![](https://s3.us-east-1.amazonaws.com/turing.education/notebooks/imagens/langchain-modulo-09_img_02.png)