# Maximal Marginal Relevance
Combina busca semântica com uma otimização para trazer apenas documentos relevantes e não duplicados

### Setup:

In [1]:
from langchain_community.document_loaders.pdf import PyPDFLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter

paths = [
    "../documents/ApostilaLangChain.pdf",
    "../documents/Explorando a API da OpenAI.pdf",
    "../documents/Explorando o Universo das IAs com Hugging Face.pdf"
]

pages = []

for path in paths:
    loader = PyPDFLoader(path)
    pages.extend(loader.load())
    
splitter = RecursiveCharacterTextSplitter(
    chunk_size=500, 
    chunk_overlap=50,
    separators=["\n\n", "\n",  " ", ""]
)

documents = splitter.split_documents(pages)

from langchain_openai import OpenAIEmbeddings
from langchain_community.vectorstores.chroma import Chroma

embedding = OpenAIEmbeddings()

chroma_directory = "../documents/chroma_vectorstore"

vector_store = Chroma.from_documents(
    documents=documents,
    embedding=embedding,
    persist_directory=chroma_directory
)



In [4]:
question = 'O que é a OpenAI?'

documents_result = vector_store.max_marginal_relevance_search(question, k=3, fetch_k=10)

for doc in documents_result:
    print(doc.page_content)
    print(f'==========={doc.metadata}\n\n')

Explorando a API da OpenAI
01. Bem-vindos ao curso Explorando a API da OpenAI
Olá e bem-vindos ao nosso curso “Explorando a API da OpenAI”! Estou super animado por ter vocês
aqui e mal posso esperar para explorarmos juntos esse universo fascinante da programação e da
inteligência artificial.
Vocês já devem ter percebido que a IA está mudando o jogo em muitos campos, certo? É incrível como
ela está transformando a maneira como lidamos com informações e realiza tarefas que antes pareciam


Explorando a API da OpenAI
Conteúdo
01. Bem-vindos ao curso Explorando a API da OpenAI 4
02. Explorando a documentação da API 5
O que é uma API? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
A OpenAI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Acessando a documentação da API . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6


Explorando a API da OpenAI
Guias
Também está disponível diversos guias de boas 

### Filtragem
É possível filtrar por dados específicos de algum metadado

In [6]:
question = 'O que a apostila de huggingface fala sobre OpenAI e chatGPT?'

documents_result = vector_store.similarity_search(
    query=question,
    k=3,
    filter={'source': 'Explorando o Universo das IAs com Hugging Face.pdf'}) # Filtro por 1 source

documents_result = vector_store.similarity_search(
    query=question,
    k=3,
    filter={'source': {'$in': ["Explorando o Universo das IAs com Hugging Face.pdf"]}}) # Filtro por lista de source

for doc in documents_result:
    print(doc.page_content)
    print(f'==========={doc.metadata}\n\n')

Explorando o Universo das IAs com Hugging Face
06. Modelos de conversação e geração de texto (chatbots)
Vamos aprender agora a usar modelos de conversação, que funcionam de forma parecida com chatbots
como ChatGPT . Na realidade, estes modelos estão classificados na tarefa de geração de texto ( text
generation ) no Hugging Face:
Figure 16: Página principal da tarefa text-generation do Hugging Face.
Vamos utilizar o modelo Felladrin/Llama-68M-Chat-v1 , disponível no link a seguir:


Explorando o Universo das IAs com Hugging Face
06. Modelos de conversação e geração de texto (chatbots)
Vamos aprender agora a usar modelos de conversação, que funcionam de forma parecida com chatbots
como ChatGPT . Na realidade, estes modelos estão classificados na tarefa de geração de texto ( text
generation ) no Hugging Face:
Figure 16: Página principal da tarefa text-generation do Hugging Face.
Vamos utilizar o modelo Felladrin/Llama-68M-Chat-v1 , disponível no link a seguir:


Explorando o Universo das 