## Re-ranking por relevancia marginal máxima (MMR)

MMR es un método de re-ranking que combina la relevancia y la diversidad de los documentos recuperados. El objetivo es maximizar la relevancia de los documentos devueltos y minimizar la redundancia entre ellos.

Esto puede ser útil para incrementar la habilidad de los modelos de lenguage para generar respuestas con mayor cobertura y profundidad.

Su algoritmo es el siguiente:

1. Calcular los `embeddings` para cada documento y para la consulta.
2. Seleccionar el documento más relevante para la consulta.
3. Para cada documento restante, calcular el promedio de similitud de los documentos ya seleccionados.
4. Seleccionar el documento que es, en promedio, menos similar a los documentos ya seleccionados.
5. Repitir los pasos 3 y 4 hasta que se hayan seleccionado `k` documentos. Es decir, una lista ordenada que parte del documento que más contribuye a la diversidad general hasta el documento que contribuye menos.

En Langchain, el algoritmo de MMR es utilizado después de que el `retriever` ha recuperado los documentos más relevantes para la consulta. Por lo tanto, nos aseguramos que estamos seleccionando documentos diversos de un conjunto de documentos que ya son relevantes para la consulta.

## Librerías

In [None]:
from dotenv import load_dotenv
from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import Chroma

from src.langchain_docs_loader import load_langchain_docs_splitted

load_dotenv()

## Carga de datos

In [None]:
docs = load_langchain_docs_splitted()

## Creación de retriever

Normalmente creamos nuestro retriever de la siguiente manera:

In [None]:
similarity_retriever = Chroma.from_documents(
    documents=docs,
    embedding=OpenAIEmbeddings(),
).as_retriever(k=4)

Sin embargo, podrás notar que de hacerlo, el tipo de búsqueda que se realiza es por similitud de vectores. En este caso, queremos realizar una búsqueda por similitud de vectores, pero con un re-ranking por relevancia marginal máxima (MMR).

In [None]:
similarity_retriever.search_type

Entonces, para crear un retriever con re-ranking por MMR, debemos hacer lo siguiente:

In [None]:
mmr_retriever =

Ahora nuestro retriever está listo para ser utilizado con re-ranking por MMR.

In [None]:
mmr_retriever.search_type

## Uso del retriever

In [None]:
similarity_retriever.get_relevant_documents(
    "How to integrate LCEL into my Retrieval augmented generation system with a keyword search retriever?"
)

In [None]:
mmr_retriever.get_relevant_documents(
    "How to integrate LCEL into my Retrieval augmented generation system with a keyword search retriever?"
)