## Recuperador H√≠brido - Combinando Recuperadores Densos y Dispersos

Un recuperador h√≠brido combina dos enfoques complementarios:
- **Recuperaci√≥n Densa**: Utiliza embeddings vectoriales para b√∫squeda sem√°ntica (captura el significado)
- **Recuperaci√≥n Dispersa**: Utiliza t√©cnicas de coincidencia de palabras clave como BM25 (captura t√©rminos exactos)

Esta combinaci√≥n mejora la calidad de recuperaci√≥n al aprovechar las fortalezas de ambos m√©todos.

In [1]:
# Importaci√≥n de librer√≠as necesarias para la b√∫squeda h√≠brida

# FAISS: Librer√≠a de Facebook para b√∫squeda de similitud vectorial eficiente
from langchain_community.vectorstores import FAISS

# HuggingFaceEmbeddings: Para generar embeddings usando modelos de HuggingFace
from langchain_huggingface import HuggingFaceEmbeddings

# BM25Retriever: Implementaci√≥n del algoritmo BM25 para recuperaci√≥n dispersa basada en palabras clave
from langchain_community.retrievers import BM25Retriever

# EnsembleRetriever: Combina m√∫ltiples recuperadores con pesos espec√≠ficos
from langchain.retrievers import EnsembleRetriever

# Document: Clase para representar documentos con contenido y metadatos
from langchain.schema import Document

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
# Paso 1: Crear documentos de ejemplo
# Creamos una lista de documentos con diferentes tem√°ticas para probar el sistema de recuperaci√≥n
docs = [
    # Documento sobre LangChain y su prop√≥sito
    Document(page_content="LangChain ayuda a construir aplicaciones LLM."),
    # Documento sobre bases de datos vectoriales
    Document(page_content="Pinecone es una base de datos vectorial para b√∫squeda sem√°ntica."),
    # Documento con informaci√≥n geogr√°fica
    Document(page_content="La Torre Eiffel est√° ubicada en Par√≠s."),
    # Documento sobre aplicaciones de IA ag√©ntica con Langchain
    Document(page_content="Langchain puede ser usado para desarrollar aplicaciones de IA ag√©ntica."),
    # Documento sobre las capacidades de Langchain
    Document(page_content="Langchain tiene muchos tipos de recuperadores.")
]

# Paso 2: Configurar el Recuperador Denso (FAISS + HuggingFace)
# Inicializamos el modelo de embeddings de HuggingFace
# all-MiniLM-L6-v2 es un modelo ligero y eficiente que genera vectores de 384 dimensiones
embedding_model = HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2")

# Creamos una base de datos vectorial FAISS a partir de los documentos
# FAISS convierte cada documento en un vector usando el modelo de embeddings
dense_vectorstore = FAISS.from_documents(docs, embedding_model)

# Convertimos el almac√©n vectorial en un recuperador
# Este recuperador realizar√° b√∫squedas por similitud sem√°ntica
dense_retriever = dense_vectorstore.as_retriever()

In [3]:
# Paso 3: Configurar el Recuperador Disperso (BM25)
# BM25 es un algoritmo de ranking que usa frecuencia de t√©rminos y longitud de documentos
# Es excelente para coincidencias exactas de palabras clave
sparse_retriever = BM25Retriever.from_documents(docs)

# Configuramos el n√∫mero de documentos m√°s relevantes a recuperar (top-k)
# k=3 significa que devolver√° los 3 documentos m√°s relevantes
sparse_retriever.k = 3

# Paso 4: Combinar recuperadores con EnsembleRetriever
# El recuperador h√≠brido combina los resultados de ambos recuperadores
hybrid_retriever = EnsembleRetriever(
    # Lista de recuperadores a combinar: denso (sem√°ntico) y disperso (palabras clave)
    retrievers=[dense_retriever, sparse_retriever],
    # Pesos para cada recuperador: 70% denso, 30% disperso
    # Los pesos determinan la importancia relativa de cada m√©todo en los resultados finales
    weight=[0.7, 0.3]
)

In [4]:
# Mostrar la configuraci√≥n del recuperador h√≠brido
# Esto nos permite verificar c√≥mo est√° configurado el sistema
hybrid_retriever

EnsembleRetriever(retrievers=[VectorStoreRetriever(tags=['FAISS', 'HuggingFaceEmbeddings'], vectorstore=<langchain_community.vectorstores.faiss.FAISS object at 0x000002E773A33980>, search_kwargs={}), BM25Retriever(vectorizer=<rank_bm25.BM25Okapi object at 0x000002E770DCA660>, k=3)], weights=[0.5, 0.5])

In [5]:
# Paso 5: Realizar una consulta y obtener resultados
# Definimos una pregunta que queremos responder usando nuestro sistema de recuperaci√≥n
query = "¬øC√≥mo puedo construir una aplicaci√≥n usando LLMs?"

# Invocamos el recuperador h√≠brido con nuestra consulta
# El sistema combinar√° los resultados de b√∫squeda sem√°ntica (FAISS) y de palabras clave (BM25)
results = hybrid_retriever.invoke(query)

# Paso 6: Mostrar los resultados recuperados
# Iteramos sobre cada documento recuperado y lo mostramos
for i, doc in enumerate(results):
    # Mostramos el n√∫mero del documento y su contenido
    print(f"\nüîπ Documento {i+1}:\n{doc.page_content}")


üîπ Documento 1:
LangChain ayuda a construir aplicaciones LLM.

üîπ Documento 2:
Pinecone es una base de datos vectorial para b√∫squeda sem√°ntica.

üîπ Documento 3:
Langchain tiene muchos tipos de recuperadores.

üîπ Documento 4:
Langchain puede ser usado para desarrollar aplicaciones de IA ag√©ntica.


### Pipeline RAG con Recuperador H√≠brido

Ahora construiremos un pipeline RAG (Retrieval-Augmented Generation) completo que:
1. Recupera documentos relevantes usando el recuperador h√≠brido
2. Utiliza esos documentos como contexto para un LLM
3. Genera una respuesta fundamentada en la informaci√≥n recuperada

In [6]:
# Importaci√≥n de componentes para construir el pipeline RAG

# init_chat_model: Funci√≥n para inicializar modelos de chat de diferentes proveedores
from langchain.chat_models import init_chat_model

# PromptTemplate: Para crear plantillas de prompts con variables din√°micas
from langchain.prompts import PromptTemplate

# create_stuff_documents_chain: Crea una cadena que "rellena" documentos en un prompt
from langchain.chains.combine_documents import create_stuff_documents_chain

# create_retrieval_chain: Combina recuperaci√≥n de documentos con generaci√≥n de respuestas
from langchain.chains.retrieval import create_retrieval_chain

In [7]:
# Paso 5: Crear la plantilla de prompt
# Definimos c√≥mo queremos que el LLM use el contexto recuperado para responder
prompt = PromptTemplate.from_template("""
Responde la pregunta bas√°ndote en el contexto a continuaci√≥n.

Contexto:
{context}

Pregunta: {input}
""")

# Paso 6: Inicializar el modelo de lenguaje (LLM)
# Usamos GPT-3.5-turbo de OpenAI con temperatura 0.2
# temperature=0.2 significa respuestas m√°s determin√≠sticas y menos creativas
llm = init_chat_model("openai:gpt-3.5-turbo", temperature=0.2)

# Mostrar la configuraci√≥n del LLM
llm

ChatOpenAI(client=<openai.resources.chat.completions.completions.Completions object at 0x000002E7759D3CB0>, async_client=<openai.resources.chat.completions.completions.AsyncCompletions object at 0x000002E775F7F230>, root_client=<openai.OpenAI object at 0x000002E773C7FE60>, root_async_client=<openai.AsyncOpenAI object at 0x000002E775ACA570>, temperature=0.2, model_kwargs={}, openai_api_key=SecretStr('**********'), stream_usage=True)

In [8]:
# Paso 7: Crear la cadena de documentos
# Esta cadena toma los documentos recuperados y los combina con el prompt
# "stuff" significa que todos los documentos se insertan directamente en el prompt
document_chain = create_stuff_documents_chain(llm=llm, prompt=prompt)

# Paso 8: Crear la cadena RAG completa
# Esta cadena combina:
# 1. El recuperador h√≠brido (para obtener documentos relevantes)
# 2. La cadena de documentos (para generar la respuesta con el LLM)
rag_chain = create_retrieval_chain(retriever=hybrid_retriever, combine_docs_chain=document_chain)

# Mostrar la estructura de la cadena RAG
rag_chain

RunnableBinding(bound=RunnableAssign(mapper={
  context: RunnableBinding(bound=RunnableLambda(lambda x: x['input'])
           | EnsembleRetriever(retrievers=[VectorStoreRetriever(tags=['FAISS', 'HuggingFaceEmbeddings'], vectorstore=<langchain_community.vectorstores.faiss.FAISS object at 0x000002E773A33980>, search_kwargs={}), BM25Retriever(vectorizer=<rank_bm25.BM25Okapi object at 0x000002E770DCA660>, k=3)], weights=[0.5, 0.5]), kwargs={}, config={'run_name': 'retrieve_documents'}, config_factories=[])
})
| RunnableAssign(mapper={
    answer: RunnableBinding(bound=RunnableBinding(bound=RunnableAssign(mapper={
              context: RunnableLambda(format_docs)
            }), kwargs={}, config={'run_name': 'format_inputs'}, config_factories=[])
            | PromptTemplate(input_variables=['context', 'input'], input_types={}, partial_variables={}, template='\nResponde la pregunta bas√°ndote en el contexto a continuaci√≥n.\n\nContexto:\n{context}\n\nPregunta: {input}\n')
            | C

In [9]:
# Paso 9: Realizar una pregunta al sistema RAG
# Creamos un diccionario con nuestra consulta
query = {"input": "¬øC√≥mo puedo construir una aplicaci√≥n usando LLMs?"}

# Invocamos la cadena RAG completa
# Esto ejecutar√°: recuperaci√≥n de documentos ‚Üí inserci√≥n en prompt ‚Üí generaci√≥n de respuesta
response = rag_chain.invoke(query)

# Paso 10: Mostrar los resultados
# Imprimimos la respuesta generada por el LLM
print("‚úÖ Respuesta:\n", response["answer"])

# Mostramos los documentos fuente que se usaron para generar la respuesta
print("\nüìÑ Documentos Fuente:")
for i, doc in enumerate(response["context"]):
    # Para cada documento, mostramos su n√∫mero y contenido
    print(f"\nDoc {i+1}: {doc.page_content}")

‚úÖ Respuesta:
 Para construir una aplicaci√≥n utilizando LLMs, puedes utilizar LangChain, ya que esta plataforma ayuda a construir aplicaciones LLM. Adem√°s, puedes aprovechar Pinecone como una base de datos vectorial para b√∫squeda sem√°ntica, y utilizar los diferentes tipos de recuperadores que ofrece LangChain. De esta manera, podr√°s desarrollar aplicaciones de IA ag√©ntica utilizando LLMs.

üìÑ Documentos Fuente:

Doc 1: LangChain ayuda a construir aplicaciones LLM.

Doc 2: Pinecone es una base de datos vectorial para b√∫squeda sem√°ntica.

Doc 3: Langchain tiene muchos tipos de recuperadores.

Doc 4: Langchain puede ser usado para desarrollar aplicaciones de IA ag√©ntica.
