## RAG-MongoAtlas

Este proyecto implementa un sistema RAG utilizando MongoDB Atlas para almacenar y recuperar datos. La arquitectura permite aprovechar los datos almacenados en MongoDB para enriquecer las respuestas generadas por el modelo de lenguaje. Mediante un proceso de recuperación de información, el modelo accede a documentos relevantes y los utiliza para generar respuestas más precisas y contextuales a las preguntas del usuario.

Importa las librerías necesarias

In [99]:
from pymongo import MongoClient
from langchain_community.document_loaders import PyPDFLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_mongodb import MongoDBAtlasVectorSearch
from langchain.docstore.document import Document
from langchain_huggingface import HuggingFaceEmbeddings
from langchain_huggingface import HuggingFaceEmbeddings
from langchain_ollama.llms import OllamaLLM
from langchain.chains import RetrievalQA
from pymongo import MongoClient
from langchain_mongodb import MongoDBAtlasVectorSearch
from pymongo.errors import OperationFailure
from langchain.prompts import ChatPromptTemplate
from langchain_ollama.chat_models import ChatOllama
from langchain_core.runnables import RunnableLambda, RunnablePassthrough
from langchain_core.output_parsers import StrOutputParser


Conecta a Atlas Cluster

In [57]:
client = MongoClient("mongodb+srv://username:password@mycluster.xxxxx.mongodb.net/?")
database = 'rag_db'
collection = client["rag_db"]["rag_collec"]
ATLAS_VECTOR_SEARCH_INDEX_NAME='index'

Carga los pdfs, extraemos los textos y los dividimos

In [58]:
pdf_files = ["documents/pruebaLLM.pdf","documents/pruebaLLM2.pdf", "documents/MartinScorsese.pdf"]  # Agrega la lista de archivos PDF

all_documents = []

for document in pdf_files:
    loader = PyPDFLoader(document) # Carga el documento
    data = loader.load()
    text_splitter = RecursiveCharacterTextSplitter(chunk_size=400, chunk_overlap=20)    # Divide el texto en chunks
    documents = text_splitter.split_documents(data)
    all_documents.extend(documents)

print(f"Se cargaron y dividieron {len(all_documents)} fragmentos de texto.")

Se cargaron y dividieron 220 fragmentos de texto.


Inicializa los embeddings de HuggingFace y la vector store

In [59]:
embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")

vector_store = MongoDBAtlasVectorSearch(
    embedding=embeddings,
    collection=collection,
    index_name=ATLAS_VECTOR_SEARCH_INDEX_NAME,
    relevance_score_fn="cosine",
)

Inserta los documentos en el vector store de MongoDB Atlas

In [102]:
vector_store.add_documents(all_documents)
print("Documentos añadidos al vector store correctamente")

Documentos añadidos al vector store correctamente


In [61]:
retriever = vector_store.as_retriever()

Intenta crear un índice de búsqueda vectorial y maneja el error si ya existe.

In [None]:
try:
    vector_store.create_vector_search_index(dimensions=384) # 384 por los embeddings
except OperationFailure as e:
    if e.code == 68:  # Código de duplicados
        print(f"El índice '{ATLAS_VECTOR_SEARCH_INDEX_NAME}' ya existe.")
    else:
        print(f"Error al crear el índice: {e}")

El índice 'index' ya existe.


Crea una cadena de procesamiento de lenguaje natural utilizando un LLM local (Ollama) para responder preguntas basadas en un contexto dado

In [81]:
# Prompt: Se define una plantilla de pregunta-respuesta que toma un contexto y una pregunta como entrada
template = """Answer the question based only on the following context:
{context}

Question: {question}
"""
prompt = ChatPromptTemplate.from_template(template)

# Local LLM: Se configura el modelo llama3.2 para generar respuestas de manera local
ollama_llm = "llama3.2"
model_local = ChatOllama(model=ollama_llm)

# Chain Se construye un pipeline que pasa el contexto desde el retriever
chain = (
    {"context": retriever, "question": RunnablePassthrough()}
    | prompt
    | model_local
    | StrOutputParser()
)

Probamos el modelo

In [None]:
chain.invoke("Trata temas como el amor?")

'Sí, según el contexto proporcionado, las páginas mencionadas tratan temas relacionados al amor y su complejidad. La repetición del mismo texto en diferentes documentos sugiere una insistencia o una importancia particular en la exploración de este tema. Sin embargo, no hay una descripción específica del contenido del libro que indique si trata solo del amor o si aborda otros temas relacionados.'

In [93]:
chain.invoke("Menciona algo de Taxi Driver?Pon ejemplos")

'Sí, menciona varias referencias a Taxi Driver en el texto proporcionado. Algunos ejemplos son:\n\n1. La comparación del tránsito sacramental con la instancia del sacrificio que debe preceder a la salvación o purificación, citada como ejemplo del "tránsito sacramental" mencionado en Taxi Driver.\n2. Una mención explícita a la película "Taxi Driver", donde se cita el artículo de AISTHESIS N° 37 de 2004 sobre Martin Scorsese y su interpretación de la película.\n3. La descripción de una escena de Charlie en su habitación, encadenada con un proyector que da paso a los créditos, diseñados sobre un fondo de imágenes familiares de formato pequeño, lo que se asocia con la escena final de Taxi Driver donde Travis se apunta un tiro y el proyectoor se activa mientras Charlie se sienta en su habitación.\n4. La mención al personaje Travis, mencionado como ejemplo de cómo Scorsese utiliza personajes que hablan mucho pero hacen poco, lo que hace referencia a la complejidad del personaje de Travis en 

En conclusión, este sistema utiliza MongoDB Atlas para almacenar y gestionar los documentos PDF cargados, los cuales se dividen en fragmentos para ser procesados por un modelo LLM. A través de MongoDB Atlas, se garantiza una gestión eficiente de grandes volúmenes de datos. Además, el modelo LLM responde de manera coherente a las consultas, proporcionando respuestas basadas en el contenido de los documentos almacenados.