# PR√ÅCTICA RAG

Las herramientas que el agente puede ocupar incluyen servicios de b√∫squeda en internet que permiten extender el conocimiento no disponible por la LLM ya que a√±adimos esos hechos al contexto de la consulta. Pero veremos que estos esquemas pueden extenderse tambi√©n con mecanismos de b√∫squeda como lo son las bases de datos vectoriales.

Gracias a estos medio podemos realizar un amplia recolecci√≥n de informaci√≥n previo a su env√≠o a la LLM para obtener el resultado final.

In [45]:
from dotenv import load_dotenv

load_dotenv(dotenv_path=r"C:\Users\ST09\Documents\GitHub\STEMIA\M√≥dulo 5 - Retrieval Augmented Generation (RAG)\Fundamentos de los Sistemas RAG\Pr√°ctica\.env", override=True)

True

In [46]:
import os

# Verificar si la API key est√° configurada
api_key = os.getenv("API_KEY_OPENAI")
if api_key:
    print(f"‚úì API_KEY_OPENAI configurada (longitud: {len(api_key)} caracteres)")
else:
    print("‚úó API_KEY_OPENAI no encontrada")
    print("Aseg√∫rate de que el archivo .env contiene: API_KEY_OPENAI=tu_clave")

‚úì API_KEY_OPENAI configurada (longitud: 164 caracteres)


No es tarea trivial ya que encontrar informaci√≥n pertinente para resolver nuestra consulta requiere de encontrar la informaci√≥n relevante de nuestra base de conocimiento. Esto puede realizarse de distintas formas, mediante palabras clave o metadatos durante la consulta aunque las bases de datos vectoriales han sido uno de los puntos clave en la evoluci√≥n de estos sistemas.

Empleamos bases de datos vectoriales ya que las LLM nos ofrecen la opci√≥n de trabajar con los **embeddings** que sabemos aportan un vector denso de caracter√≠sticas sem√°nticamente relevante. Por lo tanto, podemos realizar una b√∫squeda por vectores proximos entendiendo que los textos que representan esos vectores ser√°n clave para resolver la consulta en cuesti√≥n.

#### Vector search

Sin desplegar grandes soluciones, [FAISS](https://faiss.ai/) nos ofrece un medio sencillo por el que probar esta interacci√≥n. Elegiremos primeramente una fuente de la que leer la informaci√≥n.

In [47]:
from langchain_community.document_loaders import WebBaseLoader  ## ojo librer√≠a langchain

loader = WebBaseLoader("https://python.langchain.com/docs/introduction/")
documents = loader.load()

Tambi√©n deberemos elegir un modelo capaz de construir los embeddings dado un texto. Este mismo modelo ser√° consultado ante una pregunta para obtener los textos o mejor dicho, vectores, que ofrecen la informaci√≥n relevante para nuestra consulta.

In [48]:
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_community.vectorstores import FAISS
from langchain_community.embeddings import HuggingFaceEmbeddings

# Creamos embeddings
embedding_model = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")

# Creamos vectorstore FAISS
vectorstore = FAISS.from_documents(documents, embedding_model)

print("Vectorstore creado con √©xito.")


Vectorstore creado con √©xito.


Una vez estas piezas est√°n dispuestas solo tenemos que invocar a la cadena de acciones necesarias. Para simplificar esta operativa LangChain ya dispone de este mecanismo implementado de forma que es sencillo construir el grafo correspondiente.

In [None]:
# !pip uninstall -y langchain langchain-core langchain-community langchain-openai
# !pip install -U "langchain==0.3.*" "langchain-core==0.3.*" "langchain-community==0.3.*" "langchain-openai==0.2.*" "pydantic>=2,<3"
#! pip uninstall -y openai
#! pip install -U "openai>=1.40.0"
# ! pip install -U "typing_extensions>=4.12.2"


In [37]:
import os
from dotenv import load_dotenv
from openai import OpenAI

client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": "Hola!"}]
)

In [49]:
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate

In [50]:
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(
    model="gpt-4o-mini",   
    temperature=0.0,
    timeout=60,
    max_retries=2,
)


Retrieval (recuperaci√≥n) ‚Üí buscar la informaci√≥n relevante.

Generation (generaci√≥n) ‚Üí usar un modelo LLM para generar la respuesta con esa informaci√≥n.

In [51]:
# Busca la infor en vectorstore y devuelve la m√°s relevante 
retriever = vectorstore.as_retriever(search_kwargs={"k": 5})

In [52]:
prompt = ChatPromptTemplate.from_messages([
    ("system",
     "Eres un asistente experto. Responde SOLO con el contexto. "
     "Si no est√° en el contexto, dilo claramente. Cita [S1], [S2], ..."),
    ("human", "Pregunta: {question}\n\nContexto:\n{context}")
])

In [53]:
def _format_context(docs, max_chars=1200):
    partes = []
    for i, d in enumerate(docs, start=1):
        src = d.metadata.get("source") or d.metadata.get("url") or d.metadata.get("path") or "desconocido"
        txt = (d.page_content or "").replace("\n", " ").strip()
        if len(txt) > max_chars:
            txt = txt[:max_chars] + "..."
        partes.append(f"[S{i}] Fuente: {src}\n{txt}")
    return "\n\n".join(partes)

In [56]:
def consultar_bd(question: str, k: int = 5):
    docs = retriever.invoke(question)
    ctx = _format_context(docs)
    messages = prompt.format_messages(question=question, context=ctx)
    ai_msg = llm.invoke(messages)
    return {"answer": ai_msg.content, "source_documents": docs}

In [57]:
# Ejemplo:

result = consultar_bd("¬øQu√© es LangChain y para qu√© sirve?")
print(result["answer"])
for i, d in enumerate(result["source_documents"], start=1):
    print(f"[S{i}] ->", d.metadata.get("source") or d.metadata.get("url") or d.metadata.get("path"))

LangChain es una herramienta que permite construir aplicaciones utilizando modelos de lenguaje (LLM) y se utiliza para crear chatbots, sistemas de preguntas y respuestas, motores de b√∫squeda sem√°ntica, y aplicaciones de generaci√≥n aumentada por recuperaci√≥n (RAG), entre otros. [S1]
[S1] -> https://python.langchain.com/docs/introduction/


Podemos ver los extractos de texto rescatados que han sido a√±adidos a la consulta.

In [58]:
print(result["source_documents"])

[Document(id='488c5d42-0ba6-4cee-85e0-557481c2b2b8', metadata={'source': 'https://python.langchain.com/docs/introduction/', 'title': 'introduction | ü¶úÔ∏èüîó LangChain', 'description': '‚ö†Ô∏è THESE DOCS ARE OUTDATED. Visit the new v1.0 docs', 'language': 'en'}, page_content='\n\n\n\n\nintroduction | ü¶úÔ∏èüîó LangChain\n\n\n\n\n\n\n\n\nSkip to main content‚ö†Ô∏è THESE DOCS ARE OUTDATED. Visit the new v1.0 docsIntegrationsAPI ReferenceMoreContributingPeopleError referenceLangSmithLangGraphLangChain HubLangChain JS/TSv0.3v0.3v0.2v0.1üí¨SearchIntroductionTutorialsBuild a Question Answering application over a Graph DatabaseindexBuild a simple LLM application with chat models and prompt templatesBuild a ChatbotBuild a Retrieval Augmented Generation (RAG) App: Part 2Build an Extraction ChainBuild an AgentTaggingBuild a Retrieval Augmented Generation (RAG) App: Part 1Build a semantic search engineBuild a Question/Answering system over SQL dataSummarize TextHow-to guidesindexHow to use 