# Inicio Rapido

LangChain tiene varios componentes diseñados para ayudar a construir aplicaciones de preguntas y respuestas, y aplicaciones RAG de manera más general. Para familiarizarnos con ellos, construiremos una aplicación simple de preguntas y respuestas sobre una fuente de datos de texto. En el proceso, revisaremos una arquitectura típica de preguntas y respuestas, discutiremos los componentes relevantes de LangChain y resaltaremos recursos adicionales para técnicas más avanzadas de preguntas y respuestas. También veremos cómo LangSmith puede ayudarnos a rastrear y entender nuestra aplicación. LangSmith será cada vez más útil a medida que nuestra aplicación crezca en complejidad.

Arquitectura
Crearemos una aplicación RAG típica según se describe en la introducción de preguntas y respuestas, que consta de dos componentes principales:

1. Indexación: una canalización para ingerir datos desde una fuente e indexarlos. Esto suele ocurrir offline.

2. Recuperación y generación: la cadena RAG real, que toma la consulta del usuario en tiempo de ejecución y recupera los datos relevantes del índice, luego los pasa al modelo.

La secuencia completa, desde datos en bruto hasta la respuesta, se verá así:

**Indexación**
- Carga: Primero necesitamos cargar nuestros datos. Utilizaremos DocumentLoaders para esto.
- División: Los separadores de texto dividen documentos grandes en fragmentos más pequeños. Esto es útil tanto para indexar datos como para pasarlos a un modelo, ya que los fragmentos grandes son más difíciles de buscar y no caben en la ventana de contexto finito de un modelo.
- Almacenamiento: Necesitamos un lugar para almacenar e indexar nuestros fragmentos, para que puedan buscarse posteriormente. Esto se hace a menudo utilizando un VectorStore y un modelo de embeddings.

**Recuperación y generación**
- Recuperación: Dada una entrada del usuario, se recuperan los fragmentos relevantes del almacenamiento utilizando un Recuperador.
- Generación: Un ChatModel / LLM produce una respuesta utilizando un prompt que incluye la pregunta y los datos recuperados.

Configuración
Dependencias
Utilizaremos un modelo de chat de OpenAI, embeddings y un vector store Chroma en este tutorial, pero todo lo mostrado aquí funciona con cualquier modelo de chat o LLM, embeddings, y vector store o recuperador.

Utilizaremos los siguientes paquetes:

In [1]:
# %pip install --upgrade --quiet  langchain langchain-community langchainhub langchain-openai chromadb bs4

Note: you may need to restart the kernel to use updated packages.


In [1]:
import dotenv

dotenv.load_dotenv()

True

Necesitamos configurar la variable de entorno OPENAI_API_KEY, que se puede hacer directamente o cargar desde un archivo .env de esta manera:

# LangSmith

Muchas de las aplicaciones que construyas con LangChain contendrán múltiples pasos con múltiples invocaciones de llamadas a LLM. A medida que estas aplicaciones se vuelven más complejas, se vuelve crucial poder inspeccionar qué está sucediendo exactamente dentro de tu cadena o agente. La mejor manera de hacer esto es con LangSmith.

Cabe destacar que LangSmith no es necesario, pero es útil. Si deseas utilizar LangSmith, después de registrarte en el enlace anterior, asegúrate de configurar tus variables de entorno para comenzar a registrar trazas:

# Vista previa

En esta guía, construiremos una aplicación de preguntas y respuestas sobre la publicación del blog "LLM Powered Autonomous Agents" de Lilian Weng, lo que nos permitirá hacer preguntas sobre el contenido de la publicación.

Podemos crear un simple flujo de trabajo de indexación y una cadena RAG para lograr esto en ~20 líneas de código:

In [2]:
import bs4
from langchain import hub
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.document_loaders import WebBaseLoader
from langchain_community.vectorstores import Chroma
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
from langchain_openai import ChatOpenAI, OpenAIEmbeddings

In [4]:
# Load, chunk and index the contents of the blog.
loader = WebBaseLoader(
    web_paths=("https://lilianweng.github.io/posts/2023-06-23-agent/",),
    bs_kwargs=dict(
        parse_only=bs4.SoupStrainer(
            class_=("post-content", "post-title", "post-header")
        )
    ),
)
docs = loader.load()

text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
splits = text_splitter.split_documents(docs)
vectorstore = Chroma.from_documents(documents=splits, embedding=OpenAIEmbeddings())

# Retrieve and generate using the relevant snippets of the blog.
retriever = vectorstore.as_retriever()
prompt = hub.pull("rlm/rag-prompt")
llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)


def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)


rag_chain = (
    {"context": retriever | format_docs, "question": RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

In [5]:
rag_chain.invoke("¿Que es la descomposición de tareas?")

'La descomposición de tareas es un proceso en el que se divide un problema o tarea complicada en pasos más pequeños y manejables. Esto permite que un agente o modelo de IA pueda abordar la tarea de manera más efectiva al pensar paso a paso y utilizar la computación en tiempo de prueba para descomponer la tarea en sub-tareas más simples. La descomposición de tareas puede realizarse mediante instrucciones específicas, como prompts simples o instrucciones específicas para cada tarea, o con la ayuda de aportes humanos.'

In [6]:
# cleanup
vectorstore.delete_collection()

# Paseo detallado

Vamos a revisar el código anterior paso a paso para comprender realmente lo que está sucediendo.

# 1. Indexación: Carga
Primero, necesitamos cargar el contenido del blog. Podemos utilizar DocumentLoaders para esto, que son objetos que cargan datos desde una fuente y devuelven una lista de Documentos. Un Documento es un objeto con algún page_content (str) y metadata (dict).

En este caso, utilizaremos WebBaseLoader, que utiliza urllib para cargar HTML desde URL web y BeautifulSoup para analizarlo a texto. Podemos personalizar la conversión de HTML a texto pasando parámetros al analizador BeautifulSoup a través de bs_kwargs (consultar la documentación de BeautifulSoup). En este caso, solo son relevantes las etiquetas HTML con las clases "post-content", "post-title" o "post-header", por lo que eliminaremos todas las demás.

In [8]:
import bs4
from langchain_community.document_loaders import WebBaseLoader

# Only keep post title, headers, and content from the full HTML.
bs4_strainer = bs4.SoupStrainer(class_=("post-title", "post-header", "post-content"))
loader = WebBaseLoader(
    web_paths=("https://lilianweng.github.io/posts/2023-06-23-agent/",),
    bs_kwargs={"parse_only": bs4_strainer},
)
docs = loader.load()

In [9]:
len(docs[0].page_content)

42824

In [10]:
print(docs[0].page_content[:500])



      LLM Powered Autonomous Agents
    
Date: June 23, 2023  |  Estimated Reading Time: 31 min  |  Author: Lilian Weng


Building agents with LLM (large language model) as its core controller is a cool concept. Several proof-of-concepts demos, such as AutoGPT, GPT-Engineer and BabyAGI, serve as inspiring examples. The potentiality of LLM extends beyond generating well-written copies, stories, essays and programs; it can be framed as a powerful general problem solver.
Agent System Overview#
In


## Adentrémonos más

**DocumentLoader:** Objeto que carga datos desde una fuente como una lista de Documentos.
- **Documentación:** Documentación detallada sobre cómo utilizar DocumentLoaders.
- **Integraciones:** Más de 160 integraciones para elegir.
- **Interfaz:** Referencia de API para la interfaz base.

# 2. Indexación: División

Nuestro documento cargado tiene más de 42,000 caracteres de longitud. Esto es demasiado largo para ajustarse en la ventana de contexto de muchos modelos. Incluso para aquellos modelos que podrían ajustar la publicación completa en su ventana de contexto, los modelos pueden tener dificultades para encontrar información en entradas muy largas.

Para manejar esto, dividiremos el Documento en fragmentos para la inserción de vectores. Esto debería ayudarnos a recuperar solo las partes más relevantes del blog en tiempo de ejecución.

En este caso, dividiremos nuestros documentos en fragmentos de 1000 caracteres con 200 caracteres de superposición entre fragmentos. La superposición ayuda a mitigar la posibilidad de separar una declaración de un contexto importante relacionado con ella. Utilizamos RecursiveCharacterTextSplitter, que dividirá recursivamente el documento utilizando separadores comunes como nuevas líneas hasta que cada fragmento tenga el tamaño adecuado. Este es el separador de texto recomendado para casos de uso de texto genérico.

Configuramos add_start_index=True para que el índice de caracteres en el que comienza cada Documento dividido dentro del Documento inicial se conserve como atributo de metadatos "start_index".

In [11]:
from langchain.text_splitter import RecursiveCharacterTextSplitter

text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000, chunk_overlap=200, add_start_index=True
)
all_splits = text_splitter.split_documents(docs)

In [12]:
len(all_splits)

66

In [13]:
len(all_splits[0].page_content)

969

In [14]:
all_splits[10].metadata

{'source': 'https://lilianweng.github.io/posts/2023-06-23-agent/',
 'start_index': 7056}

## Adentrémonos más

**TextSplitter:** Objeto que divide una lista de Documentos en fragmentos más pequeños. Subclase de DocumentTransformers.
- **Explora Separadores conscientes del contexto, que mantienen la ubicación ("contexto") de cada fragmento en el Documento original:**
  - (Archivos Markdown)[https://python.langchain.com/docs/modules/data_connection/document_transformers/markdown_header_metadata]
  - Código (py o js)
  - Documentos científicos
- **Interfaz:** Referencia de API para la interfaz base.

**DocumentTransformer:** Objeto que realiza una transformación en una lista de Documentos.
- **Documentación:** Documentación detallada sobre cómo utilizar DocumentTransformers.
- **Integraciones:** Integraciones disponibles.
- **Interfaz:** Referencia de API para la interfaz base.