# Learning LangChain
by Mayo Oshin, Nuno Campos

In [5]:
# ! pip install langchain_openai

In [1]:
ls

1_LLM_Fundamentals_with_LangChain.ipynb  Arquitecturas.ipynb  memory.ipynb
Agentes_I.ipynb                          Untitled.ipynb


In [2]:
# ir al directorio principal
from os import chdir

# chdir("../")

In [3]:
ls learning_langgraph -la

ls: cannot access 'learning_langgraph': No such file or directory


In [5]:
# cargar varibles
from dotenv import load_dotenv
load_dotenv(dotenv_path='.env')


True


# **Capítulo 1. Fundamentos de LLM con LangChain**

El prefacio te dio una probadita del poder del *prompting* de LLM, donde vimos de primera mano el impacto que diferentes técnicas de *prompting* pueden tener en lo que obtienes de los LLM, especialmente cuando se combinan con criterio. El desafío al construir buenas aplicaciones de LLM radica, de hecho, en cómo construir eficazmente el *prompt* enviado al modelo y procesar la predicción del modelo para devolver una salida precisa (ver Figura 1-1).

**Figura 1-1. El desafío de hacer que los LLM sean una parte útil de tu aplicación**

Si puedes resolver este problema, estás en buen camino para construir aplicaciones de LLM, tanto simples como complejas. En este capítulo, aprenderás más sobre cómo los bloques de construcción de LangChain se mapean a los conceptos de LLM y cómo, cuando se combinan eficazmente, te permiten construir aplicaciones de LLM. Pero primero, la barra lateral "¿Por qué LangChain?" es una breve introducción de por qué creemos que es útil usar LangChain para construir aplicaciones de LLM.

**¿POR QUÉ LANGCHAIN?**

Por supuesto, puedes construir aplicaciones de LLM sin LangChain. La alternativa más obvia es usar el kit de desarrollo de software (SDK) —el paquete que expone los métodos de su API HTTP como funciones en el lenguaje de programación de tu elección— del proveedor de LLM que probaste primero (por ejemplo, OpenAI). Creemos que aprender LangChain valdrá la pena a corto y largo plazo debido a los siguientes factores:

**Patrones comunes preconstruidos**

LangChain viene con implementaciones de referencia de los patrones de aplicación de LLM más comunes (mencionamos algunos de estos en el prefacio: cadena de pensamiento, llamada a herramientas y otros). Esta es la forma más rápida de comenzar con los LLM y, a menudo, podría ser todo lo que necesitas. Sugerimos comenzar cualquier aplicación nueva a partir de estos y verificar si los resultados listos para usar son lo suficientemente buenos para tu caso de uso. Si no, consulta el siguiente punto para la otra mitad de las bibliotecas de LangChain.

**Bloques de construcción intercambiables**

Estos son componentes que se pueden intercambiar fácilmente por alternativas. Cada componente (un LLM, un modelo de chat, un analizador de salida, etc.—más sobre esto en breve) sigue una especificación compartida, lo que hace que tu aplicación esté preparada para el futuro. A medida que los proveedores de modelos lanzan nuevas capacidades y a medida que cambian tus necesidades, puedes hacer evolucionar tu aplicación sin tener que reescribirla cada vez.

A lo largo de este libro, utilizamos los siguientes componentes principales en los ejemplos de código:

* **LLM/modelo de chat:** OpenAI
* **Embeddings:** OpenAI
* **Almacén de vectores:** PGVector

Puedes intercambiar cada uno de estos por cualquiera de las alternativas que se enumeran en las siguientes páginas:

**Modelos de chat**

Consulta la documentación de LangChain. Si no quieres usar OpenAI (una API comercial), te sugerimos Anthropic como una alternativa comercial u Ollama como una de código abierto.

**Embeddings**

Consulta la documentación de LangChain. Si no quieres usar OpenAI (una API comercial), te sugerimos Cohere como una alternativa comercial u Ollama como una de código abierto.

**Almacenes de vectores**

Consulta la documentación de LangChain. Si no quieres usar PGVector (una extensión de código abierto para la popular base de datos SQL Postgres), te sugerimos usar Weaviate (un almacén de vectores dedicado) u OpenSearch (características de búsqueda vectorial que forman parte de una popular base de datos de búsqueda).

Este esfuerzo va más allá, por ejemplo, de que todos los LLM tengan los mismos métodos, con argumentos y valores de retorno similares. Veamos el ejemplo de los modelos de chat y dos proveedores populares de LLM, OpenAI y Anthropic. Ambos tienen una API de chat que recibe mensajes de chat (definidos vagamente como objetos con un string de tipo y un string de contenido) y devuelve un nuevo mensaje generado por el modelo. Pero si intentas usar ambos modelos en la misma conversación, inmediatamente encontrarás problemas, ya que sus formatos de mensajes de chat son sutilmente incompatibles. LangChain abstrae estas diferencias para permitir la construcción de aplicaciones que son verdaderamente independientes de un proveedor en particular. Por ejemplo, con LangChain, una conversación de chatbot en la que utilizas modelos de OpenAI y Anthropic funciona.

Finalmente, a medida que desarrollas tus aplicaciones de LLM con varios de estos componentes, nos ha resultado útil contar con las capacidades de orquestación de LangChain:

* Todos los componentes principales están instrumentados por el sistema de *callbacks* para la observabilidad (más sobre esto en el Capítulo 8).
* Todos los componentes principales implementan la misma interfaz (más sobre esto hacia el final de este capítulo).
* Las aplicaciones de LLM de larga duración se pueden interrumpir, reanudar o reintentar (más sobre esto en el Capítulo 6).

In [None]:
lelc_0101 



# **Configuración de LangChain**

Para seguir el resto del capítulo y los capítulos venideros, te recomendamos configurar LangChain en tu computadora primero.

Consulta las instrucciones en el Prefacio con respecto a la creación de una cuenta de OpenAI y completa estos pasos si aún no lo has hecho. Si prefieres usar un proveedor de LLM diferente, consulta "¿Por qué LangChain?" para ver alternativas.

Luego, dirígete a la página de Claves API en el sitio web de OpenAI (después de iniciar sesión en tu cuenta de OpenAI), crea una clave API y guárdala; la necesitarás pronto.

**NOTA**

En este libro, mostraremos ejemplos de código tanto en Python como en JavaScript (JS). LangChain ofrece la misma funcionalidad en ambos lenguajes, así que simplemente elige el que te resulte más cómodo y sigue los fragmentos de código correspondientes a lo largo del libro (los ejemplos de código para cada lenguaje son equivalentes).

Primero, algunas instrucciones de configuración para los lectores que usan Python:

Asegúrate de tener Python instalado. Consulta las instrucciones para tu sistema operativo.

Instala Jupyter si deseas ejecutar los ejemplos en un entorno de *notebook*. Puedes hacerlo ejecutando `pip install notebook` en tu terminal.

Instala la biblioteca LangChain ejecutando los siguientes comandos en tu terminal:

```
pip install langchain langchain-openai langchain-community
pip install langchain-text-splitters langchain-postgres
```

Toma la clave API de OpenAI que generaste al principio de esta sección y hazla disponible en tu entorno de terminal. Puedes hacerlo ejecutando lo siguiente:

```
export OPENAI_API_KEY=tu-clave
```

No olvides reemplazar `tu-clave` con la clave API que generaste anteriormente.

Abre un *notebook* de Jupyter ejecutando este comando:

```
jupyter notebook
```

Ahora estás listo para seguir los ejemplos de código de Python.

**Uso de LLM en LangChain**

Para recapitular, los LLM son el motor impulsor detrás de la mayoría de las aplicaciones de IA generativa. LangChain proporciona dos interfaces simples para interactuar con cualquier proveedor de API de LLM:

Modelos de chat

LLM

La interfaz LLM simplemente toma un *prompt* de cadena como entrada, envía la entrada al proveedor del modelo y luego devuelve la predicción del modelo como salida.

Importemos el *wrapper* OpenAI LLM de LangChain para invocar una predicción del modelo utilizando un *prompt* simple:


In [11]:
from langchain_openai import ChatOpenAI

model = ChatOpenAI(model="gpt-3.5-turbo")

model.invoke("The sky is").content


'clear and sunny today.'

**CONSEJO**

Observa el parámetro `model` pasado a `OpenAI`. Este es el parámetro más común para configurar al usar un LLM o un modelo de chat, el modelo subyacente a utilizar, ya que la mayoría de los proveedores ofrecen varios modelos con diferentes compensaciones en capacidad y costo (generalmente los modelos más grandes son más capaces, pero también más caros y lentos). Consulta la descripción general de los modelos que ofrece OpenAI.

Otros parámetros útiles para configurar incluyen los siguientes, ofrecidos por la mayoría de los proveedores:

* `temperature`: Controla el algoritmo de muestreo utilizado para generar la salida. Los valores más bajos producen salidas más predecibles (por ejemplo, 0.1), mientras que los valores más altos generan resultados más creativos o inesperados (como 0.9). Diferentes tareas necesitarán diferentes valores para este parámetro. Por ejemplo, la producción de salida estructurada generalmente se beneficia de una temperatura más baja, mientras que las tareas de escritura creativa funcionan mejor con un valor más alto.
* `max_tokens`: Limita el tamaño (y el costo) de la salida. Un valor más bajo puede hacer que el LLM deje de generar la salida antes de llegar a un final natural, por lo que puede parecer que se ha truncado.

Más allá de estos, cada proveedor expone un conjunto diferente de parámetros. Te recomendamos consultar la documentación del que elijas. Por ejemplo, consulta la plataforma de OpenAI.




Alternativamente, la interfaz de modelo de chat permite conversaciones de ida y vuelta entre el usuario y el modelo. La razón por la que es una interfaz separada es porque los proveedores populares de modelos de lenguaje como OpenAI diferencian los mensajes enviados hacia y desde el modelo en roles de *usuario*, *asistente* y *sistema* (aquí, el *rol* denota el tipo de contenido que contiene el mensaje):

**Rol del sistema**  
Se utiliza para dar instrucciones que el modelo debe seguir para responder a una pregunta del usuario.

**Rol del usuario**  
Se utiliza para la consulta del usuario y cualquier otro contenido producido por este.

**Rol del asistente**  
Se utiliza para el contenido generado por el modelo.

La interfaz del modelo de chat facilita la configuración y gestión de las conversaciones en tu aplicación de chatbot con IA.  
A continuación, se muestra un ejemplo utilizando el modelo `ChatOpenAI` de LangChain:



In [13]:
from langchain_openai.chat_models import ChatOpenAI
from langchain_core.messages import HumanMessage

# Configuración del modelo con parámetros personalizados
chat = ChatOpenAI(
    temperature=0.7,              # Controla la creatividad del modelo (0 = determinista, 1 = aleatorio)
    model_name="gpt-3.5",           # Puedes cambiarlo por "gpt-3.5-turbo" u otros modelos compatibles
    max_tokens=500,               # Límite de tokens que puede generar el modelo en una respuesta
    openai_api_key="tu_clave_aquí"  # (opcional si ya lo configuraste en las variables de entorno)
)

prompt = [HumanMessage("What is the capital of France?")]

model.invoke(prompt)

AIMessage(content='The capital of France is Paris.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 8, 'prompt_tokens': 14, 'total_tokens': 22, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'id': 'chatcmpl-BNWFWydRDDAKPNqCmHABrb5Pya6jf', 'finish_reason': 'stop', 'logprobs': None}, id='run-c1e1caa2-a2c3-430e-9077-1e53bc9361b9-0', usage_metadata={'input_tokens': 14, 'output_tokens': 8, 'total_tokens': 22, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

### Otros parámetros útiles que puedes incluir:

- `top_p`: alternativa a `temperature`, controla la "nucleación" de las respuestas.
- `frequency_penalty`: penaliza la repetición de palabras o frases.
- `presence_penalty`: incentiva hablar de nuevos temas.
- `streaming`: si quieres respuestas en tiempo real (requiere configuración adicional).
- `request_timeout`: para controlar cuánto tiempo esperas antes de que la petición falle.



En lugar de utilizar un único string como prompt, los modelos de chat hacen uso de distintos tipos de mensajes, asociados a cada uno de los roles mencionados anteriormente. Estos incluyen lo siguiente:

- **HumanMessage**  
  Un mensaje enviado desde la perspectiva del humano, con el rol de *usuario*.

- **AIMessage**  
  Un mensaje enviado desde la perspectiva de la IA, con el rol de *asistente*.

- **SystemMessage**  
  Un mensaje que define las instrucciones que la IA debe seguir, con el rol de *sistema*.

- **ChatMessage**  
  Un mensaje que permite establecer un rol personalizado de manera arbitraria.

Vamos a incorporar una instrucción con `SystemMessage` en nuestro ejemplo:


In [15]:

from langchain_core.messages import HumanMessage, SystemMessage
from langchain_openai.chat_models import ChatOpenAI

# Crear instancia del modelo
model = ChatOpenAI(
    temperature=0.5,        # Puedes ajustar este valor para controlar la aleatoriedad
    model_name="gpt-4",     # Especifica el modelo a utilizar
    max_tokens=100          # Límite de tokens en la respuesta
)

# Mensaje del sistema con instrucciones
system_msg = SystemMessage(
    '''Eres un asistente útil que responde a las preguntas con tres signos 
    de exclamación.'''
)

# Mensaje del usuario
human_msg = HumanMessage("¿Cuál es la capital de Francia?")

# Ejecutar el modelo con los mensajes
respuesta = model.invoke([system_msg, human_msg])

# Imprimir la respuesta
print(respuesta.content)



La capital de Francia es París!!!


### 🧠 Salida esperada:

```
¡París!!!
```

Como puedes ver, el modelo obedeció la instrucción proporcionada en el `SystemMessage`, a pesar de que esta instrucción no estaba presente en la pregunta del usuario. Esto te permite preconfigurar el comportamiento de tu aplicación de IA para que responda de manera relativamente predecible según la entrada del usuario.

---




### 🔁 Haciendo Reutilizables los Prompts en Modelos LLM

La sección anterior mostró cómo las instrucciones del prompt influyen significativamente en la salida del modelo. Los prompts ayudan al modelo a entender el contexto y generar respuestas relevantes a las consultas.

A continuación, se muestra un ejemplo de un prompt detallado:

```
Responde la pregunta con base en el contexto que aparece abajo.  
Si no se puede responder con la información proporcionada, responde con "No lo sé".

Contexto: Los avances más recientes en PLN (Procesamiento de Lenguaje Natural) están siendo impulsados por los Modelos de Lenguaje de Gran Escala (LLMs). Estos modelos superan a sus contrapartes más pequeñas y se han vuelto invaluables para los desarrolladores que crean aplicaciones con capacidades de PLN. Los desarrolladores pueden aprovechar estos modelos mediante la librería `transformers` de Hugging Face, o utilizando las ofertas de OpenAI y Cohere a través de las librerías `openai` y `cohere`, respectivamente.

Pregunta: ¿Qué proveedores ofrecen modelos LLM?

Respuesta:
```

Aunque el prompt parece ser solo un string simple, el verdadero reto es decidir qué debe contener ese texto y cómo debe adaptarse dinámicamente a las entradas del usuario.

Por suerte, **LangChain** proporciona interfaces de plantillas de prompt que hacen fácil construir instrucciones con entradas dinámicas.

---

In [17]:

from langchain_core.prompts import PromptTemplate

# Crear la plantilla con marcadores dinámicos
template = PromptTemplate.from_template("""
Responde la pregunta con base en el contexto que aparece abajo.
Si no se puede responder con la información proporcionada, responde con "No lo sé".

Contexto: {context}

Pregunta: {question}

Respuesta:
""")



In [18]:
# Invocar la plantilla con valores dinámicos
prompt = template.invoke({
    "context": """Los avances más recientes en PLN están siendo impulsados por 
    Modelos de Lenguaje de Gran Escala (LLMs). Estos modelos superan a sus 
    contrapartes más pequeñas y se han vuelto invaluables para los desarrolladores 
    que crean aplicaciones con capacidades de lenguaje natural. Los desarrolladores 
    pueden aprovechar estos modelos mediante la librería `transformers` de Hugging Face 
    o utilizando las ofertas de OpenAI y Cohere a través de las librerías `openai` y `cohere`.""",
    "question": "¿Qué proveedores ofrecen modelos LLM?"
})



In [19]:

# Mostrar el resultado del prompt generado
print(prompt.text)


Responde la pregunta con base en el contexto que aparece abajo.
Si no se puede responder con la información proporcionada, responde con "No lo sé".

Contexto: Los avances más recientes en PLN están siendo impulsados por 
    Modelos de Lenguaje de Gran Escala (LLMs). Estos modelos superan a sus 
    contrapartes más pequeñas y se han vuelto invaluables para los desarrolladores 
    que crean aplicaciones con capacidades de lenguaje natural. Los desarrolladores 
    pueden aprovechar estos modelos mediante la librería `transformers` de Hugging Face 
    o utilizando las ofertas de OpenAI y Cohere a través de las librerías `openai` y `cohere`.

Pregunta: ¿Qué proveedores ofrecen modelos LLM?

Respuesta:





### 💡 Resultado esperado

```
Responde la pregunta con base en el contexto que aparece abajo.
Si no se puede responder con la información proporcionada, responde con "No lo sé".

Contexto: Los avances más recientes en PLN están siendo impulsados por Modelos de Lenguaje de Gran Escala (LLMs)...  
Pregunta: ¿Qué proveedores ofrecen modelos LLM?

Respuesta:
```

Este ejemplo toma un prompt estático y lo transforma en uno dinámico. La plantilla contiene la estructura del mensaje final junto con marcadores que indican dónde se insertarán las variables al momento de la ejecución.

Así, la plantilla actúa como una receta reutilizable que puede generar múltiples prompts estáticos y específicos. Al formatear la plantilla con valores concretos —en este caso `context` y `question`— se obtiene un prompt listo para ser pasado a un modelo LLM.




### ⚙️ Ejecución del Prompt con un Modelo LLM (OpenAI)

Como puedes ver, el argumento `question` se pasa de forma dinámica mediante la función `invoke()`. Por defecto, las plantillas de LangChain siguen la sintaxis de f-strings de Python para definir parámetros dinámicos—cualquier palabra entre llaves, como `{question}`, se sustituye con valores en tiempo de ejecución.  

En el ejemplo anterior, `{question}` fue reemplazado por “¿Qué proveedores ofrecen modelos LLM?”

Veamos ahora cómo alimentar este prompt en un modelo LLM de OpenAI usando LangChain:


In [20]:


# Invocar el modelo con el prompt generado
completion = model.invoke(prompt)

# Mostrar respuesta
print(completion)



content='Hugging Face, OpenAI y Cohere ofrecen modelos LLM.' additional_kwargs={'refusal': None} response_metadata={'token_usage': {'completion_tokens': 16, 'prompt_tokens': 187, 'total_tokens': 203, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4-0613', 'system_fingerprint': None, 'id': 'chatcmpl-BNWTVnv5ZMv7pQSwpZuQ5MfmTlsT0', 'finish_reason': 'stop', 'logprobs': None} id='run-4eb4f07c-7b2e-42c8-a3c4-5c36eadd5e1e-0' usage_metadata={'input_tokens': 187, 'output_tokens': 16, 'total_tokens': 203, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}}




### ✅ Resultado esperado

```
La librería `transformers` de Hugging Face, OpenAI a través de la librería `openai`, y Cohere mediante la librería `cohere` ofrecen modelos LLM.
```

---

Este enfoque permite separar claramente:
- **La plantilla** (estructura reutilizable).
- **Los datos** (como el contexto y la pregunta).
- **El modelo** (el LLM que genera la respuesta).



### 🗣️ Usando `ChatPromptTemplate` con Mensajes y Roles

Observa cómo el prompt contiene instrucciones en un `SystemMessage` y dos instancias de `HumanMessage` que incluyen variables dinámicas como el contexto y la pregunta.  
Aun así, puedes formatear la plantilla de la misma manera y obtener un prompt estático que puedes pasar a un modelo de lenguaje grande (LLM) para obtener una predicción.

### 🐍 Código Python – `ChatPromptTemplate` con `ChatOpenAI`


In [21]:
from langchain_openai.chat_models import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate

# Plantilla de chat con mensajes diferenciados por rol
template = ChatPromptTemplate.from_messages([
    ('system', """Responde la pregunta con base en el contexto a continuación. 
    Si no puedes responder con la información proporcionada, responde con "No lo sé"."""),
    ('human', 'Contexto: {context}'),
    ('human', 'Pregunta: {question}'),
])

# Instancia del modelo ChatOpenAI
model = ChatOpenAI(model_name="gpt-4", temperature=0.3)

# Insertar valores dinámicos en el prompt
prompt = template.invoke({
    "context": """Los avances más recientes en PLN están siendo impulsados por 
    los Modelos de Lenguaje de Gran Escala (LLMs). Estos modelos superan a sus 
    contrapartes más pequeñas y se han vuelto invaluables para desarrolladores 
    que crean aplicaciones con capacidades de lenguaje natural. Los desarrolladores 
    pueden aprovechar estos modelos mediante la librería `transformers` de Hugging Face 
    o utilizando las ofertas de OpenAI y Cohere a través de las librerías `openai` y `cohere`.""",
    "question": "¿Qué proveedores ofrecen modelos LLM?"
})

# Invocar el modelo con el prompt generado
respuesta = model.invoke(prompt)

# Mostrar el resultado
print(respuesta.content)

Los proveedores que ofrecen Modelos de Lenguaje de Gran Escala (LLMs) incluyen Hugging Face, OpenAI y Cohere.




### ✅ Resultado esperado

```
La librería `transformers` de Hugging Face, OpenAI mediante la librería `openai` y Cohere mediante la librería `cohere` ofrecen modelos LLM.
```

---

Este enfoque es ideal cuando estás desarrollando **chatbots o agentes conversacionales**, ya que te permite estructurar claramente los mensajes por rol (`system`, `human`, `assistant`) y reutilizar el mismo esquema para múltiples interacciones.


In [22]:
respuesta

AIMessage(content='Los proveedores que ofrecen Modelos de Lenguaje de Gran Escala (LLMs) incluyen Hugging Face, OpenAI y Cohere.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 33, 'prompt_tokens': 190, 'total_tokens': 223, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4-0613', 'system_fingerprint': None, 'id': 'chatcmpl-BNWXmtXDDAZRIjUR2Qk2qwjYmt0wR', 'finish_reason': 'stop', 'logprobs': None}, id='run-9a704890-940b-4f4c-8d5f-466efe482021-0', usage_metadata={'input_tokens': 190, 'output_tokens': 33, 'total_tokens': 223, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})


### 📦 Obtener Formatos Específicos desde LLMs

Los resultados en texto plano son útiles, pero hay casos en los que necesitas que el modelo de lenguaje genere una salida estructurada, es decir, en un formato legible por máquina, como JSON, XML, CSV o incluso en un lenguaje de programación como Python o JavaScript. Esto es especialmente útil cuando esa salida será consumida por otra parte del sistema, haciendo que el LLM forme parte de una aplicación más amplia.

---

### 🧾 Salida en Formato JSON

El formato más común que se genera con LLMs es JSON. Este tipo de salida puede, por ejemplo, enviarse al frontend o almacenarse en una base de datos.

Para generar JSON:
1. Define el **esquema** que el modelo debe seguir.
2. Incluye ese esquema en el prompt junto con el texto base.
3. Usa el método `with_structured_output`.

#### 🐍 Ejemplo en Python con `Pydantic`

In [23]:


from langchain_openai import ChatOpenAI
from langchain_core.pydantic_v1 import BaseModel

# Definir el esquema de salida
class AnswerWithJustification(BaseModel):
    '''Una respuesta a la pregunta del usuario junto con su justificación.'''
    answer: str
    '''La respuesta a la pregunta del usuario'''
    justification: str
    '''Justificación de la respuesta'''

# Crear modelo base
llm = ChatOpenAI(model="gpt-3.5-turbo", temperature=0)

# Adaptar el modelo para producir salida estructurada
structured_llm = llm.with_structured_output(AnswerWithJustification)

# Invocar con una pregunta
respuesta = structured_llm.invoke(
    "¿Qué pesa más, una libra de ladrillos o una libra de plumas?"
)

# Mostrar resultado
print(respuesta)




For example, replace imports like: `from langchain_core.pydantic_v1 import BaseModel`
with: `from pydantic import BaseModel`
or the v1 compatibility namespace if you are working in a code base that has not been fully upgraded to pydantic 2 yet. 	from pydantic.v1 import BaseModel

  exec(code_obj, self.user_global_ns, self.user_ns)


answer='Ambos pesan lo mismo, una libra.' justification='La libra es una unidad de medida de peso, por lo tanto, una libra de ladrillos y una libra de plumas tienen el mismo peso.'



#### ✅ Resultado esperado

```json
{
  "answer": "Pesan lo mismo",
  "justification": "Tanto una libra de ladrillos como una libra de plumas pesan una libra. El peso es el mismo, aunque el volumen varía."
}
```

---

### 🔍 ¿Qué hace LangChain internamente?

- Convierte el esquema Pydantic a **JSONSchema** y lo envía al modelo usando técnicas como *function calling* o *prompt injection*.
- Valida que la respuesta generada respete el esquema antes de devolverla al usuario.

---

### 🧰 Otros Formatos Legibles por Máquina con Output Parsers

También puedes generar otros formatos como **CSV** o **XML**. Para eso, se utilizan **output parsers**, que son clases diseñadas para:

#### 1. Inyectar instrucciones sobre el formato esperado en el prompt.  
#### 2. Validar y transformar la respuesta del LLM en estructuras como listas o diccionarios.

#### 🐍 Ejemplo en Python con `CommaSeparatedListOutputParser`

LangChain ofrece múltiples parsers para distintos formatos: listas, JSON, XML, CSV y más.


In [25]:
from langchain_core.output_parsers import CommaSeparatedListOutputParser

# Crear parser para lista separada por comas
parser = CommaSeparatedListOutputParser()

# Aplicar el parser a una respuesta generada por LLM
items = parser.invoke("manzana, plátano, cereza")

print(items)  # ['manzana', 'plátano', 'cereza']


['manzana', 'plátano', 'cereza']




### 🧱 Ensamblando las Piezas de una Aplicación con LLM

Los componentes clave que has aprendido hasta ahora son los bloques fundamentales del framework LangChain.  
Lo que nos lleva a una pregunta crítica:

> **¿Cómo combinarlos eficazmente para construir una aplicación con LLM?**

---

### 🛠️ Usando la Interfaz `Runnable`

Como habrás notado, todos los ejemplos anteriores usan una interfaz común con el método `invoke()` para generar salidas desde el modelo, plantilla o parser.

Todos los componentes implementan los siguientes métodos:

| Método       | Función                                                                 |
|--------------|-------------------------------------------------------------------------|
| `invoke()`   | Transforma una **entrada individual** en una **salida**.                |
| `batch()`    | Transforma **múltiples entradas** en **múltiples salidas**.             |
| `stream()`   | Transmite la salida **en tiempo real** conforme se va generando.        |

Además, hay utilidades integradas para:
- Reintentos (`retries`)
- Comportamientos de respaldo (`fallbacks`)
- Validación de esquemas
- Configuración dinámica en tiempo de ejecución

> En Python, cada uno de estos métodos también tiene su versión asíncrona con `asyncio`.

Esto permite que todos los componentes se comporten de manera **consistente**, y lo aprendido con uno se aplica a los demás.





In [28]:
from langchain_openai import ChatOpenAI

# Crear modelo de chat
model = ChatOpenAI(model_name="gpt-4", temperature=0.3)

# 1. invoke(): entrada única → salida única
respuesta = model.invoke("¡Hola!")
print("invoke:", respuesta)

invoke: content='¡Hola! ¿Cómo puedo ayudarte hoy?' additional_kwargs={'refusal': None} response_metadata={'token_usage': {'completion_tokens': 11, 'prompt_tokens': 10, 'total_tokens': 21, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4-0613', 'system_fingerprint': None, 'id': 'chatcmpl-BNWjRWz6AQNg6Cylut3SR1N6wAztP', 'finish_reason': 'stop', 'logprobs': None} id='run-0e8c64a0-5921-4ee4-9c9a-8060fce85b5e-0' usage_metadata={'input_tokens': 10, 'output_tokens': 11, 'total_tokens': 21, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}}


In [29]:
# 2. batch(): múltiples entradas → múltiples salidas
respuestas = model.batch(["¡Hola!", "¡Adiós!"])

print("batch:", respuestas)



batch: [AIMessage(content='¡Hola! ¿Cómo puedo ayudarte hoy?', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 11, 'prompt_tokens': 10, 'total_tokens': 21, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4-0613', 'system_fingerprint': None, 'id': 'chatcmpl-BNWjaB0PgUCICxGmg2cRYhMXyKjlM', 'finish_reason': 'stop', 'logprobs': None}, id='run-87039c00-d14c-4cc5-b160-d413d96c7d07-0', usage_metadata={'input_tokens': 10, 'output_tokens': 11, 'total_tokens': 21, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}}), AIMessage(content='¡Adiós! Que tengas un buen día.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 13, 'prompt_tokens': 12, 'total_tokens': 25, 'completion_tokens_

In [30]:
# 3. stream(): salida generada en tiempo real
print("stream:")
for token in model.stream("¡Hasta luego!"):
    print(token, end=" ")


stream:
content='' additional_kwargs={} response_metadata={} id='run-9b48d5c7-458a-4a10-a3eb-f21c9bf0eaf5' content='¡' additional_kwargs={} response_metadata={} id='run-9b48d5c7-458a-4a10-a3eb-f21c9bf0eaf5' content='Ad' additional_kwargs={} response_metadata={} id='run-9b48d5c7-458a-4a10-a3eb-f21c9bf0eaf5' content='i' additional_kwargs={} response_metadata={} id='run-9b48d5c7-458a-4a10-a3eb-f21c9bf0eaf5' content='ós' additional_kwargs={} response_metadata={} id='run-9b48d5c7-458a-4a10-a3eb-f21c9bf0eaf5' content='!' additional_kwargs={} response_metadata={} id='run-9b48d5c7-458a-4a10-a3eb-f21c9bf0eaf5' content=' ¡' additional_kwargs={} response_metadata={} id='run-9b48d5c7-458a-4a10-a3eb-f21c9bf0eaf5' content='Que' additional_kwargs={} response_metadata={} id='run-9b48d5c7-458a-4a10-a3eb-f21c9bf0eaf5' content=' teng' additional_kwargs={} response_metadata={} id='run-9b48d5c7-458a-4a10-a3eb-f21c9bf0eaf5' content='as' additional_kwargs={} response_metadata={} id='run-9b48d5c7-458a-4a10-a3

---

### 📊 ¿Cómo combinar componentes?

LangChain te permite hacerlo de dos formas:

| Enfoque         | Descripción                                                       |
|------------------|-------------------------------------------------------------------|
| **Imperativo**   | Llamas directamente a tus componentes (`model.invoke(...)`)       |
| **Declarativo**  | Usas el **Lenguaje de Expresiones de LangChain (LCEL)**           |

| Comparativa                  | Imperativo                          | Declarativo (LCEL)            |
|-----------------------------|--------------------------------------|-------------------------------|
| **Sintaxis**                | Todo Python o JavaScript             | LCEL                          |
| **Ejecución en paralelo**   | Python: `threads` o `asyncio`        | Automática                    |
|                             | JS: `Promise.all()`                  |                               |
| **Streaming**               | Con `yield`                          | Automático                    |
| **Ejecución asíncrona**     | Con `async`                          | Automática                    |

---




### ⚙️ Composición Imperativa en LangChain

La **composición imperativa** no es más que el enfoque tradicional de escribir funciones y clases, combinando componentes como modelos, prompts y parsers de manera explícita. Es familiar, flexible y te permite agregar cualquier lógica personalizada que necesites.

---

### 🧱 Ejemplo básico: Combinando prompt + modelo en una función



In [13]:

from langchain_openai.chat_models import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import chain

# 1. Definimos el prompt del sistema + mensaje humano
template = ChatPromptTemplate.from_messages([
    ('system', 'Eres un asistente útil.'),
    ('human', '{question}'),
])

# 2. Modelo de lenguaje
model = ChatOpenAI(model_name="gpt-4", temperature=0.3)

# 3. Función combinada usando @chain
@chain
def chatbot(values):
    prompt = template.invoke(values)
    return model.invoke(prompt)

# 4. Usar el chatbot
respuesta = chatbot.invoke({"question": "¿Qué proveedores ofrecen modelos LLM?"})
print(respuesta.content)

LLM (Master en Derecho) es un programa de posgrado en derecho. Sin embargo, si te refieres a modelos de lenguaje de aprendizaje automático (LLM), hay varios proveedores que ofrecen estos servicios, incluyendo:

1. OpenAI: Ofrecen GPT-3, uno de los modelos de lenguaje más avanzados disponibles actualmente.

2. Google: Ofrece BERT y T5, que son modelos de lenguaje transformacional.

3. Facebook AI: Ofrece RoBERTa, que es una variante de BERT.

4. Microsoft: Ofrece Turing, que es un modelo de lenguaje de gran escala.

5. Hugging Face: Ofrece una amplia gama de modelos de lenguaje pre-entrenados, incluyendo BERT, GPT-2, DistilBERT, RoBERTa, y muchos más.

6. IBM: Ofrece Watson, que es un sistema de inteligencia artificial que puede procesar el lenguaje natural.

Por favor, especifica si necesitas más detalles sobre un proveedor en particular o si te refieres a algo diferente con "modelos LLM".




### 🔁 Soporte para *streaming* (respuesta en partes)

Puedes modificar la función para que haga *streaming* de la respuesta del modelo en tiempo real:




In [34]:
@chain
def chatbot(values):
    prompt = template.invoke(values)
    for token in model.stream(prompt):
        yield token

# Usar streaming
for parte in chatbot.stream({
    "question": "¿Qué proveedores ofrecen modelos LLM?"
}):
    print(parte.content, end=" ")


 LL M  ( Language  Model )  es  un  tipo  de  modelo  de  intelig encia  artificial  que  se  utiliza  para  la  gener ación  de  texto  y  el  proces amiento  del  l engu aje  natural .  Aqu í  hay  algunos  prove edores  que  ofrec en  modelos  L LM :

 1 .  Open AI :  Of rece  G PT - 3 ,  uno  de  los  modelos  de  l engu aje  más  avanz ados  disponibles  en  la  actual idad .

 2 .  Google :  Of rece  B ERT  y  T 5 ,  que  son  modelos  de  l engu aje  que  se  utiliz an  para  una  varied ad  de  t areas  de  proces amiento  del  l engu aje  natural .

 3 .  Facebook  AI :  Of rece  Ro BERT a ,  que  es  una  vari ante  de  B ERT  que  ha  sido  optim izada  para  tener  un  rend imiento  aún  mejor .

 4 .  H ugging  Face :  Of rece  una  varied ad  de  modelos  de  l engu aje  pre - ent ren ados ,  incl uy endo  B ERT ,  G PT - 2 ,  y  Ro BERT a .

 5 .  Microsoft :  Of rece  Turing ,  un  modelo  de  l engu aje  de  gran  esc ala  que  se  utiliza  en  Bing  y  otras  aplic ac



Esto te devuelve la respuesta en fragmentos (`AIMessageChunk`), útil para interfaces conversacionales en tiempo real.

---

### ⚡ Soporte para ejecución *asíncrona* (async/await)

En Python, también puedes definir tu función de manera asíncrona:


In [14]:
@chain
async def chatbot(values):
    prompt = await template.ainvoke(values)
    return await model.ainvoke(prompt)

# Usar async en un entorno compatible con asyncio
import asyncio

respuesta = asyncio.run(chatbot.ainvoke({
    "question": "¿Qué proveedores ofrecen modelos LLM?"
}))

print(respuesta.content)

RuntimeError: asyncio.run() cannot be called from a running event loop

El mensaje `RuntimeError: asyncio.run() cannot be called from a running event loop` indica que ya hay un bucle de eventos de asyncio en ejecución en el entorno donde estás intentando correr este código. Esto es común en entornos como los notebooks de Jupyter, donde el kernel ya tiene un bucle de eventos en marcha para manejar las operaciones asíncronas.

Para solucionar esto en un entorno donde ya existe un bucle de eventos, en lugar de usar `asyncio.run()`, puedes usar `asyncio.create_task()` para programar la corrutina y luego `await` la tarea resultante.



In [18]:
from langchain_core.prompts import PromptTemplate
from langchain_openai import ChatOpenAI
import asyncio

# Definir el template del prompt
template = PromptTemplate.from_template("Responde a la siguiente pregunta: {question}")

# Inicializar el modelo de chat de OpenAI (asegúrate de tener tu API key configurada)
model = ChatOpenAI()

# Definir la cadena (chain) asíncrona
async def chatbot(values):
    prompt = await template.ainvoke(values)
    return await model.ainvoke(prompt)

# Crear una tarea para ejecutar la corrutina chatbot
task = asyncio.create_task(chatbot({
    "question": "¿Qué proveedores ofrecen modelos LLM?"
}))

# Esperar a que la tarea se complete y obtener el resultado
respuesta = await task

print(respuesta.content)

Algunos proveedores que ofrecen modelos LLM son BERT, GPT-3 de OpenAI, RoBERTa de Facebook AI Research, T5 de Google Research, entre otros proveedores de tecnología de procesamiento del lenguaje natural.


---

### ✅ Resultado Esperado

```
Hugging Face con la librería `transformers`, OpenAI mediante `openai` y Cohere con `cohere` ofrecen modelos LLM.
```

---

### 🧩 Ventajas de este enfoque imperativo

- Es familiar para cualquier desarrollador Python.
- Puedes insertar **cualquier lógica personalizada** (if/else, validaciones, llamadas externas).
- Compatible con streaming y async cuando lo necesitas.




## 🧩 Composición Declarativa con LCEL

**LCEL (LangChain Expression Language)** es un lenguaje declarativo para **componer componentes de LangChain**. LangChain compila estas composiciones en **planes de ejecución optimizados**, ofreciendo:

- Paralelización automática
- Soporte para *streaming*
- Ejecución asíncrona
- *Tracing* automático (seguimiento del flujo)

---

### 🧱 Ejemplo equivalente al chatbot, ahora con LCEL

```python
from langchain_openai.chat_models import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate

# Componentes base
template = ChatPromptTemplate.from_messages([
    ('system', 'Eres un asistente útil.'),
    ('human', '{question}'),
])

model = ChatOpenAI(model_name="gpt-4", temperature=0.3)

# Composición declarativa con el operador "|"
chatbot = template | model

# Invocar el chatbot
respuesta = chatbot.invoke({
    "question": "¿Qué proveedores ofrecen modelos LLM?"
})

print(respuesta.content)
```

---

### 🔁 Streaming automático (sin lógica adicional)

```python
chatbot = template | model

for parte in chatbot.stream({
    "question": "¿Qué proveedores ofrecen modelos LLM?"
}):
    print(parte.content, end=" ")
```

---

### ⚡ Asincronía automática

```python
# Esto dentro de una celda async-compatible
respuesta = await chatbot.ainvoke({
    "question": "¿Qué proveedores ofrecen modelos LLM?"
})

print(respuesta.content)
```

---

### 🧠 Resumen del capítulo

En esta sección aprendiste a usar los **componentes clave** de LangChain para construir aplicaciones con LLMs:

- **Modelos de lenguaje**: Hacen las predicciones.
- **Prompts**: Guían la respuesta del modelo.
- **Parsers (opcional)**: Estructuran la salida del modelo.

Todos los componentes comparten una interfaz común:

| Método       | Función                                            |
|--------------|----------------------------------------------------|
| `invoke()`   | Entrada única → Salida única                        |
| `batch()`    | Entradas múltiples → Salidas múltiples              |
| `stream()`   | Generación progresiva de respuesta (token a token) |

---

### 🆚 Composición imperativa vs. declarativa

| Característica           | Imperativa                            | Declarativa (LCEL)               |
|--------------------------|----------------------------------------|----------------------------------|
| Sintaxis                 | Python clásico                         | Expresiones encadenadas con `| `  |
| Lógica personalizada     | 🟢 Sí, altamente personalizable         | 🔴 Limitada (solo composición)   |
| Paralelismo / Async      | Manual (asyncio, threads)              | Automático                       |
| Streaming                | Requiere `yield` o `stream()` manual   | Automático                       |

---

> En el siguiente capítulo aprenderás cómo **proveer datos externos a tu chatbot** como contexto, para que puedas crear una aplicación que realmente pueda "conversar" con tus datos.

