<a href="https://colab.research.google.com/github/juanfranbrv/curso-langchain/blob/main/LCEL%20y%20Runnables.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#**1. LCEL, LangChain Expression Language**
---

LCEL se introdujo en Langchain **a mediados de 2023**, específicamente con la **versión 0.0.142**, lanzada el **19 de julio de 2023**

La introducción de **LCEL** en Langchain fue una respuesta a la necesidad de una forma más potente, flexible y fácil de usar para construir aplicaciones de lenguaje complejas. Proporcionó una sintaxis declarativa, mejoró la legibilidad, facilitó la depuración y habilitó funcionalidades avanzadas como el streaming y la ejecución asíncrona, consolidándose como una pieza fundamental del ecosistema de Langchain.

**LCEL se basa en la Composición, no en Tipos Predefinidos:**

-   **Operador Pipe (|):** La piedra angular de LCEL es el operador pipe. Este operador te permite encadenar componentes de forma secuencial, enviando la salida de un componente como entrada al siguiente. Esto es inherentemente secuencial, pero no se define como un tipo de cadena "secuencial".
    
-   **Primitivas Runnable:** LCEL se basa en la interfaz Runnable. Cualquier objeto que implemente esta interfaz puede ser parte de una cadena LCEL. Esto incluye modelos de lenguaje, prompts, parsers, retrievers, etc.
    
-   **Flexibilidad Total:** La clave es que puedes combinar estas primitivas Runnable de cualquier manera que tenga sentido para tu aplicación. No estás limitado a estructuras predefinidas.

**Ventajas de este enfoque:**

-   **Mayor Flexibilidad:** No estás limitado por las estructuras predefinidas. Puedes crear flujos de trabajo exactamente como los necesitas.
    
-   **Reutilización de Componentes:** Los componentes individuales pueden ser reutilizados en diferentes cadenas con diferentes flujos de trabajo.
    
-   **Claridad y Composición:** El uso del operador pipe hace que la lógica de la cadena sea más clara y fácil de entender.
    
-   **Optimización:** La forma en que construyes la cadena influye en cómo se puede optimizar su ejecución (por ejemplo, para paralelismo).
    

**En resumen, LCEL te proporciona las herramientas y la sintaxis para orquestar tus flujos de trabajo de manera flexible y poderosa. En lugar de imponer tipos de cadenas predefinidos, te da la libertad de construir las cadenas que mejor se adapten a tus necesidades, implementando patrones secuenciales, condicionales o paralelos según sea necesario.**

Y todo esta abstración se basa en los **Runnables**

# **2. Runnables**
---

Un *“Runnable”* en LangChain es una abstracción (una interfaz en código) que define un contrato para ejecutar una operación. Concretamente, un `Runnable` expone un método `invoke(input)`, el cual recibe un dato de entrada y produce un resultado de salida. Así, cualquier clase u objeto que cumpla con esta interfaz puede encadenarse o combinarse con otros `Runnables` para construir flujos de trabajo complejos (por ejemplo, secuencias o ejecuciones en paralelo).   

Cada "*Runnable*" implementa métodos como invoke, batch, stream, y transform, lo que lo hace compatible con diferentes modos de ejecución (sincrónica, asincrónica, en lote, etc.).  
Esto permite orquestar y reutilizar fácilmente distintas operaciones dentro de LangChain.

Un poco menos técnico...

Un *“Runnable”* es como una función que sabe hacer algo muy concreto: recibe cierta información y devuelve un resultado. Lo importante es que, en LangChain, todos los *“Runnables”* siguen la misma “forma de trabajar”. Gracias a esto, podemos ir uniendo varios “Runnables” uno tras otro o en paralelo para crear procesos más grandes sin tener que hacer ajustes complicados. En otras palabras, si cada bloque (*Runnable*) sabe cómo recibir datos y devolverlos transformados, podemos combinar esos bloques como si fueran piezas de LEGO para armar flujos de trabajo completos.

## Conceptos clave de runnables
-   **Modularidad**
    
    -   Cada Runnable representa una única tarea u operación (p.ej., ejecutar un modelo, procesar datos, encadenar operaciones).
    -   Su diseño en “bloques” facilita la independencia y el intercambio de componentes.
-   **Componibilidad**
    
    -   Varios Runnables pueden vincularse para formar canalizaciones o flujos de trabajo complejos.
    -   Esto permite crear soluciones más grandes a partir de piezas pequeñas, flexibles y reutilizables.
-   **Reutilizabilidad**
    
    -   Una vez definido, un Runnable se puede integrar en distintos proyectos sin modificaciones.
    -   Es ideal para tareas estándar que se repiten (p.ej., preprocesamiento de datos).
-   **Ejecución asincrónica**
    
    -   Los Runnables pueden ejecutarse de forma asíncrona, optimizando recursos y tiempo, especialmente cuando hay llamadas a servicios externos o E/S de por medio.

-   **Ejecución paralela**
    
    -   Es posible configurar Runnables para que se ejecuten en paralelo, lo que mejora el rendimiento en tareas por lotes o cuando se manejan grandes volúmenes de datos.
-   **Manejo de errores**
    
    -   Suelen incluir mecanismos para capturar y gestionar excepciones, reforzando la solidez del flujo de trabajo.
-   **Registro y depuración**
    
    -   Admiten el registro de metadatos y eventos, lo que facilita rastrear y depurar la ejecución de principio a fin.


# **3. Chains (Cadenas)**
---

En Langchain, una Cadena (Chain) representa una secuencia orquestada de llamadas a uno o más Runnables para realizar una tarea específica. Piensa en ella como una tubería o un flujo de trabajo donde la salida de un Runnable se convierte en la entrada del siguiente.  

En esencia, una Cadena combina la funcionalidad de múltiples Runnables para llevar a cabo procesos más complejos que los que un solo Runnable podría manejar individualmente. Las Cadenas son el mecanismo principal en Langchain para construir aplicaciones de lenguaje natural con lógica y pasos definidos.

En LCEL no existen tipos de cadenas predefinidos como "secuenciales", "condicionales" o "paralelas". Sin embargo, puedes implementar estos patrones de flujo de trabajo utilizando la sintaxis de LCEL junto con funciones adicionales.  

# **4. ¡Uniendo las piezas: Llegó la hora del código!**
---

En esta sección, pondremos en práctica los conceptos teóricos que hemos explorado. A través de una serie de ejemplos con código, ilustraremos cómo LCEL, los Runnables y las Cadenas se combinan en Langchain para resolver tareas concretas. Nuestro enfoque será didáctico, facilitando la comprensión a la vez que presentamos casos de uso reales.

** Langchain va en este momento por la version 0.3. Dado que es una librería en evolución, es posible que se agreguen o refinen más “runnables” en versiones futuras.



## **Preparando el entorno del cuaderno**
---
Configuramos el entorno de trabajo para utilizar LangChain con distintos modelos de lenguaje (LLMs).

- Obtenemos las claves API para acceder a los servicios de OpenAI, Groq, Google y Hugging Face.

- Instalamos la librería LangChain y las integraciones necesarias para cada uno de estos proveedores.

- Importamos las clases específicas de LangChain que permiten crear plantillas de prompts e interactuar con los diferentes modelos de lenguaje, dejándolo todo listo para empezar a desarrollar aplicaciones basadas en LLMs. (Este codigo se explico con detalle en el primer cuaderno)

Comenta (#) las librerias y modelos que no desees usar.

In [1]:
%%capture --no-stderr

# Importar la librería `userdata` de Google Colab.
# Esta librería se utiliza para acceder a datos de usuario almacenados de forma segura en el entorno de Colab.
from google.colab import userdata

# Obtener las claves API de diferentes servicios desde el almacenamiento seguro de Colab.
OPENAI_API_KEY=userdata.get('OPENAI_API_KEY')
GROQ_API_KEY=userdata.get('GROQ_API_KEY')
GOOGLE_API_KEY=userdata.get('GOOGLE_API_KEY')
HUGGINGFACEHUB_API_TOKEN=userdata.get('HUGGINGFACEHUB_API_TOKEN')
MISTRAL_API_KEY=userdata.get('MISTRAL_API_KEY')

TOGETHER_API_KEY=userdata.get('TOGETHER_API_KEY')

%pip install -qU langchain-together

# Instalar las librerías necesarias usando pip.
# El flag `-qU` instala en modo silencioso (`-q`) y actualiza las librerías si ya están instaladas (`-U`).
%pip install langchain -qU  # Instalar la librería principal de LangChain.


# Instalar las integraciones de LangChain con diferentes proveedores de LLMs.
%pip install langchain-openai -qU
%pip install langchain-groq -qU
%pip install langchain-google-genai -qU
%pip install langchain-huggingface -qU
%pip install langchain_mistralai -qU

# Importar las clases necesarias de LangChain para crear plantillas de prompt.
# `ChatPromptTemplate` es la clase base para plantillas de chat.
# `SystemMessagePromptTemplate` se usa para mensajes del sistema (instrucciones iniciales).
# `HumanMessagePromptTemplate` se usa para mensajes del usuario.
from langchain.prompts import PromptTemplate, ChatPromptTemplate, SystemMessagePromptTemplate, HumanMessagePromptTemplate

# Importar las clases para interactuar con los diferentes LLMs a través de LangChain.
from langchain_openai import ChatOpenAI
from langchain_groq import ChatGroq
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_huggingface import HuggingFaceEndpoint
from langchain_mistralai import ChatMistralAI

# Importamos la libreria para formatear mejor la salida
from IPython.display import Markdown, display

In [None]:
from langchain_together import ChatTogether

llm = ChatTogether(
    model="meta-llama/Llama-3-70b-chat-hf",
    temperature=0,
    max_tokens=None,
    timeout=None,
    max_retries=2,
    api_key=TOGETHER_API_KEY,
    verbose=True
)

llm.invoke("Hola. Que modelo eres ???")

AIMessage(content='Hola! Soy LLaMA, un modelo de lenguaje basado en inteligencia artificial desarrollado por Meta AI. No soy un modelo específico de persona o entidad, sino más bien un programa diseñado para entender y responder a preguntas y conversar de manera natural. Mi capacidad para responder se basa en el análisis de grandes cantidades de texto y datos, lo que me permite generar respuestas coherentes y relevantes. ¡Es un placer charlar contigo!', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 101, 'prompt_tokens': 17, 'total_tokens': 118, 'completion_tokens_details': None, 'prompt_tokens_details': None}, 'model_name': 'meta-llama/Llama-3-70b-chat-hf', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-fc670359-ca75-43ed-b225-9ec3c09f6123-0', usage_metadata={'input_tokens': 17, 'output_tokens': 101, 'total_tokens': 118, 'input_token_details': {}, 'output_token_details': {}})

## **Ejemplo 1: Prompt + LLM**

---
Posiblemente esta es la cadena mas simple que podamos crear.  
En este caso la cadena conecta un prompt con un modelo.

Se usa | para conectar el prompt con el modelo.
Luego la cadena se invoca pasandole el PrompTemplate.

Observa que esto es lo que hemos hecho hasta ahora sin cadenas: Invocar un LLM pasandole un PromptTemplate formateado...

Aunque no hay gran diferencia y este enfoque puede ser más simple para tareas sencillas, carece de la flexibilidad y la extensibilidad que ofrecen las cadenas como se aprecia en cuanto la complejidad escala.

Ademas LCEL y la nuevas cadenas proporcionan un nivel de abstracción mayor tanto del prompt como del proceso en general.

In [None]:
llm = ChatOpenAI(model="gpt-4o-mini",
                 api_key=OPENAI_API_KEY,
                 temperature=0.7)

# Definimos el prompt template de una de esta dos formas
prompt = PromptTemplate(template="Traduce esto al {idioma}: {texto}", input_variables=["idioma","texto"])
prompt = PromptTemplate.from_template("Traduce esto al {idioma}: {texto}")

# Usamos LCEL para crear la cadena
chain = prompt | llm

# Ejecutamos la cadena
# El input del metodo .invoke de una cadena debe ser un unico
# asi que puede hacerse asi,
#     respuesta = chain.invoke("Hola, ¿cómo estás?")
# pero si hay mas de un parametro se espera un diccionario

respuesta = chain.invoke({"idioma":"Francés", "texto":"Hola, ¿cómo estás?"})

display(Markdown(respuesta.content))

Bonjour, comment allez-vous ?

## **RunnableLambda**

La forma principal de añadir una función a una cadena en Langchain (especialmente en LCEL) es utilizando `RunnableLambda`. `RunnableLambda` es un Runnable que envuelve una función Python, permitiéndole integrarse perfectamente en el flujo de la cadena.

(Aunque es posible, la inserción directa de la función `transformar_texto` funciona, esto se debe a que Langchain implícitamente envuelve esa función en un RunnableLambda "por debajo del capó" para que pueda encajar dentro del paradigma de la cadena LCEL. Es mejor ser consistente con los principios del framework y usar `RunnableLambda`)


## **Ejemplo 2: Prompt + LLM + funcion personalizada de transformación de la salida**
---

En este caso la salida del LLM se procesa con una funcion sencilla para pasarla a mayusculas. (pero puede ser tan complicada como se necesite)

Observa que la funcion de transformacion recibe la salida del LLM que es un objeto AIMessage. Asi que debe acceder al .content de este (que es realmente el string con la respuesta) para poder operar.



In [None]:
from langchain_core.runnables import RunnableLambda

# Definimos el PromptTemplate
prompt_template = PromptTemplate.from_template("Responde como si fueras un experto en {tema}: {pregunta}")

# Recuerda que esto es quivalente, con el constructor de clase
# prompt_template = PromptTemplate(
#     template="Responde como si fueras un experto en {tema}: {pregunta}",
#     input_variables=["tema", "pregunta"]
# )


# Definimos el modelo de lenguaje
llm = ChatOpenAI(model="gpt-4o-mini",
                 api_key=OPENAI_API_KEY,
                 temperature=0.7)

# # Definimos una función de transformación
# def transformar_texto(output):
#     return output.content.upper()


transformar_texto=RunnableLambda(lambda output: output.content.upper())

# Creamos la cadena con LCEL
chain = prompt_template | llm | transformar_texto

# Ejecutamos la cadena
respuesta = chain.invoke({"tema": "Machine Learning", "pregunta": "¿Qué es el overfitting?"})
display(Markdown(respuesta))

## **Ejemplo 3: Prompt + LLM + OutputParser + funcion personalizada de transformación de la salida**
---

En este ejemplo se observa mejor la modularidad reutilizando la cadena en un bucle y usando un OutputParser.  

**Los OutputParser en Langchain son Runnables**. Esto les permite ser componentes activos dentro de las cadenas LCEL, tomando la salida de Runnables precedentes y transformándola según su lógica específica. Su capacidad para ser Runnables es fundamental para la flexibilidad y el poder de composición de Langchain.

In [None]:
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnableLambda

# 1. Definimos el PromptTemplate
prompt_template = PromptTemplate.from_template("Responde como si fueras un experto en {tema}: {pregunta}")

# 2. Definimos el modelo de lenguaje
llm = ChatOpenAI(model="gpt-4o-mini",
                 api_key=OPENAI_API_KEY,
                 temperature=0.7)

# 3. Definimos un OutputParser
# StrOutputParser convierte la salida del LLM en un string.
output_parser = StrOutputParser()

# 4. Definimos una función de transformación
# Esta función toma la salida del OutPutParser (str) y la convierte a mayúsculas.
transformar_texto=RunnableLambda(lambda output: output.upper())


# 5. Creamos la cadena con LCEL
chain = prompt_template | llm | output_parser | transformar_texto

# 6. Ejecutamos la cadena con diferentes entradas en un bucle
# Observa cómo la cadena puede reutilizarse para diferentes preguntas.
preguntas = [
    {"tema": "Machine Learning", "pregunta": "¿Qué es el overfitting?"},
    {"tema": "Historia", "pregunta": "¿Quién fue Napoleón Bonaparte?"},
    {"tema": "Programación", "pregunta": "¿Qué es Python?"}
]

for pregunta in preguntas:
    respuesta = chain.invoke(pregunta)
    display(Markdown(f"**Pregunta:** {pregunta['pregunta']}"))
    display(Markdown(f"**Respuesta:** {respuesta}"))
    print("---")  # Separador entre preguntas

## **Ejemplo 4: Prompt + LLM + OutputParser + Guardar en fichero**
Crea una cadena que genera una lista de elementos y la guarda en un archivo:

Esta vez, para una mayor correcion, aunque no es necesario, vamos a usar ChatPromptTemplate

In [None]:
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnableLambda


# Definimos el PromptTemplate
prompt_template = ChatPromptTemplate.from_messages([
    ("system", "Eres un asistente conciso y directo. Proporcionas las listas que se te piden y solo la lista sin numerar y en una columna. No añadas ningun tipo de comentario"),
    ("human", "Crea una lista de {numero_elementos} {tipo_elementos}"),
])

# Definimos el modelo de lenguaje
llm = ChatOpenAI(model="gpt-4o-mini",
                 api_key=OPENAI_API_KEY,
                 temperature=0.7)

# Definimos un OutputParser
output_parser = StrOutputParser()

# Creamos la cadena con LCEL y RunnableLambda
def guardar_en_archivo_y_mostrar(output):
    with open("respuesta.txt", "w") as f:
        f.write(output)
        print(output)
    return "Respuesta guardada en 'respuesta.txt'"

# Podriamos no hacer esto y meter la funcion directamente en la cadena
# Metemos la funcion en un Runnable, reutilizamos la variable
guardar_en_archivo_y_mostrar = RunnableLambda(guardar_en_archivo_y_mostrar)

chain = prompt_template | llm | output_parser | guardar_en_archivo_y_mostrar

# Ejecutamos la cadena
respuesta = chain.invoke({"numero_elementos": 10, "tipo_elementos": "Adbervios de modo que no acaben en 'mente'"})
display(Markdown(respuesta))

## **Ejemplo 5: Prompt + LLM + JsonOutputParser**
---

Esta vez genera una respuesta JSON.

JsonOutputParser transforma la salida del modelo en un objeto JSON válido.

In [None]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import JsonOutputParser

prompt_template = ChatPromptTemplate.from_messages([
    ("system", "Eres un asistente conciso y directo experto. Devuelve directamente un array JSON. Cada elemento del array debe ser un objeto JSON con las claves 'persona' y 'aportación'. No añadas ningun tipo de comentario"),
    ("human", "{pregunta}"),
])

# Definimos el modelo de lenguaje
llm = ChatOpenAI(model="gpt-4o-mini",
                 api_key=OPENAI_API_KEY,
                 temperature=0.7)

json_parser = JsonOutputParser()

# Creamos la cadena con LCEL
chain = prompt_template | llm | json_parser

# Ejecutamos la cadena
result = chain.invoke({"pregunta": "Inventa 10 personas ficticias y un importe en euros para cada una de ellas"})

result


Sin embargo existe un OutputParser, PydanticOutputParser mucho mas robusto para estructurar la salida. Lo usaremos a continuación.

**Consideraciones:**

-   **Dependencia del Prompt:** Con JsonOutputParser, la precisión de la salida depende mucho de la claridad y especificidad del prompt. Si el modelo no sigue exactamente las instrucciones o el prompt no es absolutamente claro, el parsing podría fallar.
    
-   **Menos validación automática:** A diferencia de PydanticOutputParser, JsonOutputParser simplemente intenta parsear la salida como JSON. No valida si la estructura interna coincide con un esquema específico.
    
-   **Manejo de la salida:** Después de obtener el JSON, necesitarás acceder a la lista de personas a través de la clave "personas" en el diccionario resultante.

Si no quieres el diccionario contenedor con la clave "personas", sino directamente la lista de diccionarios, necesitas modificar el prompt para que le indique al modelo de lenguaje que genere directamente un array JSON.

El prompt de sistema deberia ser algo asi:

*Eres un asistente conciso y directo experto. Devuelve directamente un array JSON. Cada elemento del array debe ser un objeto JSON con las claves 'persona' y 'aportación'. No añadas ningun tipo de comentario*
    
**El prompt tiene gran importancia**
En resumen, si bien es posible usar JsonOutputParser para obtener una lista de objetos, requiere un prompt más específico para guiar al modelo a generar un único JSON con una lista dentro. PydanticOutputParser ofrece una solución más robusta y con validación automática cuando se trabaja con estructuras de datos definidas.



## **Ejemplo 6: PydanticOutputParser**

PydanticOutputParser es una herramienta dentro de Langchain que facilita la estructuración de la salida de modelos de lenguaje en objetos Python definidos con Pydantic. En lugar de simplemente obtener texto plano, este parser te permite especificar un esquema de datos deseado (a través de una clase Pydantic) y automáticamente convierte la respuesta del modelo en una instancia de esa clase. Esto asegura que la información extraída tenga un formato consistente y predecible.

Una de las principales ventajas de PydanticOutputParser es su capacidad de validación. Al utilizar Pydantic, se aplican automáticamente las validaciones definidas en el esquema, lo que ayuda a garantizar la calidad y la integridad de los datos extraídos. Además, simplifica el manejo de la salida del modelo, ya que puedes acceder a los datos como atributos de un objeto Python en lugar de tener que parsear manualmente cadenas de texto o diccionarios JSON.

* Pero el fallo en la validacion de la respuesta arrojaria una excepcionque habria que gestionar con alguna estructura del tipo TRY-EXCEPT para que nuestra app no se detuviera !!

Finalmente, PydanticOutputParser mejora la claridad y mantenibilidad del código. Al definir explícitamente la estructura de la información esperada, se facilita la comprensión del flujo de datos y se reduce la probabilidad de errores al trabajar con la salida del modelo. Además, Langchain integra funcionalidades para generar instrucciones de formato para el modelo basadas en el esquema Pydantic, lo que ayuda a guiar al modelo para que produzca la salida en el formato correcto desde el principio.



In [None]:
from pydantic import BaseModel, Field
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import PydanticOutputParser


# Definimos nuestra estructura de datos
class Resultado(BaseModel):
    persona: str = Field(description="Nombre de la persona")
    aportacion: str = Field(description="Importe en euros")

prompt_template = ChatPromptTemplate.from_messages([
    ("system", "Eres un asistente conciso y directo experto. Devuelve el resultado en formato JSON con las claves 'persona' y 'aportación'. No añadas ningun tipo de comentario"),
    ("human", "{pregunta}"),
])

# Definimos el modelo de lenguaje
llm = ChatOpenAI(model="gpt-4o-mini",
                 api_key=OPENAI_API_KEY,
                 temperature=0.7)

# Usamos PydanticOutputParser y le pasamos la clase Resultado
json_parser = PydanticOutputParser(pydantic_object=Resultado)

# Incluimos las instrucciones de formato en el prompt
prompt_con_formato = ChatPromptTemplate.from_messages([
    ("system", "Eres un asistente conciso y directo experto. Devuelve el resultado en formato JSON con las claves 'persona' y 'aportación'. No añadas ningun tipo de comentario. \n{format_instructions}\n"),
    ("human", "{pregunta}"),
])

# Creamos la cadena con LCEL
chain = prompt_con_formato | llm | json_parser

# Ejecutamos la cadena y gestionamos la excepción
try:
    result = chain.invoke({"pregunta": "Inventa 10 personas ficticias y un importe en euros para cada una de ellas", "format_instructions": json_parser.get_format_instructions()})
    print(result)
except Exception as e:
    print(f"Se produjo una excepción: {e}")
    print("La validación falló porque el modelo devolvió una lista de objetos, pero se esperaba un único objeto.")

Con unos cambios en el prompt y en las clases de validacion conseguimos obtener una lista JSON correcta

In [None]:
from pydantic import BaseModel, Field
from typing import List
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import PydanticOutputParser


# Definimos la estructura de datos para UN resultado
class Resultado(BaseModel):
    persona: str = Field(description="Nombre de la persona")
    aportacion: str = Field(description="Importe en euros")

# Definimos una nueva estructura para una LISTA de resultados
class ListaResultados(BaseModel):
    resultados: List[Resultado]

prompt_template = ChatPromptTemplate.from_messages([
    ("system", "Eres un asistente conciso y directo experto. Devuelve un array JSON con una lista de objetos, donde cada objeto tiene las claves 'persona' y 'aportación'. No añadas ningun tipo de comentario"),
    ("human", "{pregunta}"),
])

# Definimos el modelo de lenguaje
llm = ChatOpenAI(model="gpt-4o-mini",
                 api_key=OPENAI_API_KEY,
                 temperature=0.7)

# Usamos PydanticOutputParser y le pasamos la clase ListaResultados
json_parser = PydanticOutputParser(pydantic_object=ListaResultados)

# Incluimos las instrucciones de formato en el prompt
prompt_con_formato = ChatPromptTemplate.from_messages([
    ("system", "Eres un asistente conciso y directo experto. Devuelve un array JSON con una lista de objetos, donde cada objeto tiene las claves 'persona' y 'aportación'. No añadas ningun tipo de comentario. \n{format_instructions}\n"),
    ("human", "{pregunta}"),
])

# Creamos la cadena con LCEL
chain = prompt_con_formato | llm | json_parser

# Ejecutamos la cadena
try:
    result = chain.invoke({"pregunta": "Inventa 10 personas ficticias y un importe en euros para cada una de ellas", "format_instructions": json_parser.get_format_instructions()})
    print(result)
    # Ahora puedes acceder a la lista de resultados así:
    for item in result.resultados:
        print(f"Persona: {item.persona}, Aportación: {item.aportacion}")

except Exception as e:
    print(f"Se produjo una excepción: {e}")
    print("La validación falló. Asegúrate de que el modelo devuelve una lista de objetos con la estructura correcta.")

## **Ejemplo 7: Cadena con dos LLMs (Generación y Resumen)**

Este ejemplo nos permitir presentar algunas caracteristicas mas de LCEL.
Presentaremos diversas variaciones del mismo.

Vamos a crear una cadena donde un LLM genera contenido y otro LLM resumen ese contenido.

Posiblemnte el modo mas facil, segun vamos haciendo, sea este. Pero observa que de esta forma no tenemos acceso al texto del articulo que se genera dentro de la cadena y que se pasa a resumir. Solo accedemos al resultado final de la cadena, el texto resumido.

In [None]:
# Primer LLM: Genera contenido
llm1 = ChatOpenAI(model="gpt-4o-mini",
                 api_key=OPENAI_API_KEY,
                 temperature=0.7)

generate_prompt = PromptTemplate(
    input_variables=["topic"],
    template="Escribe un artículo detallado sobre {topic}."
)

# Segundo LLM: Resumen del contenido generado
llm2 = ChatGoogleGenerativeAI(
    model="gemini-pro",
    api_key=GOOGLE_API_KEY,
    temperature=0.7)

summarize_prompt = PromptTemplate(
    input_variables=["article"],
    template="Resumen el siguiente artículo:\n{article}"
)

# Cadena completa usando LCEL
chain = generate_prompt | llm1 | summarize_prompt | llm2

# Ejecutar la cadena
salida = chain.invoke({"topic": "inteligencia artificial"})
display(Markdown(salida.content))


Para mostrar tanto el texto extenso (artículo completo) como el texto resumido usando el enfoque moderno de cadenas en LangChain (LCEL), lo más sencillo es separar la generación en dos pasos en lugar de construir una única cadena que sobrescriba la salida intermedia. Así podemos capturar y reutilizar la respuesta completa de tu primer LLM.



In [None]:
# 1) Primer LLM: genera contenido
llm1 = ChatOpenAI(
    model="gpt-4o-mini",
    api_key=OPENAI_API_KEY,
    temperature=0.7
)

generate_prompt = PromptTemplate(
    input_variables=["topic"],
    template="Escribe un artículo detallado sobre {topic}."
)

# 2) Segundo LLM: resume el contenido generado
llm2 = ChatGoogleGenerativeAI(
    model="gemini-pro",
    api_key=GOOGLE_API_KEY,
    temperature=0.7
)

summarize_prompt = PromptTemplate(
    input_variables=["article"],
    template="Resumen el siguiente artículo:\n{article}"
)

# --- EJECUCIÓN EN DOS PASOS ---

# Paso A: Generar el artículo
article_chain = generate_prompt | llm1
article_result = article_chain.invoke({"topic": "inteligencia artificial"})

# Paso B: Resumir el artículo
summary_chain = summarize_prompt | llm2
summary_result = summary_chain.invoke({"article": article_result.content})

# Mostramos ambos resultados
display(Markdown("## Texto extenso (Artículo completo)"))
display(Markdown(article_result.content))

display(Markdown("## Resumen"))
display(Markdown(summary_result.content))

## **RunnableParallel**

RunnableParallel es un **Runnable** que te permite ejecutar **varios Runnables diferentes simultáneamente (en paralelo)**. Piensa en él como un coordinador que lanza varias tareas al mismo tiempo y luego reúne los resultados.

**¿Cómo funciona?**

- **Recibe un diccionario de Runnables:** Se le proporciona un diccionario donde las **claves son nombres descriptivos** y los **valores son los Runnables** que quieres ejecutar en paralelo.
    
- **Ejecuta los Runnables en paralelo:** LangChain se encarga de ejecutar todos esos Runnables al mismo tiempo (o lo más simultáneamente posible).
    
- **Devuelve un diccionario de resultados:** El resultado de RunnableParallel es un diccionario donde las **claves son las mismas que proporcionaste** y los **valores son los resultados de la ejecución de cada Runnable**.

Es especialmente útil cuando necesitas realizar diferentes transformaciones o procesamientos **sobre los mismos datos**.

1. **Input compartido:** El mismo input se pasa a todas las tareas definidas en el paralelo.  

2. **Ejecución simultánea:** Todas las tareas se ejecutan al mismo tiempo.
3. **Salida combinada:** Devuelve un diccionario donde cada clave corresponde a la tarea y su respectivo resultado.

## **Ejemplo: 3 funciones en paralelo**

Supongamos que queremos realizar tres trasnformaciones sobre el mismo texto.

1. Contar los caracteres (`len`).
2. Convertir el texto a mayúsculas.
3. Invertir el texto.

( Observa dos cosas: Este ejemplo no implica ningun LLM, son solo funciones Python. No hacemos uso de RunnableLambda en las dos ultimas, LangChain envolverá nuestras unciones por nosotros en un RunnableLambda)

In [2]:
from langchain.schema.runnable import RunnableParallel, RunnableLambda

# 1. Crear un RunnableParallel con varias tareas
parallel = RunnableParallel({
    "length": RunnableLambda(lambda x: len(x)),  # Cuenta caracteres
    "uppercase": lambda x: x.upper(),  # Convierte a mayúsculas
    "reverse": lambda x: x[::-1]  # Invierte el texto
})

# 2. Probar el RunnableParallel
input_text = "LangChain es increíble"
result = parallel.invoke(input_text)

# 3. Imprimir el resultado
print(result)

{'length': 22, 'uppercase': 'LANGCHAIN ES INCREÍBLE', 'reverse': 'elbíercni se niahCgnaL'}


## **Ejemplo: Traducciones en paralelo**

Deseamos usar cuatro modelos de lenguje diferentes (dos de ellos el mismo con diferente temperatura) para traducir un texto



In [7]:
from langchain.schema.runnable import RunnableParallel

gpt4mini_0 = ChatOpenAI(
    model="gpt-4o-mini",
    api_key=OPENAI_API_KEY,
    temperature=0)

gpt4mini_2 = ChatOpenAI(
    model="gpt-4o-mini",
    api_key=OPENAI_API_KEY,
    temperature=2)

gemini = ChatGoogleGenerativeAI(
    model="gemini-pro",
    api_key=GOOGLE_API_KEY,
    temperature=0.7)

llama33 = ChatGroq(
    model="llama-3.3-70b-versatile",
    api_key=GROQ_API_KEY,
    temperature=0.7)

# Prompt para modelos que soportan mensajes de sistema
prompt_template_con_sistema = ChatPromptTemplate.from_messages([
    ("system", "Eres un experto traductor de ingles a español. Contestas siempre solo con la traducción que se te solicite"),
    ("human", "Traduce el texto siguiente: {texto}"),
])

# Prompt simplificado para Gemini (sin mensaje de sistema)
prompt_template_gemini = ChatPromptTemplate.from_messages([
    ("human", "Traduce el texto siguiente al español: {texto}"),
])

prompt_text = ( "Whenever used in this Agreement, the following words and phrases,"
                "unless the context otherwise requires, shall have the following meanings."
                "Such meanings shall be equally applicable to the singular and plural forms "
                "of such terms, as the context may require." )

cadena = RunnableParallel({
    "gpt4mini_0": prompt_template_con_sistema | gpt4mini_0,
    "gpt4mini_2": prompt_template_con_sistema | gpt4mini_2,
    "gemini": prompt_template_gemini | gemini,  # Usamos el prompt simplificado para Gemini
    "llama33": prompt_template_con_sistema | llama33,
})

resultado = cadena.invoke({"texto": prompt_text}) # Pasamos un diccionario con la clave "texto"

for modelo, traduccion in resultado.items():
    print(f"{modelo}: {traduccion.content}")
    print("---")

gpt4mini_0: Siempre que se utilicen en este Acuerdo, las siguientes palabras y frases, a menos que el contexto requiera lo contrario, tendrán los siguientes significados. Dichos significados serán igualmente aplicables a las formas singular y plural de dichos términos, según lo requiera el contexto.
---
gpt4mini_2: Siempre que se utilicen en este Acuerdo, las siguientes palabras y frases, a menos que el contexto requiera lo contrario, tendrán los siguientes significados. Dichos significados serán aplicables igualmente a las formas singular y plural de dichos términos, según exija el contexto.
---
gemini: Cuando se utilizan en este Acuerdo, las siguientes palabras y frases, a menos que el contexto requiera lo contrario, tendrán los siguientes significados. Tales significados serán aplicables igualmente a las formas singulares y plurales de tales términos, según lo requiera el contexto.
---
llama33: Siempre que se utilicen en este Acuerdo, las siguientes palabras y frases, a menos que el

Obtnemos un diccionario como resultado. Con claves para cada una de las tareas (o hilos) y los valores de cada una es la respuesta a esa tarea.



In [10]:
from langchain.schema.runnable import RunnableParallel

# Configuración de los modelos
gpt4_mini = ChatOpenAI(model="gpt-4o-mini", api_key=OPENAI_API_KEY, temperature=2)

gemini = ChatGoogleGenerativeAI(model="gemini-pro", api_key=GOOGLE_API_KEY, temperature=0.7)

# Prompt para traducción
prompt_traduccion = ChatPromptTemplate.from_messages([
    ("system", "Eres un traductor experto de inglés a español."),
    ("human", "Traduce el siguiente texto al español: {texto}")
])

# Prompt para análisis de texto (métricas)
prompt_analisis = ChatPromptTemplate.from_messages([
    ("human", "Eres un analista de texto que calcula estadísticas simples.\n Analiza este texto y devuelve una lista con los terminos tcnicos.\nTexto: {texto}")
])

# Texto de ejemplo
texto_entrada = "Machine learning models, such as transformers, have revolutionized natural language processing."

# Definir tareas paralelas
procesos_paralelos = RunnableParallel({
    "traduccion": prompt_traduccion | gpt4_mini,
    "analisis": prompt_analisis | gemini
})

# Ejecutar las tareas paralelas
resultados = procesos_paralelos.invoke({"texto": texto_entrada})

# Procesar manualmente los resultados
traduccion = resultados["traduccion"].content
analisis = resultados["analisis"].content

# Combinar y mostrar los resultados
resultado_final = f"Traducción: {traduccion}\n\nAnálisis del texto original:\n{analisis}"
print(resultado_final)

Traducción: Los modelos de aprendizaje automático, como los transformers, han revolucionado el procesamiento del lenguaje natural.

Análisis del texto original:
**Número de palabras:** 12

**Términos técnicos:**

* Machine learning
* Transformers
* Natural language processing


Como podemos pasar todos los resultados a otro Runnable ??

Basicamente, como sabemos el resultado es un diccionario, crearemmos una funcion que tome como entrada el diccionario y haga algo con el

Por ejmplo vamos a usar un LLM para producir una frase distinta de similar longitud que use los mismos terminos tenicos detectados

In [50]:
from langchain.output_parsers import PydanticOutputParser
from pydantic import BaseModel, Field
from langchain.schema.runnable import RunnableParallel


# Definir el modelo Pydantic para la lista de términos técnicos
class TerminosTecnicos(BaseModel):
    terminos: list[str] = Field(description="Lista de términos técnicos encontrados en el texto")

# Crear el PydanticOutputParser
output_parser = PydanticOutputParser(pydantic_object=TerminosTecnicos)



# Configuración de los modelos
gpt4_mini_0 = ChatOpenAI(model="gpt-4o-mini", api_key=OPENAI_API_KEY, temperature=0)
gpt4_mini_1 = ChatOpenAI(model="gpt-4o-mini", api_key=OPENAI_API_KEY, temperature=1)
gemini = ChatGoogleGenerativeAI(model="gemini-pro", api_key=GOOGLE_API_KEY, temperature=0.7)

# Prompt para traducción
prompt_traduccion = ChatPromptTemplate.from_messages([
    ("system", "Eres un traductor experto de inglés a español."),
    ("human", "Traduce el siguiente texto al español: {texto}")
])

# Prompt para análisis de texto (métricas) - Modificado para Pydantic
prompt_analisis = ChatPromptTemplate.from_messages([
    ("human", "Eres un analista de texto. Analiza este texto y devuelve una lista de los términos técnicos encontrados.\nTexto: {texto}\n{format_instructions}")
]).partial(format_instructions=output_parser.get_format_instructions())



# Prompt para generacion
prompt_generacion = ChatPromptTemplate.from_messages([
    ("system", "Eres un escritor tecnico experimentado."),
    ("human", "Crea una frase de {longitud} usando los terminos tecnicos {lista_terminos}, pero que sea distinta a {frase_original}")
])

# Texto de ejemplo
texto_entrada = "Machine learning models, such as transformers, have revolutionized natural language processing."

# Definir tareas paralelas
procesos_paralelos = RunnableParallel({
    "traduccion": prompt_traduccion | gpt4_mini_0,
    "analisis": prompt_analisis | gemini | output_parser
})

# Ejecutar las tareas paralelas
resultados = procesos_paralelos.invoke({"texto": texto_entrada})



# Procesar manualmente los resultados
traduccion = resultados["traduccion"].content
analisis = resultados["analisis"].terminos


print(analisis.terminos)

Machine learning


💡idea : obterner la traduccion con gtranslate y otra por un llm. Pasarsela un segundo llm para que las compare y haga una version final. Esto parerec un caso de fusionar dos ramas

Otra variante, producir en paralelo varias traducciones y fusionarlas en una sola

Referencias:

1. https://python.langchain.com/docs/concepts/runnables/

2. Info oficial: https://python.langchain.com/api_reference/core/runnables.html
3. https://python.langchain.com/docs/how_to/lcel_cheatsheet/

4. https://dzone.com/articles/guide-to-langchain-runnable-architecture

5. https://medium.com/@danushidk507/runnables-in-langchain-e6bfb7b9c0ca

6. https://www.youtube.com/watch?v=8aUYzb1aYDU

7. https://medium.com/@james.li/mental-model-to-building-chains-with-langchain-expression-language-lcel-with-branching-and-36f185134eac

8. https://medium.com/@ulrichw/list/langchain-lcel-85af4f4ff883

9. https://medium.com/@anuragmishra_27746/practical-hands-on-with-langchain-expression-language-lcel-for-building-langchain-agent-chain-2a9364dc4ca3

10. https://www.pinecone.io/learn/series/langchain/langchain-expression-language/




