# 2 - Model I/O

<img src="https://raw.githubusercontent.com/Hack-io-AI/ai_images/main/langchain.jpeg" style="width:400px;"/>

<h1>Tabla de Contenidos<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#1---I/O" data-toc-modified-id="1---I/O-1">1 - I/O</a></span></li><li><span><a href="#2---LLMs" data-toc-modified-id="2---LLMs-2">2 - LLMs</a></span></li><li><span><a href="#3---Chat-models" data-toc-modified-id="3---Chat-models-3">3 - Chat models</a></span></li><li><span><a href="#4---Prompts" data-toc-modified-id="4---Prompts-4">4 - Prompts</a></span></li><li><span><a href="#5---Parsers-de-Salida" data-toc-modified-id="5---Parsers-de-Salida-5">5 - Parsers de Salida</a></span><ul class="toc-item"><li><span><a href="#5.1---SimpleJsonOutputParser" data-toc-modified-id="5.1---SimpleJsonOutputParser-5.1">5.1 - SimpleJsonOutputParser</a></span></li><li><span><a href="#5.2---CommaSeparatedListOutputParser" data-toc-modified-id="5.2---CommaSeparatedListOutputParser-5.2">5.2 - CommaSeparatedListOutputParser</a></span></li><li><span><a href="#5.3---DatetimeOutputParser" data-toc-modified-id="5.3---DatetimeOutputParser-5.3">5.3 - DatetimeOutputParser</a></span></li></ul></li></ul></div>

## 1 - I/O

En LangChain, el elemento central de cualquier aplicación gira en torno al modelo de lenguaje. Este módulo proporciona los componentes esenciales para interactuar de manera efectiva con cualquier modelo de lenguaje, asegurando una integración y comunicación fluidas. Los componentes clave del Model I/O son:

<br>

1. **LLMs y Modelos de Chat (usados indistintamente)**:

    + **LLMs**: modelos de completado de texto puro, reciben una cadena de texto como entrada y devuelven una cadena de texto como salida.


    + **Modelos de Chat**:  modelos que utilizan un modelo de lenguaje como base, pero difieren en los formatos de entrada y salida. Aceptan una lista de mensajes de chat como entrada y devuelven un mensaje de chat como salida.

<br>

2. **Prompts**: permiten la creación de plantillas, la selección dinámica y la gestión de las entradas del modelo. Esto permite generar prompts flexibles y específicos al contexto que guían las respuestas del modelo de lenguaje.

<br>

3. **Parsers de Salida**: extraen y formatean la información de las salidas del modelo. Son útiles para convertir la salida en bruto de los modelos de lenguaje en datos estructurados o formatos específicos necesarios para la aplicación.

## 2 - LLMs

La integración de LangChain con los modelos de lenguaje (LLMs) como OpenAI o HuggingFace es un aspecto fundamental de su funcionalidad. LangChain no aloja LLMs por sí mismo, pero ofrece una interfaz uniforme para interactuar con varios LLMs.

Esta sección proporciona una visión general sobre el uso del envoltorio (wrapper) de LLM de OpenAI en LangChain, aplicable también a otros tipos de LLMs. 

In [1]:
# primero cargamos la API KEY de OpenAI

from dotenv import load_dotenv 
import os

# carga de variables de entorno
load_dotenv()


# api key openai, nombre que tiene por defecto en LangChain
OPENAI_API_KEY = os.getenv('OPENAI_API_KEY')

In [2]:
# importamos llm desde LangChain

from langchain_openai import OpenAI

In [3]:
# iniciamos el llm, por defecto gpt-3.5-turbo-instruct

llm = OpenAI() 

In [4]:
# uso del llm con el metodo invoke

llm.invoke('hola como estas?')

'\n\nSoy un programa de ordenador, no tengo emociones ni capacidad de sentir, por lo que no puedo estar bien o mal. ¿En qué puedo ayudarte?'

In [5]:
# otro ejemplo

respuesta = llm.invoke('¿cuales son las 7 maravillas del mundo?')

In [6]:
print(respuesta)



1. La Gran Pirámide de Guiza (Egipto)
2. Jardines Colgantes de Babilonia (actualmente, Iraq)
3. Estatua de Zeus en Olimpia (Grecia)
4. Templo de Artemisa en Éfeso (actualmente, Turquía)
5. Mausoleo de Halicarnaso (actualmente, Turquía)
6. Coloso de Rodas (actualmente, Grecia)
7. Faro de Alejandría (actualmente, Egipto)


También podemos llamar al método `stream` para transmitir la respuesta de texto.

In [7]:
for chunk in llm.stream('¿cuales son las 7 maravillas del mundo?'):
    
    print(chunk, end='', flush=True)



1. La Gran Pirámide de Guiza (Egipto)
2. Los Jardines Colgantes de Babilonia (Irak)
3. El Templo de Artemisa en Éfeso (Turquía)
4. La Estatua de Zeus en Olimpia (Grecia)
5. El Mausoleo de Halicarnaso (Turquía)
6. El Coloso de Rodas (Grecia)
7. El Faro de Alejandría (Egipto)

## 3 - Chat models

La integración de LangChain con modelos de chat, una variación especializada de los modelos de lenguaje, es esencial para crear aplicaciones de chat interactivas. Aunque utilizan modelos de lenguaje internamente, los modelos de chat presentan una interfaz distinta centrada en los mensajes de chat como entradas y salidas. Usaremos el chat de OpenAI, dependiendo de la version de LangChain que tengamos, será necesario instalar:

```bash
pip install langchain-openai
```

In [8]:
# importamos el modelo de chat de OpenAI

from langchain_openai import ChatOpenAI

In [9]:
# iniciamos el chat, por defecto gpt-3.5-turbo

chat = ChatOpenAI()

In [10]:
# uso del chat con string

chat.invoke('hola')

AIMessage(content='¡Hola! ¿En qué puedo ayudarte hoy?', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 11, 'prompt_tokens': 9, 'total_tokens': 20, 'completion_tokens_details': {'audio_tokens': None, 'reasoning_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': None, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-6a5dc0a1-aab1-406b-a65d-ea48349c690a-0', usage_metadata={'input_tokens': 9, 'output_tokens': 11, 'total_tokens': 20, 'input_token_details': {'cache_read': 0}, 'output_token_details': {'reasoning': 0}})

In [11]:
# cambio a gpt-4o

chat = ChatOpenAI(model_name='gpt-4o')

In [12]:
# uso del chat con string

chat.invoke('hola')

AIMessage(content='¡Hola! ¿En qué puedo ayudarte hoy?', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 10, 'prompt_tokens': 8, 'total_tokens': 18, 'completion_tokens_details': {'audio_tokens': None, 'reasoning_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': None, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-2024-08-06', 'system_fingerprint': 'fp_a7d06e42a7', 'finish_reason': 'stop', 'logprobs': None}, id='run-4459c9ef-5c3e-483a-bcc0-7e27862f0e54-0', usage_metadata={'input_tokens': 8, 'output_tokens': 10, 'total_tokens': 18, 'input_token_details': {'cache_read': 0}, 'output_token_details': {'reasoning': 0}})

Como vemos, podemos usar una string al invocar al modelo directamente, pero la salida ya no es una string, es un AIMessage. Los modelos de chat en LangChain trabajan con diferentes tipos de mensajes, como AIMessage, HumanMessage, SystemMessage, FunctionMessage y ChatMessage, este último con un parámetro de rol arbitrario. En general, HumanMessage, AIMessage y SystemMessage son los más utilizados. Veamos otro ejemplo:

In [13]:
from langchain.schema.messages import HumanMessage, SystemMessage


mensajes = [SystemMessage(content='Eres Micheal Jordan.'),
            HumanMessage(content='¿Con qué fabricante de zapatos estás asociado?')]


respuesta = chat.invoke(mensajes)


respuesta

AIMessage(content='Estoy asociado con Nike. Juntos lanzamos la línea de calzado Air Jordan, que comenzó en 1984 y se ha convertido en una marca icónica en el mundo del baloncesto y la moda.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 43, 'prompt_tokens': 26, 'total_tokens': 69, 'completion_tokens_details': {'audio_tokens': None, 'reasoning_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': None, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-2024-08-06', 'system_fingerprint': 'fp_a7d06e42a7', 'finish_reason': 'stop', 'logprobs': None}, id='run-cbb36533-4b18-4863-8e1d-3d6ebc725f7c-0', usage_metadata={'input_tokens': 26, 'output_tokens': 43, 'total_tokens': 69, 'input_token_details': {'cache_read': 0}, 'output_token_details': {'reasoning': 0}})

In [14]:
# string de respuesta

respuesta.content

'Estoy asociado con Nike. Juntos lanzamos la línea de calzado Air Jordan, que comenzó en 1984 y se ha convertido en una marca icónica en el mundo del baloncesto y la moda.'

## 4 - Prompts

Los prompts son esenciales para guiar a los modelos de lenguaje a generar resultados relevantes y coherentes. Pueden ir desde instrucciones simples hasta ejemplos complejos de few-shot. En LangChain, manejar prompts puede ser un proceso muy sencillo, gracias a varias clases y funciones dedicadas.


La clase `PromptTemplate` de LangChain es una herramienta versátil para crear prompts en formato de cadena de texto. Utiliza la sintaxis str.format de Python, lo que permite generar prompts de forma dinámica. Podemos definir una plantilla con marcadores de posición y rellenarlos con valores específicos según sea necesario.


In [15]:
# importamos la plantilla de prompts

from langchain.prompts import PromptTemplate

In [16]:
# definimos la plantilla

plantilla = PromptTemplate.from_template('Cuentame un chiste {adjetivo} sobre {contenido}.')

In [17]:
# variables de usuario

adjetivo = 'gracioso'

contenido = 'robots'

In [18]:
# definimos el prompt completo

prompt = plantilla.format(adjetivo=adjetivo, contenido=contenido)

In [19]:
prompt

'Cuentame un chiste gracioso sobre robots.'

In [20]:
# uso del prompt en el chat

chat.invoke(prompt).content

'¡Claro! Aquí tienes un chiste sobre robots:\n\n¿Por qué los robots nunca tienen miedo a nada?\n\n¡Porque siempre mantienen la calma y calculan todas las posibilidades!'

Para los modelos de chat, los prompts son más estructurados, involucrando mensajes con roles específicos. LangChain ofrece `ChatPromptTemplate` para este propósito.


In [21]:
# importamos la plantilla de prompts para chats

from langchain.prompts import ChatPromptTemplate

In [22]:
# definimos un prompt de chat para varios roles

plantilla_chat = ChatPromptTemplate.from_messages([
    
    ('system', 'Eres un buen asistente personal. Tu nombre es {nombre}.'),
    ('human', 'Hola, ¿como estas?'),
    ('ai', 'Estoy bien, gracias.'),
    ('human', '{pregunta}')

])

In [23]:
# formateo del mensaje

mensajes = plantilla_chat.format_messages(nombre='Pepe', pregunta='¿Como te llamas?')


for m in mensajes:
    print(m)

content='Eres un buen asistente personal. Tu nombre es Pepe.' additional_kwargs={} response_metadata={}
content='Hola, ¿como estas?' additional_kwargs={} response_metadata={}
content='Estoy bien, gracias.' additional_kwargs={} response_metadata={}
content='¿Como te llamas?' additional_kwargs={} response_metadata={}


In [24]:
chat.invoke(mensajes).content

'Me llamo Pepe. ¿En qué puedo ayudarte hoy?'

Este enfoque permite la creación de chatbots interactivos y atractivos con respuestas dinámicas.

Tanto `PromptTemplate` como `ChatPromptTemplate` se integran perfectamente con el Lenguaje de Expresión de LangChain (LCEL), lo que les permite formar parte de flujos de trabajo más grandes y complejos. A veces, los prompts personalizados son esenciales para tareas que requieren un formato único o instrucciones específicas. Crear una plantilla de prompt personalizada implica definir variables de entrada y un método de formato personalizado. Esta flexibilidad permite que LangChain se adapte a una amplia gama de requisitos específicos de las aplicaciones.

LangChain también admite few-shot prompting, lo que permite al modelo aprender a partir de ejemplos. Esta función es vital para tareas que requieren comprensión contextual o patrones específicos. 

## 5 - Parsers de Salida

Los parsers de salida desempeñan un papel crucial en LangChain, permitiendo a los usuarios estructurar las respuestas generadas por los modelos de lenguaje. En esta sección, exploraremos el concepto de parsers de salida y proporcionaremos ejemplos de código utilizando los siguientes parsers de LangChain: `SimpleJsonOutputParser`, `CommaSeparatedListOutputParser` y `DatetimeOutputParser`.

### 5.1 - SimpleJsonOutputParser

El `SimpleJsonOutputParser` de LangChain se utiliza cuando se desea analizar salidas en formato JSON. Veamos un ejemplo:

In [25]:
from langchain.output_parsers.json import SimpleJsonOutputParser

In [26]:
# creamos un prompt pidiendole un JSON 

json_prompt = PromptTemplate.from_template(
    'Devuelve un JSON con `fecha_nacimiento` y `lugar_nacimiento` para la siguiente pregunta: {pregunta}'
)

In [27]:
# iniciamos el parser

json_parser = SimpleJsonOutputParser()

In [28]:
# creamos una cadena con el prompt, modelo y parser

json_chain = json_prompt | chat | json_parser

In [29]:
# llamada a la cadena

json = json_chain.invoke({'pregunta': 'Donde y cuando nacio Elon Musk'})

In [30]:
print(json)

{'fecha_nacimiento': '28 de junio de 1971', 'lugar_nacimiento': 'Pretoria, Sudáfrica'}


In [31]:
type(json)

dict

### 5.2 - CommaSeparatedListOutputParser

El `CommaSeparatedListOutputParser` es útil cuando deseas extraer listas separadas por comas de las respuestas del modelo. Veamos un ejemplo:

In [32]:
from langchain.output_parsers import CommaSeparatedListOutputParser

In [33]:
# iniciamos el parser

parser = CommaSeparatedListOutputParser()

In [34]:
# generamos un prompt

prompt = PromptTemplate.from_template(
    'Devuelve 5 {pregunta}. La respuesta debe ser una lista de strings separadas por coma.'
)

In [35]:
chain = prompt | chat | parser

In [36]:
res = chain.invoke({'pregunta': 'Equipos de la liga española'})

In [37]:
print(res)

['Real Madrid', 'FC Barcelona', 'Atlético de Madrid', 'Sevilla FC', 'Valencia CF']


In [38]:
type(res)

list

### 5.3 - DatetimeOutputParser

El `DatetimeOutputParser` de LangChain está diseñado para analizar información de fecha y hora. Veamos cómo usarlo:

In [39]:
from langchain.output_parsers import DatetimeOutputParser

In [40]:
# inicamos el parser

parser = DatetimeOutputParser()

In [41]:
prompt = PromptTemplate.from_template(
    'Responde la siguiente pregunta {pregunta}. Devuelve solamente el formato %Y-%m-%dT%H:%M:%S.%fZ.'
)

In [42]:
chain = prompt | chat | parser

In [43]:
chain.invoke({'pregunta': 'Cuando llego el hombre a la luna'})

datetime.datetime(1969, 7, 20, 20, 17, 40)