<em style="text-align:center">Copyright Iván Pinar Domínguez</em>

## Importar librerías e instancia de modelo de chat

In [1]:
from langchain.prompts import PromptTemplate, SystemMessagePromptTemplate,ChatPromptTemplate, HumanMessagePromptTemplate
from langchain_openai import ChatOpenAI
f = open('../OpenAI_key.txt')
api_key = f.read()
chat = ChatOpenAI(openai_api_key=api_key)

## Parsear una lista de elementos separados por coma

In [2]:
from langchain.output_parsers import CommaSeparatedListOutputParser

In [3]:
output_parser = CommaSeparatedListOutputParser()

In [4]:
format_instructions = output_parser.get_format_instructions() #Nos devuelve las instrucciones que va a pasar al LLM en función del parseador concreto

In [5]:
print(format_instructions)

Your response should be a list of comma separated values, eg: `foo, bar, baz` or `foo,bar,baz`


In [6]:
#Respuesta imaginaria
respuesta = "coche, árbol, carretera"
output_parser.parse(respuesta)

['coche', 'árbol', 'carretera']

In [16]:
#Creamos la plantilla de usuario (human_template) con la concatenación de la variable "request" (la solicitud) y la variable "format_instructions" con 
#las instrucciones adicionales que le pasaremos al LLM
human_template = '{request}\n{format_instructions}'
human_prompt = HumanMessagePromptTemplate.from_template(human_template)

In [17]:
#Creamos el prompt y le damos formato a las variables
chat_prompt = ChatPromptTemplate.from_messages([human_prompt])

chat_prompt.format_prompt(request="dime 5 características de los coches americanos",
                   format_instructions = output_parser.get_format_instructions()) #Las instrucciones son las que proporciona el propio parseador

ChatPromptValue(messages=[HumanMessage(content='dime 5 características de los coches americanos\nYour response should be a list of comma separated values, eg: `foo, bar, baz` or `foo,bar,baz`')])

In [18]:
#Transformamos el objeto prompt a una lista de mensajes y lo guardamos en "solicitud_completa" que es lo que pasaremos al LLM finalmente
solicitud_completa = chat_prompt.format_prompt(request="dime 5 características de los coches americanos",
                   format_instructions = output_parser.get_format_instructions()).to_messages()

In [19]:
result = chat.invoke(solicitud_completa)

In [20]:
result.content

'potentes, grandes, consumen mucha gasolina, diseño llamativo, tecnología avanzada'

In [21]:
# Convertir a la salida esperada
output_parser.parse(result.content)

['potentes',
 'grandes',
 'consumen mucha gasolina',
 'diseño llamativo',
 'tecnología avanzada']

## Parsear formatos de fecha

In [22]:
from langchain.output_parsers import DatetimeOutputParser

In [23]:
output_parser = DatetimeOutputParser()

In [24]:
print(output_parser.get_format_instructions())

Write a datetime string that matches the following pattern: '%Y-%m-%dT%H:%M:%S.%fZ'.

Examples: 1924-06-20T04:46:19.345253Z, 1048-08-07T10:26:10.233620Z, 0583-10-25T14:00:18.275497Z

Return ONLY this string, no other words!


In [25]:
template_text = "{request}\n{format_instructions}"
human_prompt=HumanMessagePromptTemplate.from_template(template_text)

In [26]:
chat_prompt = ChatPromptTemplate.from_messages([human_prompt])

In [27]:
print(chat_prompt.format(request="¿Cuándo es el día de la declaración de independencia de los EEUU?",
                   format_instructions=output_parser.get_format_instructions()
                   ))

Human: ¿Cuándo es el día de la declaración de independencia de los EEUU?
Write a datetime string that matches the following pattern: '%Y-%m-%dT%H:%M:%S.%fZ'.

Examples: 0366-12-20T01:05:21.551348Z, 0551-11-03T17:04:23.715363Z, 1743-07-09T14:08:17.628601Z

Return ONLY this string, no other words!


In [28]:
solicitud_completa = chat_prompt.format_prompt(request="¿Cuándo es el día de la declaración de independencia de los EEUU?",
                   format_instructions=output_parser.get_format_instructions()
                   ).to_messages()

In [36]:
result = chat.invoke(solicitud_completa)

In [37]:
result.content

'1776-07-04T00:00:00.000000Z'

In [33]:
output_parser.parse(result.content)

datetime.datetime(1776, 7, 4, 0, 0)


# Métodos para solucionar problemas de parseo

## Auto-Fix Parser

In [43]:
from langchain.output_parsers import OutputFixingParser

output_parser_dates = DatetimeOutputParser()

misformatted = result.content

In [44]:
misformatted

'1776-07-04T00:00:00.000000Z'

In [45]:
new_parser = OutputFixingParser.from_llm(parser=output_parser_dates, llm=chat)

In [46]:
new_parser.parse(misformatted)

datetime.datetime(1776, 7, 4, 0, 0)

## Solucionar con System Prompt:

In [47]:
system_prompt = SystemMessagePromptTemplate.from_template("Tienes que responder únicamente con un patrón de fechas")
template_text = "{request}\n{format_instructions}"
human_prompt=HumanMessagePromptTemplate.from_template(template_text)

In [48]:
chat_prompt = ChatPromptTemplate.from_messages([system_prompt,human_prompt])

In [50]:
print(chat_prompt.format(request="¿Cuándo es el día de la declaración de independencia de los EEUU?",
                   format_instructions=output_parser_dates.get_format_instructions()
                   ))

System: Tienes que responder únicamente con un patrón de fechas
Human: ¿Cuándo es el día de la declaración de independencia de los EEUU?
Write a datetime string that matches the following pattern: '%Y-%m-%dT%H:%M:%S.%fZ'.

Examples: 1796-08-19T13:01:40.941040Z, 1052-07-14T03:23:02.486362Z, 0399-09-13T21:57:07.231821Z

Return ONLY this string, no other words!


In [52]:
solicitud_completa = chat_prompt.format_prompt(request="¿Cuándo es el día de la declaración de independencia de los EEUU?",
                   format_instructions=output_parser_dates.get_format_instructions()
                   ).to_messages()

In [53]:
result = chat.invoke(solicitud_completa)

In [54]:
result.content

'1776-07-04T00:00:00.000000Z'

In [56]:
output_parser_dates.parse(result.content)

datetime.datetime(1776, 7, 4, 0, 0)