# Agentic fighters

## Exercise 1 - LangChain basics

### 1.1 - Chatbot simple

Bienvenidos a la primera parte del workshop!

Vamos a empezar viendo cómo podemos generar una aplicación basada en IA que utilice LangChain, un framework muy popular para desarrollar apps con LLMs.

#### Preparar las claves

Primero, vamos a preparar el entorno de Python para poder usar las claves de OpenAI. Hay que definir la OPENAI_API_KEY en el archivo .env.

El código busca la clave y fija unos parámetros:

- LLM_MODEL: el modelo a utilizar
- LLM_TEMPERATURE: parámetro que controla la aleatoriedad de las respuestas (0 significa que será completamente determinista)

In [1]:
import os

In [2]:
if not os.environ.get("OPENAI_API_KEY"):
    raise ValueError("Please set OPENAI_API_KEY environment variable")

LLM_MODEL = "gpt-4o-mini"
LLM_TEMPERATURE = 0

In [3]:
from IPython.display import Markdown
from langchain_core.messages import HumanMessage, SystemMessage
from langchain_openai import ChatOpenAI

Ahora vamos a crear el chabot con LangChain. Usaremos:

- ChatOpenAI: la interfaz a los modelos de OpenAI
- SystemMessage: define el comportamiento general del modelo
- HumanMessage: representa el input del usuario

Vamos a crear un chatbot con la temática deseada. Para ello:

1. instanciamos el modelo
2. definimos el system prompt que define el rol del chatbot
3. enviamos una query y recibimos una respuesta con el método .invoke()

Así vemos el patrón básico de interacciones: prompt → respuesta.

In [4]:
# TODO: Create a ChatOpenAI instance with the LLM model and temperature
base_model = ChatOpenAI(model=LLM_MODEL, temperature=LLM_TEMPERATURE)
base_model

ChatOpenAI(client=<openai.resources.chat.completions.completions.Completions object at 0x1092f4990>, async_client=<openai.resources.chat.completions.completions.AsyncCompletions object at 0x1092fc790>, root_client=<openai.OpenAI object at 0x108666f10>, root_async_client=<openai.AsyncOpenAI object at 0x108fdd710>, model_name='gpt-4o-mini', temperature=0.0, model_kwargs={}, openai_api_key=SecretStr('**********'))

In [5]:
BASE_PROMPT = """
Eres un profesor de la UPV y te gusta que todos los alumnos aprendan.
"""

In [6]:
# Request from the client
request = " Explicame que es un agente en tematica de IA y data science"

# Message list for the base model
messages = [
    SystemMessage(BASE_PROMPT),
    HumanMessage(request),
]
print(messages)

[SystemMessage(content='\nEres un profesor de la UPV y te gusta que todos los alumnos aprendan.\n', additional_kwargs={}, response_metadata={}), HumanMessage(content=' Explicame que es un agente en tematica de IA y data science', additional_kwargs={}, response_metadata={})]


In [7]:
# Invoke the model with the messages
response = base_model.invoke(messages)

In [8]:
Markdown(response.content)

En el contexto de la inteligencia artificial (IA) y la ciencia de datos, un "agente" se refiere a una entidad que puede percibir su entorno a través de sensores y actuar sobre ese entorno mediante actuadores. Los agentes pueden ser tanto físicos (como robots) como virtuales (como programas de software).

### Características de un Agente:

1. **Percepción**: Un agente tiene la capacidad de recibir información del entorno. Esto puede incluir datos de sensores, entradas de usuario, o información de otras fuentes.

2. **Acción**: Basándose en la información percibida, un agente puede tomar decisiones y realizar acciones. Estas acciones pueden ser la ejecución de comandos, la modificación de datos, o la interacción con otros agentes.

3. **Autonomía**: Muchos agentes operan de manera autónoma, lo que significa que pueden tomar decisiones sin intervención humana. Sin embargo, también pueden ser diseñados para trabajar en colaboración con humanos.

4. **Adaptabilidad**: Algunos agentes son capaces de aprender de su experiencia y adaptarse a cambios en el entorno. Esto se logra a menudo mediante técnicas de aprendizaje automático.

5. **Objetivos**: Los agentes suelen tener objetivos específicos que buscan alcanzar. Estos objetivos pueden ser definidos explícitamente por un programador o pueden ser aprendidos a través de la experiencia.

### Tipos de Agentes:

1. **Agentes Reactivos**: Responden a estímulos del entorno sin un modelo interno del mismo. Su comportamiento es generalmente simple y basado en reglas.

2. **Agentes Basados en Modelos**: Mantienen un modelo interno del entorno que les permite hacer inferencias y tomar decisiones más complejas.

3. **Agentes de Aprendizaje**: Utilizan técnicas de aprendizaje automático para mejorar su rendimiento a lo largo del tiempo, adaptándose a nuevas situaciones y optimizando sus acciones.

4. **Agentes Multiagente**: Sistemas que involucran múltiples agentes que interactúan entre sí, lo que puede dar lugar a comportamientos emergentes y soluciones más complejas.

### Ejemplos de Agentes en IA y Ciencia de Datos:

- **Asistentes Virtuales**: Como Siri o Alexa, que perciben comandos de voz y responden con acciones o información.
- **Sistemas de Recomendación**: Que analizan datos de usuarios para sugerir productos o contenidos.
- **Robots Autónomos**: Que navegan en entornos físicos, como drones o vehículos autónomos.
- **Chatbots**: Que interactúan con usuarios en plataformas de mensajería, respondiendo preguntas y realizando tareas.

En resumen, un agente en IA y ciencia de datos es una entidad que percibe su entorno, toma decisiones y actúa en consecuencia, con el objetivo de lograr metas específicas. Su diseño y funcionalidad pueden variar ampliamente dependiendo de la aplicación y el contexto en el que se utilicen.

### 1.2 - Prompt template

LangChain proporciona formas de manejar los prompts, para ser consistente y con ello poder parsear resultados convenientemente.

In [9]:
template_string = """Traduce el texto entre comillas simples al {target_language}:
'{input_text}'
"""

In [10]:
from langchain.prompts import ChatPromptTemplate
prompt_template = ChatPromptTemplate.from_template(template_string)
prompt_template

ChatPromptTemplate(input_variables=['input_text', 'target_language'], input_types={}, partial_variables={}, messages=[HumanMessagePromptTemplate(prompt=PromptTemplate(input_variables=['input_text', 'target_language'], input_types={}, partial_variables={}, template="Traduce el texto entre comillas simples al {target_language}:\n'{input_text}'\n"), additional_kwargs={})])

In [11]:
prompt_template.messages[0].prompt

PromptTemplate(input_variables=['input_text', 'target_language'], input_types={}, partial_variables={}, template="Traduce el texto entre comillas simples al {target_language}:\n'{input_text}'\n")

In [12]:
prompt_template.messages[0].prompt.input_variables

['input_text', 'target_language']

In [13]:
target_language = "English"
input_text = "Estamos haciendo un workshop en la UPV para aprender sobre agentes y poder desarrollar una app generativa de peleas!"

In [14]:
message = prompt_template.format_messages(input_text=input_text, target_language=target_language)
print(type(message))
message

<class 'list'>


[HumanMessage(content="Traduce el texto entre comillas simples al English:\n'Estamos haciendo un workshop en la UPV para aprender sobre agentes y poder desarrollar una app generativa de peleas!'\n", additional_kwargs={}, response_metadata={})]

In [15]:
message[0]

HumanMessage(content="Traduce el texto entre comillas simples al English:\n'Estamos haciendo un workshop en la UPV para aprender sobre agentes y poder desarrollar una app generativa de peleas!'\n", additional_kwargs={}, response_metadata={})

In [16]:
response = base_model.invoke(message)
print(response)
Markdown(response.content)

content="'We are holding a workshop at UPV to learn about agents and to be able to develop a generative fighting app!'" additional_kwargs={'refusal': None} response_metadata={'token_usage': {'completion_tokens': 26, 'prompt_tokens': 43, 'total_tokens': 69, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_00428b782a', 'finish_reason': 'stop', 'logprobs': None} id='run-d97d21b4-7910-44fe-9710-ee2581573816-0' usage_metadata={'input_tokens': 43, 'output_tokens': 26, 'total_tokens': 69, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}}


'We are holding a workshop at UPV to learn about agents and to be able to develop a generative fighting app!'

### 1.3 - Parsers

Esto nos devuelve una respuesta del tipo _AIMessage_. Pero vamos a ver si lo que queremos es parsearla y que devuelva un JSON.

In [17]:
import copy

prompt_template_json = copy.deepcopy(prompt_template)

In [18]:
prompt_template_json.messages[0].prompt.template = f"{prompt_template.messages[0].prompt.template}. Crea la respuesta en formato JSON, con claves 'idioma_original' y 'traducido'"
prompt_template_json.messages[0].prompt.template

"Traduce el texto entre comillas simples al {target_language}:\n'{input_text}'\n. Crea la respuesta en formato JSON, con claves 'idioma_original' y 'traducido'"

In [19]:
message = prompt_template_json.format_messages(input_text=input_text, target_language=target_language)
response = base_model.invoke(message)
response

AIMessage(content='```json\n{\n  "idioma_original": "\'Estamos haciendo un workshop en la UPV para aprender sobre agentes y poder desarrollar una app generativa de peleas!\'",\n  "traducido": "We are doing a workshop at UPV to learn about agents and to be able to develop a generative fighting app!"\n}\n```', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 69, 'prompt_tokens': 65, 'total_tokens': 134, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_00428b782a', 'finish_reason': 'stop', 'logprobs': None}, id='run-f184a442-b0a1-49db-a463-256dfecfb7bf-0', usage_metadata={'input_tokens': 65, 'output_tokens': 69, 'total_tokens': 134, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'rea

In [20]:
response.content.get("traducido")

AttributeError: 'str' object has no attribute 'get'

No se ha generado un JSON, sino que es un string con un formato similar.

Vamos a ver qué podemos hacer.

In [21]:
from langchain.output_parsers import ResponseSchema, StructuredOutputParser

In [22]:
response_schema = [
    ResponseSchema(name="idioma_original", description="The original text"),
    ResponseSchema(name="traducido", description="The translated text"),
]
response_schema

[ResponseSchema(name='idioma_original', description='The original text', type='string'),
 ResponseSchema(name='traducido', description='The translated text', type='string')]

In [23]:
output_parser = StructuredOutputParser.from_response_schemas(response_schema)
output_parser

StructuredOutputParser(response_schemas=[ResponseSchema(name='idioma_original', description='The original text', type='string'), ResponseSchema(name='traducido', description='The translated text', type='string')])

In [24]:
format_intructions = output_parser.get_format_instructions()
Markdown(format_intructions)

The output should be a markdown code snippet formatted in the following schema, including the leading and trailing "```json" and "```":

```json
{
	"idioma_original": string  // The original text
	"traducido": string  // The translated text
}
```

In [25]:
prompt_template_json_format = """Traduce el texto entre comillas simples al {target_language}:
'{input_text}'.

{format_intructions}
"""
prompt = ChatPromptTemplate.from_template(prompt_template_json_format)
message = prompt.format_messages(input_text=input_text, target_language=target_language, format_intructions=format_intructions)
print(type(message))
message

<class 'list'>


[HumanMessage(content='Traduce el texto entre comillas simples al English:\n\'Estamos haciendo un workshop en la UPV para aprender sobre agentes y poder desarrollar una app generativa de peleas!\'.\n\nThe output should be a markdown code snippet formatted in the following schema, including the leading and trailing "```json" and "```":\n\n```json\n{\n\t"idioma_original": string  // The original text\n\t"traducido": string  // The translated text\n}\n```\n', additional_kwargs={}, response_metadata={})]

In [26]:
response = base_model.invoke(message)
response

AIMessage(content='```json\n{\n\t"idioma_original": "Estamos haciendo un workshop en la UPV para aprender sobre agentes y poder desarrollar una app generativa de peleas!",\n\t"traducido": "We are doing a workshop at UPV to learn about agents and to be able to develop a generative fighting app!"\n}\n```', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 68, 'prompt_tokens': 104, 'total_tokens': 172, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_13eed4fce1', 'finish_reason': 'stop', 'logprobs': None}, id='run-ac5c875e-6a2c-4e7a-b1b0-e03147b5ab08-0', usage_metadata={'input_tokens': 104, 'output_tokens': 68, 'total_tokens': 172, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reaso

In [27]:
output_dict = output_parser.parse(response.content)
output_dict

{'idioma_original': 'Estamos haciendo un workshop en la UPV para aprender sobre agentes y poder desarrollar una app generativa de peleas!',
 'traducido': 'We are doing a workshop at UPV to learn about agents and to be able to develop a generative fighting app!'}

In [28]:
output_dict.get("traducido")

'We are doing a workshop at UPV to learn about agents and to be able to develop a generative fighting app!'

### Extra: Chains -> LangChain Expression Language (LCEL)

Las cadenas eran el elemento básico de LangChain, que nos permiten ejecutar prompts uno detrás de otro (o con la estructura definida).

Hoy en día estan deprecadas. Son interesantes de conocer, pero ahora todo se basa en Runnables, que es lo que utiliza LangGraph. Pasamos directamente a ello.