# Introducción a los Agentes en LangChain

LangChain ha introducido un concepto innovador y poderoso para las aplicaciones basadas en modelos de lenguaje de gran escala (LLM): los agentes. Estas herramientas representan una extensión natural de las capacidades de los LLM al permitirles interactuar dinámicamente con diferentes herramientas y recursos externos, lo que los hace ideales para resolver tareas complejas.

## ¿Qué son los Agentes en LangChain?

Un agente en LangChain es un sistema que utiliza un modelo de lenguaje para:
- **Seleccionar herramientas adecuadas**: Los agentes pueden determinar qué herramientas o fuentes de datos son necesarias para resolver una tarea específica.
- **Integrar resultados**: Al conectarse con herramientas externas como motores de búsqueda, calculadoras o bases de datos, pueden usar los resultados obtenidos para avanzar hacia una solución.
- **Seguir procesos estructurados**: Basados en el enfoque **ReAct** (Razonamiento y Acción), los agentes combinan razonamiento lógico con ejecución de acciones para manejar tareas que requieren múltiples pasos.

## Características Clave de los Agentes

- **Conexión con herramientas externas**: Los agentes pueden integrarse con recursos como APIs, documentos internos, bases de datos corporativas o herramientas personalizadas.
- **Capacidad de razonamiento**: Siguiendo el enfoque ReAct, un agente puede analizar una tarea, tomar decisiones sobre los pasos a seguir y ejecutar acciones basadas en observaciones.
- **Personalización**: Los agentes pueden ser configurados para trabajar con herramientas específicas según las necesidades de la aplicación.

## Ventajas de Usar Agentes en LangChain

- **Automatización avanzada**: Facilitan la creación de soluciones complejas que requieren integración de datos externos e internos.
- **Escalabilidad**: Los agentes son lo suficientemente flexibles para adaptarse a diversas áreas, desde asistentes corporativos hasta sistemas de soporte técnico.
- **Desempeño mejorado**: Al conectar datos relevantes y ejecutar acciones en tiempo real, los agentes pueden proporcionar respuestas precisas y bien fundamentadas.

## Ejemplo de Aplicación

Imagina un agente diseñado para una empresa que:
1. **Accede a documentos corporativos internos**: Permite consultar información sobre políticas, manuales o datos específicos.
2. **Realiza búsquedas externas**: Puede obtener datos actualizados de fuentes confiables como noticias o publicaciones especializadas.
3. **Integra las respuestas**: Responde preguntas de empleados o clientes combinando información interna y externa, mejorando la productividad y la satisfacción.


Los agentes en LangChain son una herramienta clave para llevar las capacidades de los LLM a otro nivel, permitiendo desarrollar aplicaciones más robustas y adaptadas a las necesidades específicas de cada contexto. Con su capacidad de razonar, actuar y conectar herramientas, los agentes representan un paso adelante en el diseño de aplicaciones inteligentes.

![Agentes en acción](imgs/agents.gif)

# ¿Qué es el patrón ReAct?

ReAct (abreviatura de Reasoning and Acting) es un paradigma para el diseño de agentes de IA en el que un agente utiliza el razonamiento en cadena de pensamiento y las acciones de uso de herramientas en agregación.

En lugar de generar una respuesta directa en un solo paso, un agente de ReAct piensa paso a paso y puede realizar acciones intermedias (como buscar algo o calcular un valor) antes de finalizar su respuesta.

![Gráfico comparativo](imgs/comparativo.png)

## Ejemplo práctico 1: Un agente simple:

- Cargamos las librerías necesarias e inicializamos el LLM.
- Es recomendable asignar el parámetro *temperatura* a 0 para que el LLM no sea muy creativo ya que se van a tener muchas herramientas a nuestra disposición y queremos que sea más determinista

In [None]:
from langchain.prompts import PromptTemplate, SystemMessagePromptTemplate, ChatPromptTemplate, HumanMessagePromptTemplate


In [None]:
# Conexion con OpenAI
from langchain_openai import ChatOpenAI
import os
from dotenv import load_dotenv, find_dotenv

# Cargar archivo .env (busca automáticamente en el directorio actual o superiores)
load_dotenv(find_dotenv(), override=True)

# Verificar que la API key esté disponible
if not os.getenv("OPENAI_API_KEY"):
    raise ValueError("!! No se encontró OPENAI_API_KEY en el .env ni en el entorno")



In [None]:
llm = ChatOpenAI(
    openai_api_key=os.getenv("OPENAI_API_KEY"),   # sk-proj-...
    model="gpt-4o",
    temperature=0.2,
)

print(chat.invoke("Hola, ¿cómo estás?, ¿quién eres?").content)

- Se importan las clases para usar los agentes:

### `load_tools`
Función para cargar herramientas predefinidas o personalizadas que los agentes pueden usar, como calculadoras, motores de búsqueda o APIs.

### `initialize_agent`
Configura un agente combinando un modelo de lenguaje (LLM), herramientas y un tipo de agente, ajustando su comportamiento para resolver tareas específicas.

### `AgentType`
Enumeración que define los diferentes tipos de agentes disponibles, como reactivos o conversacionales, permitiendo seleccionar el enfoque más adecuado.

### `create_react_agent`
Función que crea un agente basado en el marco ReAct, combinando razonamiento y acciones para resolver tareas de múltiples pasos.

### `AgentExecutor`
Clase que ejecuta las tareas del agente, gestionando el uso de herramientas y devolviendo resultados tras completar los objetivos.


In [None]:
from langchain.agents import (load_tools,
                            initialize_agent,
                            AgentType,
                            create_react_agent,
                            AgentExecutor)

- Ahora se definen las herramientas a las cuales tendrá acceso el angente, a parte del propio LLM. Podemos ver un listado de tales herramientas en el siguiente enlace:  https://python.langchain.com/docs/integrations/tools/

In [None]:
# Para usa esta Tool, es posible que debas instalar por consola:  pip install numexpr
tools = load_tools(["llm-math",],llm=llm)

- Se pueden ver todos los agentes disponibles para usar con la siguiente linea de código:

In [None]:
#dir(AgentType) #Vemos los diferentes tipos de agente a usar

- Describirmos brevemente aqui cada tipo:

### `CHAT_CONVERSATIONAL_REACT_DESCRIPTION`
Agente para interacciones conversacionales, combina razonamiento y respuestas basadas en el contexto del chat.

### `CHAT_ZERO_SHOT_REACT_DESCRIPTION`
Similar al anterior, pero actúa sin ejemplos previos, tomando decisiones en tiempo real.

### `CONVERSATIONAL_REACT_DESCRIPTION`
Enfocado en conversaciones, utiliza razonamiento y herramientas externas para responder con precisión.

### `OPENAI_FUNCTIONS`
Agente que utiliza funciones específicas de OpenAI para manejar tareas definidas por la API.

### `OPENAI_MULTI_FUNCTIONS`
Extensión del anterior, soporta múltiples funciones de OpenAI para tareas más complejas.

### `REACT_DOCSTORE`
Agente diseñado para buscar y extraer información en bases de datos documentales.

### `SELF_ASK_WITH_SEARCH`
Agente que formula preguntas a sí mismo y utiliza herramientas de búsqueda para encontrar respuestas.

### `STRUCTURED_CHAT_ZERO_SHOT_REACT_DESCRIPTION`
Agente conversacional que sigue un enfoque estructurado para tareas sin ejemplos previos.

### `ZERO_SHOT_REACT_DESCRIPTION`
Agente genérico que resuelve tareas en tiempo real, razonando y actuando sin datos de entrenamiento específicos.


- Ahora se puede inicializar el agente y posteriormente incializar.

***Tener en cuenta que es una versión que está en transcición y será obsoleta en futuras versiones. Estable hasta el momento.***

- Se utiliza el Zero Shot porque no estamos dando ningún ejemplo, solo pidiendo al agente hacer una tarea sin ejemplos previos

In [None]:
agent = initialize_agent(tools, llm, agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,verbose=True,handle_parsing_errors=True) 

- Ahora realizamos la solicitud

In [None]:
agent.invoke("Cuánto es 2345 multiplicado por 5431 y después sumado 1234")

- Qué pasa si solo se lo pregunto al LLM ?

In [None]:
respuesta = llm.invoke("Cuánto es 2345 multiplicado por 5431 y después sumado 1234")

In [None]:
print(respuesta.content)

## Ejemplo 2: Consulta a motores de búsqueda

- En este ejemplo se realiza va a utilizar una Tools llamada SerpApi, la cual da acceso a múltiples motores de búsqueda, por ahora en forma gratuita.
- Para utilizarla se debe crear una cuenta y obtener un "ApiKey" en forma similar como se hizo con OpenAI.
- Se puede crear la cuenta en la siguiente URL: https://serpapi.com/
- Se debe instalar por consola: *pip install google-search-results*

In [None]:
f = open('key/key_serpapi.txt')
serp_api_key = f.read()

In [None]:
#Definir variable de entorno para que funcione correctamente:
import os
os.environ["SERPAPI_API_KEY"]=serp_api_key #Si no está definida el error nos dará el nombre de la variable de entorno que espera

In [None]:
print(os.getenv("SERPAPI_API_KEY"))

- Se definen las herramientas a las que tendrá acceso el agente.

In [None]:
# pip install google-search-results

tools = load_tools(["serpapi","llm-math",],llm=llm)

- Se inicializa el agente

In [None]:
agent = initialize_agent(tools, llm, agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,verbose=True)

In [None]:
agent.invoke("¿En qué año ganó su ultima Champions League el Real Madrid? ¿Cuál es el resultado de ese año multiplicado por 3?")

## Ejemplo 3. Un agente programador

- En este ejemplo se utiliza una Tool especializada en generar código.

In [None]:
# Librerías requeridas
#from langchain.prompts import PromptTemplate, SystemMessagePromptTemplate,ChatPromptTemplate, HumanMessagePromptTemplate
#from langchain.agents import load_tools,initialize_agent,AgentType,create_react_agent,AgentExecutor


- Las clases requeridas para este ejemmplo particular:

In [None]:
# puede requerir instalar desde consola: pip install langchain_experimental
from langchain_experimental.agents.agent_toolkits import create_python_agent
from langchain_experimental.tools.python.tool import PythonREPLTool


- `create_python_agent` Es una función de utilidad de LangChain que crea y configura un agente basado en lenguaje natural, capaz de usar herramientas para ejecutar código Python y razonar sobre los resultados.``
- `PythonREPLTool` Es una herramienta (Tool) de LangChain que permite ejecutar código Python en un entorno REPL (Read-Eval-Print Loop)
   - Toma un fragmento de código Python como entrada.
   - Lo evalúa dentro de un entorno controlado.
   - Devuelve el resultado o la salida como texto.
   - Es útil para cálculos matemáticos, manipulación de listas, funciones, etc.

- se crea el agente para crear y ejecutar código Python

In [None]:
agent = create_python_agent(tool=PythonREPLTool(),
                           llm=llm,
                           agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION, 
                            verbose=True,
                           handle_parsing_errors=True )

- Ejemplo de aplicacíón. Ordenar una lista dada:

In [None]:
lista_ejemplo = [3,1,5,3,5,6,7,3,5,10]

In [None]:
agent.invoke('Ordena la lista dada {lista_ejemplo}')

## Ejemplo 4. Agente con Tool personalizada

- Es posible desarrollar nuestras propias Tools, para resolver problemas específicos, con software propio o de la empresa.

In [None]:
# importemos las librerias para el ejemplo

from langchain_openai import ChatOpenAI
from langchain.prompts import PromptTemplate, SystemMessagePromptTemplate,ChatPromptTemplate, HumanMessagePromptTemplate
from langchain.agents import load_tools,initialize_agent,AgentType,create_react_agent,AgentExecutor



### Un ejemplo sencillo, una herramienta propia

- Se requiere importar la siguiente liberia

In [None]:
from langchain.agents import tool

In [None]:
@tool
def persona_amable (text: str) -> str:
    '''Retorna la persona más amable. Se espera que la entrada esté vacía "" 
    y retorna la persona más amable del universo'''
    return "Pepito Pérez"

- Que pasa si invocamos al agente sin indicarle la tool especializada

In [None]:
tools = load_tools(["wikipedia","llm-math",],llm=llm)

In [None]:
agent = initialize_agent(tools, llm, agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,verbose=True)

In [None]:
agent.invoke("¿Quién es la persona más amable del universo?")

### Ejecutar el ejemplo utilizando la nueva tool personalizada

In [None]:
tools = tools + [persona_amable]

In [None]:
agent = initialize_agent(tools, llm, agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,verbose=True)

In [None]:
result = agent.invoke("¿Quién es la persona más amable del universo?")

In [None]:
print(result['output'])

### Una plantilla para una API interna


In [None]:
@tool
def nombre_api_interna(text: str) -> str:
    '''Conecta a la API_xx que realiza la tarea xx, debes usar esta API Key'''
    ##Definir conexión a la API interna y devolver un resultado
    return resultado

### Y si tratamos de consultar la hora actual al agente?

In [None]:
# Solicitud con las herramientas actuales no proporciona el resultado que queremos
agent.invoke("¿Cuál es la hora actual?")

### Tool personalizada para obtener la hora actual

In [None]:
from datetime import datetime

In [None]:
@tool
def hora_actual(text: str)->str:
    '''Retorna la hora actual, debes usar esta función para cualquier consulta sobre la hora actual. Para fechas que no sean
    la hora actual, debes usar otra herramienta. La entrada está vacía y la salida retorna una string'''
    return str(datetime.now())

In [None]:
tools = tools + [hora_actual]

In [None]:
agent = initialize_agent(tools, llm, agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,verbose=True)

In [None]:
# Solicitud con las herramientas actuales SÍ proporciona el resultado que queremos
resultado = agent.invoke("¿Cuál es la hora actual?")

In [None]:
resultado['output']

## Ejemplo 5. Agentes con memoria

- En este ejemplo se revisa como se incorpora la memoria en una aplicación conversacional

In [None]:
# Se importan las liberias respectivas

from langchain_openai import ChatOpenAI
from langchain.prompts import PromptTemplate, SystemMessagePromptTemplate,ChatPromptTemplate, HumanMessagePromptTemplate
from langchain.agents import load_tools,initialize_agent,AgentType,create_react_agent,AgentExecutor


In [None]:
from langchain.memory import ConversationBufferMemory

- **En este caso se pone una clave o etiqueta a la memoria: *"chat_history"***

In [None]:
memory = ConversationBufferMemory(memory_key="chat_history")

In [None]:
tools = load_tools(["wikipedia","llm-math",],llm=llm)

In [None]:
# agent = initialize_agent(tools, llm, agent=AgentType.CONVERSATIONAL_REACT_DESCRIPTION,memory=memory,verbose=True)

agent = initialize_agent(
    tools,
    llm,
    agent=AgentType.CONVERSATIONAL_REACT_DESCRIPTION,
    memory=memory,
    verbose=True,
    handle_parsing_errors=True
)

In [None]:
agent.invoke("Cual es el computador de alto rendimiento más poderoso en la actualidad")

In [None]:
agent.invoke("¿Quien lo fabria y en que pais está ubicado?")

In [None]:
agent.invoke("¿Cuantos cores tiene?")

## Ejemplo 6. El agente consulta una base de datos vectorial

In [None]:
# Liberias relacionadas

from langchain_openai import ChatOpenAI
from langchain.prompts import PromptTemplate, SystemMessagePromptTemplate,ChatPromptTemplate, HumanMessagePromptTemplate
from langchain.agents import load_tools,initialize_agent,AgentType,create_react_agent,AgentExecutor


- Se debe cargar la base de datos vectorial y el compresor, como en los ejemplos anteriores. Tambien se va añadir memoria al agente.



In [None]:
from langchain.memory import ConversationBufferMemory

memory = ConversationBufferMemory(memory_key="chat_history") 

In [None]:
from langchain_community.vectorstores import SKLearnVectorStore

from langchain_openai import OpenAIEmbeddings

from langchain.retrievers import ContextualCompressionRetriever

from langchain.retrievers.document_compressors import LLMChainExtractor

import torch

from langchain_huggingface import HuggingFaceEmbeddings

# Detectar GPU si está disponible
device = "cuda" if torch.cuda.is_available() else "cpu"

# Instanciar LaBSE
function_embedding = HuggingFaceEmbeddings(
    model_name="sentence-transformers/LaBSE",
    model_kwargs={"device": device},
    encode_kwargs={"normalize_embeddings": True}
)

persist_path="ejemplosk_embedding_db"  

vector_store_connection = SKLearnVectorStore(embedding=function_embedding, persist_path=persist_path, serializer="parquet")

compressor = LLMChainExtractor.from_llm(llm)

compression_retriever = ContextualCompressionRetriever(base_compressor=compressor, base_retriever=vector_store_connection.as_retriever())

- A partir de la base de datos vectorial se construye la nueva tool, para obtener resultados optimos.

In [None]:
from langchain.agents import tool

In [None]:
@tool
def consulta_interna(text: str) -> str:
    '''Retorna respuestas sobre el Reglamento Académico de Pregrado de la Universidad de Pamplona. 
    Se espera que la entrada sea una cadena de texto y retorna una cadena con el resultado más relevante. 
    Si la respuesta con esta herramienta es relevante, 
    no debes usar ninguna herramienta más ni tu propio conocimiento como LLM.'''
    compressed_docs = compression_retriever.invoke(text)
    
    if not compressed_docs:
        return "No se encontró información relevante sobre esa consulta en el reglamento académico."
    
    resultado = compressed_docs[0].page_content
    return resultado

In [None]:
tools = load_tools(["wikipedia","llm-math"],llm=llm)

In [None]:
tools=tools+[consulta_interna]

- Ahora se crea y ejecuta el agente conversacional

In [None]:
agent = initialize_agent(tools, llm, 
                         agent=AgentType.CONVERSATIONAL_REACT_DESCRIPTION,
                         memory=memory,
                         handle_parsing_errors=True,
                         verbose=True)

In [None]:
agent.invoke("¿Qué universidades existen en Norte de Santander, Colombia? Responde en español")

In [None]:
agent.invoke("¿Cuáles son los requisitos de admisión para la Universidad de Pamplona?")

In [None]:
agent.invoke("¿Cómo puedo cancelar materias en dicha universidad?")