# Workshop: De cero a Agente con LangChain y Python

En este workshop de 4 horas aprenderás a construir un agente inteligente desde cero utilizando **LangChain**, **Python** y modelos de lenguaje **open source** como **Ollama** o **LM Studio**. A lo largo del taller veremos los conceptos básicos de los LLMs, cómo orquestar herramientas y memorias con LangChain, y cómo integrar un vector store para recuperación aumentada de datos (RAG).

## Agenda del Workshop

1. Introducción a los LLMs y la ejecución local
2. Componentes de LangChain (modelos, chains, herramientas)
3. Definición de herramientas personalizadas
4. Configuración de un modelo local (Ollama / LM Studio)
5. Creación de un agente reactivo con memoria
6. Integración con un vector store para RAG
7. Demostración final y conclusiones


### Instalación y configuración

Para seguir este notebook necesitas instalar varias librerías. Si ya tienes un entorno con `langchain` y `chromadb` puedes omitir esta celda. En una máquina local con acceso a internet se pueden instalar así:

In [None]:
!pip install --upgrade pip
!pip install langchain langchain-community langchain-core chromadb sentence-transformers

### Importación de módulos

Importamos las clases y funciones necesarias para construir el agente. Esto incluye el modelo local (por ejemplo `ChatOllama`), el motor de memoria, las herramientas y funciones auxiliares de LangChain.

In [None]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.tools import Tool, tool
from langchain_community.chat_models import ChatOllama
from langchain.memory import ConversationBufferMemory
from langchain.agents import create_react_agent, AgentExecutor

## 1. Definir herramientas personalizadas

Las **herramientas** permiten que el agente ejecute funciones específicas (por ejemplo cálculos o búsquedas). Definiremos dos funciones sencillas que suman y multiplican números. Utilizamos el decorador `@tool` para convertirlas en herramientas que LangChain pueda invocar.

In [None]:
from langchain_core.tools import tool

@tool
def sumar(a: float, b: float) -> float:
    # Suma dos números y devuelve el resultado
    return a + b

@tool
def multiplicar(a: float, b: float) -> float:
    # Multiplica dos números y devuelve el resultado
    return a * b

# Registrar las herramientas en una lista
herramientas = [sumar, multiplicar]

## 2. Instanciar el modelo local

Antes de crear el agente necesitamos un LLM local en ejecución. Con **Ollama** podemos iniciar un servidor y cargar un modelo como *llama3:8b*:

```bash
# Instala Ollama (solo una vez)
wget -qO- https://ollama.com/install.sh | sh
# Arranca el servidor
ollama serve &
# Descarga y prepara el modelo (puede tardar unos minutos)
ollama pull llama3:8b
```

En **LM Studio** puedes descargar modelos desde la interfaz gráfica y exponer un endpoint local. Una vez en marcha, LangChain se conecta mediante la clase `ChatOllama` indicando el nombre del modelo.

In [None]:
# Configuramos el modelo local (asegúrate de que el servidor de Ollama esté ejecutándose)
# Si utilizas LM Studio, cambia el nombre del modelo o ajusta el endpoint.
llm = ChatOllama(model="llama3:8b", base_url="http://localhost:11434")

# También puedes ajustar parámetros como temperatura, top_p, etc.
# llm = ChatOllama(model="llama3:8b", temperature=0.5)

## 3. Crear memoria y construir el agente

La memoria mantiene el historial de conversación. Usaremos `ConversationBufferMemory` para recordar los mensajes pasados. Luego construiremos un **agente reactivo** con `create_react_agent`, pasando el modelo, la lista de herramientas y la memoria.

In [None]:
# Crear una memoria de conversación
memoria = ConversationBufferMemory(memory_key="chat_history", return_messages=True)

# Crear el prompt que usará el agente
prompt = ChatPromptTemplate.from_messages([
    ("system", "Eres un asistente útil que puede usar herramientas para completar tareas."),
    ("human", "{input}"),
    ("agent", "{agent_scratchpad}"),
])

# Crear el agente reactivo (ReAct)
agente = create_react_agent(llm, herramientas, prompt)

# Ejecutar el agente dentro de un executor para gestionar el estado y la memoria
executor = AgentExecutor(agent=agente, tools=herramientas, memory=memoria, verbose=True)

## 4. Ejecutar el agente

Ya podemos hacer consultas al agente. El agente decidirá si necesita llamar a alguna herramienta para calcular o buscar información.

In [None]:
# Ejemplo de consulta: combinación de cálculo
pregunta = {"messages": [{"role": "user", "content": "¿Cuánto es 5*7 y 3*8?"}]}
# Para probar el agente descomenta las líneas siguientes cuando tengas el modelo local ejecutándose:
# respuesta = executor.invoke(pregunta)
# print(respuesta)

## 5. Integrar un vector store para Recuperación Aumentada (RAG)

Para responder preguntas sobre tus propios documentos, podemos crear una herramienta de recuperación de texto basada en embeddings. Utilizaremos **Chroma** como vector store y **HuggingFaceEmbeddings** como modelo de embedding.

Primero cargamos algunos textos de ejemplo y construimos el vector store. Luego exponemos una herramienta `search_docs` que busca los documentos más relevantes y devuelve su contenido.

In [None]:
# from langchain_community.vectorstores import Chroma
# from langchain_community.embeddings import HuggingFaceEmbeddings
#
# textos = [
#     "Colombia es un país situado en América del Sur cuya capital es Bogotá.",
#     "La multiplicación es una operación matemática que suma un número consigo mismo muchas veces.",
# ]
# embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
# store = Chroma.from_texts(textos, embeddings)
# retriever = store.as_retriever()
#
# @tool
# def search_docs(query: str) -> str:
#     # Busca documentos relevantes y devuelve el texto más parecido
#     docs = retriever.get_relevant_documents(query)
#     return docs[0].page_content
#
# # Añadimos esta herramienta a la lista de herramientas del agente
# herramientas.append(search_docs)

## 6. Demostración final

Después de añadir la herramienta de recuperación, el agente puede combinar cálculo y búsqueda de datos. Por ejemplo:

```python
pregunta = {"messages": [{"role": "user", "content": "¿Cuál es la capital de Colombia y cuánto es 9×7?"}]}
# respuesta = executor.invoke(pregunta)
# print(respuesta)
```

El agente consultará la herramienta de búsqueda para obtener la capital (Bogotá) y la herramienta de multiplicación para calcular 9×7, devolviendo una respuesta completa.

## 7. Conclusiones y próximos pasos

En este notebook has visto cómo:

- Instalar y configurar las dependencias necesarias para ejecutar modelos locales.
- Definir herramientas personalizadas con el decorador `@tool`.
- Inicializar un modelo local utilizando **Ollama** o **LM Studio**.
- Construir un agente reactivo con memoria y herramientas en LangChain.
- Integrar un vector store para realizar búsquedas en tus documentos (RAG).

**Próximos pasos:** explora otros modelos open source (Mistral, Mixtral), añade nuevas herramientas (APIs, bases de datos) y optimiza el flujo de tu agente con LangGraph.