# Workshop: De cero a Agente con LangChain y Python

En este workshop de 4 horas aprenderás a construir un agente inteligente desde cero utilizando **LangChain**, **Python** y modelos de lenguaje **open source** como **Ollama** o **LM Studio**. A lo largo del taller veremos los conceptos básicos de los LLMs, cómo orquestar herramientas y memorias con LangChain, y cómo integrar un vector store para recuperación aumentada de datos (RAG).

## Agenda del Workshop

1. Introducción a los LLMs y la ejecución local
2. Componentes de LangChain (modelos, chains, herramientas)
3. Definición de herramientas personalizadas
4. Configuración de un modelo local (Ollama / LM Studio)
5. Creación de un agente reactivo con memoria
6. Integración con un vector store para RAG
7. Demostración final y conclusiones


## Conexión directa a un LLM sin LangChain

Antes de introducir LangChain, veamos cómo podríamos interactuar con un modelo de lenguaje utilizando únicamente el SDK o la API que proporciona el modelo. Por ejemplo, un servidor de Ollama expone un endpoint HTTP `http://localhost:11434/api/generate` donde puedes enviar un prompt y recibir la respuesta del modelo en formato JSON. De forma análoga, otros proveedores (como OpenAI) ofrecen SDKs o endpoints REST para invocar sus modelos.

Interactuar de forma directa es útil para pruebas sencillas, pero pronto verás que gestionar memoria de conversación, combinar varios modelos, reintentar peticiones o integrar fuentes de datos externas se vuelve complejo. Aquí es donde entra LangChain.

# Ollama 

In [1]:
# Ejemplo de llamada directa a un modelo local de Ollama
import requests

# Definimos el payload de la solicitud
data = {
    "model": "deepseek-r1:1.5b",
    "prompt": "Que es langchain?",
    "stream": False
}

# Realizamos la petición POST al endpoint de Ollama
# (Nota: esta llamada sólo funcionará si tienes ollama corriendo de forma local)
response = requests.post("http://localhost:11434/api/generate", json=data)
print(response.json()["response"])


<think>

</think>

Un **LangChain** es un sistema que combina el poder del lenguaje y el poder del computado para permitir la generación automática de código. Diferente entre diferentes tamaños, se puede pensar en:

1. **Lenguaje:** Es lo que es native al lenguaje de una language chain (llamado lenguaje base), como Java, Python, C# o JavaScript.
2. **Computo:** Es lo que es native del compute, como un red hBACKslash, el servidor, la server y el red h front. 

En resumen, un langchain da el poder al lenguaje para que se use como una interfaz para el computador, permitiendo que el computador genere código automáticamente en la forma de la lenguaje base que es más sutil e intuitiva.

¿Qué te parece ser el mejor langchain para tu needs?


# OpenRouterAI

In [2]:
!pip install openai



In [4]:
from openai import OpenAI

client = OpenAI(
  base_url="https://openrouter.ai/api/v1",
  api_key="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",
)
completion = client.chat.completions.create(
  extra_headers={
    "HTTP-Referer": "MI PAGINA o APP", 
    "X-Title": "ANDY CODE",
  },
  model="deepseek/deepseek-r1-0528:free",
  messages=[
    {
      "role": "user",
      "content": "Que es langchain?"
    }
  ]
)
print(completion.choices[0].message.content)

**LangChain** es un *framework de código abierto* diseñado para facilitar el desarrollo de aplicaciones basadas en **modelos de lenguaje** (como GPT de OpenAI, Llama 2, etc.). Su objetivo principal es conectar estos modelos con fuentes externas de datos y permitir su integración en "cadenas" de acciones complejas para aplicaciones más robustas.  

### Características clave:
1. **Modelos (Models)**:  
   - Soporta múltiples modelos de lenguaje (GPT, Hugging Face, etc.) y embeddings.

2. **Componentes modulares**:  
   - **Prompts**: Administra plantillas de texto para interactuar con los modelos.  
   - **Memoria**: Guarda el contexto de conversaciones (útil para chatbots).  
   - **Agentes**: Modelos que toman decisiones para ejecutar herramientas (búsquedas web, cálculos, APIs).  
   - **Retrieval**: Conecta con bases de datos o documentos (PDFs, web) para respuestas basadas en datos reales.  

3. **Cadenas (Chains)**:  
   - Combina múltiples pasos (ej: "consultar un modelo → procesa

# Google SDK

In [5]:
!pip install -q -U google-genai

In [8]:
from google import genai

# The client gets the API key from the environment variable `GEMINI_API_KEY`.
client = genai.Client(api_key="AIzaSyDKPdCv74mFw9TsjWnqjWLTazlBSIncocs")

response = client.models.generate_content(
    model="gemini-2.5-flash", contents= "Que es langchain?"
)
print(response.text)

LangChain es un **framework de código abierto** que simplifica la creación de aplicaciones impulsadas por **Grandes Modelos de Lenguaje (LLMs)**. En esencia, actúa como un puente entre los poderosos LLMs (como GPT-4, Llama 2, Claude, etc.) y tus propias fuentes de datos o herramientas externas, permitiéndote construir aplicaciones mucho más sofisticadas y personalizadas.

Imagina que un LLM es un cerebro increíblemente inteligente, pero que por sí solo tiene limitaciones:
1.  **Conocimiento Limitado:** Su conocimiento se detiene en la fecha de su último entrenamiento y no tiene acceso a información en tiempo real o privada.
2.  **Incapacidad para Actuar:** No puede buscar en internet, interactuar con APIs, bases de datos o ejecutar código.
3.  **Procesos de Múltiples Pasos:** Aunque puede razonar, a menudo necesita descomponer tareas complejas en varios pasos y tomar decisiones en cada uno.

**LangChain aborda estas limitaciones** al proporcionar un conjunto de herramientas y component


## ¿Por qué utilizar LangChain?

Aunque podrías interactuar directamente con un modelo de lenguaje usando el SDK que ofrece cada proveedor (por ejemplo la API de **OpenAI**, el servidor local de **Ollama** o el endpoint de **LM Studio**), **LangChain** proporciona una capa de abstracción y orquestación muy útil cuando necesitas construir agentes más sofisticados:

- **Unifica interfaces**: te permite cambiar entre distintos LLMs (open source o propietarios) sin modificar el resto de tu código, porque expone una API común para modelos de chat, embeddings y vector stores.
- **Encadena tareas**: facilita construir *chains* donde la salida de una llamada se usa como entrada de otra, incluyendo flujos de preguntas y respuestas, análisis de datos o ejecución de herramientas externas.
- **Gestión de memoria**: ofrece componentes para almacenar el historial de conversaciones y recuperarlo, algo esencial para agentes conversacionales.
- **Integración de herramientas**: permite exponer funciones personalizadas (cálculos, búsquedas, consultas API, etc.) como herramientas que el modelo puede invocar cuando es necesario.
- **Recuperación aumentada (RAG)**: se integra con motores de vector y sistemas de embeddings para buscar documentos relevantes y combinarlos con la generación del LLM.

En resumen, LangChain actúa como el pegamento que conecta los diferentes bloques (modelos, herramientas, bases de datos) y te permite centrarte en la lógica de tu agente en lugar de los detalles de cada SDK.
    

### Instalación y configuración

Para seguir este notebook necesitas instalar varias librerías. Si ya tienes un entorno con `langchain` y `chromadb` puedes omitir esta celda. En una máquina local con acceso a internet se pueden instalar así:

In [None]:
!pip install --upgrade pip
!pip install langchain langchain-community langchain-core chromadb sentence-transformers

### Importación de módulos

Importamos las clases y funciones necesarias para construir el agente. Esto incluye el modelo local (por ejemplo `ChatOllama`), el motor de memoria, las herramientas y funciones auxiliares de LangChain.

In [None]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.tools import Tool, tool
from langchain_community.chat_models import ChatOllama
from langchain.memory import ConversationBufferMemory
from langchain.agents import create_react_agent, AgentExecutor

## Cadenas en LangChain

Una **cadena** combina uno o más componentes (prompts, modelos, transformaciones) para construir un flujo de ejecución. LangChain incluye utilidades como `LLMChain` para encapsular un prompt y un modelo. Aquí tienes un ejemplo de cadena simple que genera una respuesta a partir de un template:

In [None]:
# Ejemplo de cadena simple
from langchain_core.prompts import ChatPromptTemplate
from langchain_community.chat_models import ChatOllama
from langchain.chains import LLMChain

# Definimos un prompt
prompt = ChatPromptTemplate.from_template("Dime un dato curioso sobre {tema}.")

# Instanciamos el modelo local (suponiendo que esté en marcha)
llm_local = ChatOllama(model="llama3:8b", base_url="http://localhost:11434")

# Creamos la cadena
cadena = LLMChain(llm=llm_local, prompt=prompt)

# Para ejecutarla proporcionaríamos las variables del template:
# resultado = cadena.invoke({"tema": "Colombia"})
# print(resultado)
# Nota: descomenta estas líneas para ejecutar con un modelo local en marcha.

## Memoria en LangChain

Los agentes conversacionales necesitan recordar lo que ya se ha dicho. LangChain ofrece varias implementaciones de memoria, como `ConversationBufferMemory`, que almacena el historial de mensajes en orden. Puedes combinarla con un LLMChain o un agente para que el modelo reciba contexto en cada llamada.

In [None]:
# Uso de ConversationBufferMemory con un LLMChain
from langchain.memory import ConversationBufferMemory
from langchain.chains import LLMChain

# Creamos la memoria
memoria_chain = ConversationBufferMemory(memory_key="chat_history", return_messages=True)

# Definimos el prompt
prompt_memoria = ChatPromptTemplate.from_messages([
    ("system", "Eres un asistente amistoso."),
    ("human", "{input}"),
    ("ai", "{chat_history}"),
])

# Creamos la cadena con memoria
cadena_memoria = LLMChain(llm=llm_local, prompt=prompt_memoria, memory=memoria_chain)

# Para usarla, invoca la cadena varias veces; la memoria conservará el historial:
# respuesta1 = cadena_memoria.invoke({"input": "Hola"})
# respuesta2 = cadena_memoria.invoke({"input": "¿Qué me dijiste antes?"})
# print(respuesta2)


## Plantillas de Prompt (Prompt Templates)

LangChain facilita la construcción de prompts complejos mediante plantillas parametrizadas. Puedes combinar mensajes de sistema, de usuario y del asistente para definir el comportamiento del modelo.

In [None]:
# Ejemplo de plantilla de prompt
from langchain_core.prompts import ChatPromptTemplate

plantilla = ChatPromptTemplate.from_messages([
    ("system", "Eres un experto en matemáticas."),
    ("human", "Pregunta: {pregunta}"),
])

# Instanciaríamos el modelo y llamaríamos:
# llm_local = ChatOllama(model="llama3:8b", base_url="http://localhost:11434")
# chain = LLMChain(llm=llm_local, prompt=plantilla)
# respuesta = chain.invoke({"pregunta": "¿Cuánto es 12×8?"})
# print(respuesta)


## 1. Definir herramientas personalizadas

Las **herramientas** permiten que el agente ejecute funciones específicas (por ejemplo cálculos o búsquedas). Definiremos dos funciones sencillas que suman y multiplican números. Utilizamos el decorador `@tool` para convertirlas en herramientas que LangChain pueda invocar.

In [None]:
from langchain_core.tools import tool

@tool
def sumar(a: float, b: float) -> float:
    # Suma dos números y devuelve el resultado
    return a + b

@tool
def multiplicar(a: float, b: float) -> float:
    # Multiplica dos números y devuelve el resultado
    return a * b

# Registrar las herramientas en una lista
herramientas = [sumar, multiplicar]

## 2. Instanciar el modelo local

Antes de crear el agente necesitamos un LLM local en ejecución. Con **Ollama** podemos iniciar un servidor y cargar un modelo como *llama3:8b*:

```bash
# Instala Ollama (solo una vez)
wget -qO- https://ollama.com/install.sh | sh
# Arranca el servidor
ollama serve &
# Descarga y prepara el modelo (puede tardar unos minutos)
ollama pull llama3:8b
```

En **LM Studio** puedes descargar modelos desde la interfaz gráfica y exponer un endpoint local. Una vez en marcha, LangChain se conecta mediante la clase `ChatOllama` indicando el nombre del modelo.

In [None]:
# Configuramos el modelo local (asegúrate de que el servidor de Ollama esté ejecutándose)
# Si utilizas LM Studio, cambia el nombre del modelo o ajusta el endpoint.
llm = ChatOllama(model="llama3:8b", base_url="http://localhost:11434")

# También puedes ajustar parámetros como temperatura, top_p, etc.
# llm = ChatOllama(model="llama3:8b", temperature=0.5)

## 3. Crear memoria y construir el agente

La memoria mantiene el historial de conversación. Usaremos `ConversationBufferMemory` para recordar los mensajes pasados. Luego construiremos un **agente reactivo** con `create_react_agent`, pasando el modelo, la lista de herramientas y la memoria.

In [None]:
# Crear una memoria de conversación
memoria = ConversationBufferMemory(memory_key="chat_history", return_messages=True)

# Crear el prompt que usará el agente
prompt = ChatPromptTemplate.from_messages([
    ("system", "Eres un asistente útil que puede usar herramientas para completar tareas."),
    ("human", "{input}"),
    ("agent", "{agent_scratchpad}"),
])

# Crear el agente reactivo (ReAct)
agente = create_react_agent(llm, herramientas, prompt)

# Ejecutar el agente dentro de un executor para gestionar el estado y la memoria
executor = AgentExecutor(agent=agente, tools=herramientas, memory=memoria, verbose=True)

## 4. Ejecutar el agente

Ya podemos hacer consultas al agente. El agente decidirá si necesita llamar a alguna herramienta para calcular o buscar información.

In [None]:
# Ejemplo de consulta: combinación de cálculo
pregunta = {"messages": [{"role": "user", "content": "¿Cuánto es 5*7 y 3*8?"}]}
# Para probar el agente descomenta las líneas siguientes cuando tengas el modelo local ejecutándose:
respuesta = executor.invoke(pregunta)
print(respuesta)

## 5. Ejemplo de agente calculadora

Construiremos un agente que sólo utiliza herramientas aritméticas para resolver preguntas de cálculo. El agente decidirá si debe llamar a la función de suma o multiplicación en función de la consulta.

In [None]:
# Definimos nuevamente nuestras herramientas aritméticas
from langchain_core.tools import tool
from langchain.memory import ConversationBufferMemory
from langchain.agents import create_react_agent, AgentExecutor

@tool
def sumar(a: float, b: float) -> float:
    return a + b

@tool
def multiplicar(a: float, b: float) -> float:
    return a * b

# Lista de herramientas
calculadora_tools = [sumar, multiplicar]

# Instanciamos un modelo local (por ejemplo, llama3)
llm_calc = ChatOllama(model="llama3:8b", base_url="http://localhost:11434")

# Memoria para el agente
mem_calc = ConversationBufferMemory(memory_key="chat_history", return_messages=True)

# Prompt base
prompt_calc = ChatPromptTemplate.from_messages([
    ("system", "Eres una calculadora que puede usar herramientas para sumar y multiplicar."),
    ("human", "{input}"),
    ("agent", "{agent_scratchpad}"),
])

# Crear agente y executor
agente_calc = create_react_agent(llm_calc, calculadora_tools, prompt_calc)
executor_calc = AgentExecutor(agent=agente_calc, tools=calculadora_tools, memory=mem_calc, verbose=True)

# Ejemplo de uso:
# pregunta = {"messages": [{"role": "user", "content": "¿Cuánto es 4*6 más 10?"}]}
# respuesta = executor_calc.invoke(pregunta)
# print(respuesta)


## 6. Agente de búsqueda de artículos científicos con Playwright, Gemini y Ollama

En este ejemplo final combinamos la automatización web mediante **Playwright** con dos modelos de lenguaje distintos. El agente navega a una base de datos de artículos (por ejemplo Google Scholar), realiza una búsqueda de artículos científicos sobre un tema y extrae los títulos. Luego utiliza un modelo de **Gemini** para filtrar y evaluar la relevancia de los resultados, y finalmente emplea un modelo local de **Ollama** para sintetizar una respuesta para el usuario.

**Nota:** Playwright necesita instalarse (`pip install playwright` y luego `playwright install`), y el acceso a Gemini requiere configurar credenciales de Google generative AI. Este ejemplo es ilustrativo y no se ejecutará en este entorno.

In [None]:
# Ejemplo de agente que usa Playwright para buscar artículos y combina dos modelos
from langchain_core.tools import tool
from langchain.memory import ConversationBufferMemory
from langchain.agents import create_react_agent, AgentExecutor
from langchain_core.prompts import ChatPromptTemplate
from langchain_community.chat_models import ChatOllama
from langchain_google_genai import ChatGoogleGenerativeAI

@tool
def buscar_articulos(topic: str) -> str:
    """Busca artículos científicos sobre un tema utilizando Playwright y devuelve los títulos encontrados."""
    from playwright.sync_api import sync_playwright
    with sync_playwright() as p:
        browser = p.chromium.launch(headless=True)
        page = browser.new_page()
        # Navegar a Google Scholar
        page.goto("https://scholar.google.com")
        page.fill("input[name=q]", topic)
        page.press("input[name=q]", "Enter")
        page.wait_for_selector("h3")
        # Extraer los primeros 5 títulos
        titles = page.eval_on_selector_all("h3", "elements => elements.slice(0,5).map(e => e.innerText)")
        browser.close()
        return "".join(titles)

# Instanciamos los modelos
llm_gemini = ChatGoogleGenerativeAI(model="gemini-pro")
llm_ollama = ChatOllama(model="llama3:8b", base_url="http://localhost:11434")

# Lista de herramientas
tools_playwright = [buscar_articulos]

# Prompt base para el agente
prompt_playwright = ChatPromptTemplate.from_messages([
    ("system", "Eres un asistente investigador que puede usar herramientas para buscar y evaluar artículos."),
    ("human", "{input}"),
    ("agent", "{agent_scratchpad}"),
])

# Crear el agente que decide con Gemini
agente_playwright = create_react_agent(llm_gemini, tools_playwright, prompt_playwright)

# Executor que sintetiza la respuesta final usando Ollama
mem_playwright = ConversationBufferMemory(memory_key="chat_history", return_messages=True)

executor_playwright = AgentExecutor(agent=agente_playwright, tools=tools_playwright, memory=mem_playwright, verbose=True, llm=llm_ollama)

# Ejemplo de uso:
# pregunta = {"messages": [{"role": "user", "content": "Busca artículos sobre inteligencia artificial explicable."}]}
# respuesta = executor_playwright.invoke(pregunta)
# print(respuesta)
