# Adaptación del Notebook para Nebius AI

Este notebook ha sido adaptado para usar **Nebius AI** con el modelo **Llama 3.3** en lugar de OpenAI.

## Cambios principales:
- ✅ API key de Nebius configurada
- ✅ Base URL de Nebius configurada (`https://api.studio.nebius.com/v1`)
- ✅ Modelo cambiado a `meta-llama/Llama-3.3-70B-Instruct`
- ✅ Cliente de OpenAI personalizado configurado para Nebius
- ✅ Uso de `OpenAIChatCompletionsModel` con cliente personalizado para asegurar que el SDK use Nebius
- ✅ Todas las instancias de modelos GPT reemplazadas por el modelo de Nebius

## Configuración:
- La API key y base URL se configuran en las primeras celdas del notebook
- Se crea un cliente `AsyncOpenAI` configurado para Nebius
- El modelo `NEBUS_MODEL` se crea usando `OpenAIChatCompletionsModel` con el cliente personalizado
- Esto asegura que el SDK `openai-agents` use Nebius en lugar de OpenAI

## Solución de problemas:
Si encuentras errores de autenticación o conexión:
1. Verifica que la API key de Nebius sea válida
2. Asegúrate de que el modelo `meta-llama/Llama-3.3-70B-Instruct` esté disponible en tu cuenta
3. El error de tracing (401) es normal y no afecta la funcionalidad principal
4. El modelo ahora usa un cliente personalizado, por lo que debería funcionar correctamente con Nebius

---



## ¿Qué es OpenAI Agents SDK?

OpenAI lanzó **Agents SDK** en marzo de 2025 como un nuevo framework *open-source* para agentes.

* Actualización del framework experimental *Swarm*.
* Similar a frameworks como LangChain, Llama-Index, LangGraph...

**Nota:** Este notebook ha sido adaptado para usar **Nebius AI** con el modelo **Llama 3.3** en lugar de OpenAI.
---



## Características Clave

* Agent Loop: llamadas a herramientas, envío de resultados al LLM ...
* Python-first: características nativas de Python en lugar de introducir nuevas capas de abstracción.
* Sessions: gestión automática del historial de la conversación (sin tener que hacerlo manualmente)
* Multi-Agentes: Patrón orquestador y handoff (coordinación y delegación entre múltiples agentes).
* Guardrails: Validación de entrada/salida
* Function Tools: Funciones Python como herramientas
* Trazabilidad: Visualización, depuración y monitorización de los pasos del agente.

---



## Instalación y Primer Agente

**1. Instalación:**

In [2]:
%pip install -qU openai-agents

Note: you may need to restart the kernel to use updated packages.


In [3]:
from agents import set_tracing_export_api_key
from openai.types.responses import ResponseTextDeltaEvent
from openai import OpenAI, AsyncOpenAI
from agents.models.openai_chatcompletions import OpenAIChatCompletionsModel

import os
# from google.colab import userdata  # Comentado para uso local

# Configurar API key de Nebius
NEBIUS_API_KEY = "eyJhbGciOiJIUzI1NiIsImtpZCI6IlV6SXJWd1h0dnprLVRvdzlLZWstc0M1akptWXBvX1VaVkxUZlpnMDRlOFUiLCJ0eXAiOiJKV1QifQ.eyJzdWIiOiJnb29nbGUtb2F1dGgyfDEwNzcwNzQ1MDE2NTIyODIxMDgzNSIsInNjb3BlIjoib3BlbmlkIG9mZmxpbmVfYWNjZXNzIiwiaXNzIjoiYXBpX2tleV9pc3N1ZXIiLCJhdWQiOlsiaHR0cHM6Ly9uZWJpdXMtaW5mZXJlbmNlLmV1LmF1dGgwLmNvbS9hcGkvdjIvIl0sImV4cCI6MTkwODk3ODIyNywidXVpZCI6IjE1ZGMxYTcyLTkwMzMtNDU1MS1hNTBiLWI0MDM1ODVlZmYyZiIsIm5hbWUiOiJOZWJpdXNLZXkiLCJleHBpcmVzX2F0IjoiMjAzMC0wNi0yOVQxNTo0Mzo0NyswMDAwIn0.6QhTkStPAH9_Dae2sbF1oU6XlVHbeY4kOb7e1icluwE"

# Configurar variables de entorno para Nebius
os.environ['OPENAI_API_KEY'] = NEBIUS_API_KEY
os.environ['OPENAI_BASE_URL'] = 'https://api.studio.nebius.com/v1'  # Base URL de Nebius

# Crear cliente de OpenAI configurado para Nebius (síncrono y asíncrono)
nebius_client = OpenAI(
    api_key=NEBIUS_API_KEY,
    base_url='https://api.studio.nebius.com/v1'
)

nebius_async_client = AsyncOpenAI(
    api_key=NEBIUS_API_KEY,
    base_url='https://api.studio.nebius.com/v1'
)

# Modelo de Nebius (Llama 3.3)
NEBUS_MODEL_NAME = "meta-llama/Llama-3.3-70B-Instruct"

# Crear modelo de Nebius usando OpenAIChatCompletionsModel con cliente personalizado
# Esto asegura que el SDK use Nebius en lugar de OpenAI
NEBUS_MODEL = OpenAIChatCompletionsModel(
    model=NEBUS_MODEL_NAME,
    openai_client=nebius_async_client
)

# Para Colab, también puedes usar:
# from google.colab import userdata
# os.environ['OPENAI_API_KEY'] = userdata.get('NEBIUS_API_KEY')
# os.environ['OPENAI_BASE_URL'] = 'https://api.studio.nebius.com/v1'

# Nota: set_tracing_export_api_key puede fallar con Nebius ya que el tracing es específico de OpenAI
# Comentamos esta línea si causa problemas
try:
    set_tracing_export_api_key(NEBIUS_API_KEY)
except Exception as e:
    print(f"Advertencia: No se pudo configurar el tracing (esto es normal con Nebius): {e}")


**2. Crear un Agente Básico:**


In [4]:
from agents import Agent

# Crear agente usando modelo de Nebius (Llama 3.3)
# NEBUS_MODEL ya está configurado con el cliente de Nebius en la celda anterior
agent = Agent(
    name="Assistant",
    instructions="Eres un asistente útil que responde a las preguntas del usuario",
    model=NEBUS_MODEL  # Usando modelo de Nebius con cliente personalizado
)

**3. Ejecutando un Agente:**

El SDK proporciona métodos para ejecutar agentes:

* Runner.run() - Ejecución asíncrona.
* Runner.run_sync() - Ejecución síncrona.
* Runner.run_streamed() - Ejecución asíncrona con respuestas en streaming.

**Ejemplo Básico (Asíncrono):**

In [5]:
from agents import Runner

result = await Runner.run(
    starting_agent=agent,
    input="cuéntame una historia corta"
)
print(result.final_output)

[non-fatal] Tracing client error 401: {
  "error": {
    "message": "Your authentication token is not from a valid issuer.",
    "type": "invalid_request_error",
    "param": null,
    "code": "invalid_issuer"
  }
}


¡Claro! Aquí te dejo una historia corta:

Había una vez, en un pequeño pueblo rodeado de montañas, un anciano llamado Kaito. Kaito era un hombre sencillo, pero con un corazón lleno de sabiduría y compasión. Pasaba sus días cultivando un jardín lleno de hierbas medicinales y flores silvestres, que utilizaba para curar a los habitantes del pueblo.

Un día, una joven llamada Akira llegó al pueblo en busca de refugio. Estaba huyendo de una gran ciudad, donde se sentía sola y desesperada. Kaito la recibió con una sonrisa cálida y la invitó a quedarse en su casa.

Mientras Akira se recuperaba de su viaje, Kaito le enseñó el arte de curar con hierbas y la importancia de la conexión con la naturaleza. Akira se sintió atraída por la sabiduría y la calma de Kaito, y pronto se encontró ayudándolo en el jardín y aprendiendo de él.

Con el tiempo, Akira descubrió que el jardín de Kaito tenía un poder especial. Las flores y las hierbas que crecían allí no solo curaban el cuerpo, sino que también cal

**4. Streaming de Respuestas:**

Particularmente útil para aplicaciones de cara al usuario, ya que proporciona feedback inmediato.


In [6]:
response = Runner.run_streamed(
    starting_agent=agent,
    input="cuéntame una historia corta"
)

async for event in response.stream_events():
    if event.type == "raw_response_event" and \
    isinstance(event.data, ResponseTextDeltaEvent):
        print(event.data.delta, end="", flush=True)


¡Claro! Aquí te dejo una historia corta que espero te guste:

**La Tienda Mágica de Relojes**

En un pequeño pueblo rodeado de montañas, había una tienda de relojes que parecía haber sido olvidada por el tiempo. La tienda se llamaba "El Tic-Tac" y estaba regentada por un anciano llamado Jorge. Jorge era un relojero habil

[non-fatal] Tracing client error 401: {
  "error": {
    "message": "Your authentication token is not from a valid issuer.",
    "type": "invalid_request_error",
    "param": null,
    "code": "invalid_issuer"
  }
}


idoso que pasaba sus días arreglando y construyendo relojes de todos tipos, desde los más simples hasta los más complejos.

Un día, una joven llamada Sofía se perdió en el pueblo y se encontró frente a la tienda de Jorge. La puerta estaba entreabierta, así que Sofía la empujó y entró. Dentro, encontró una colección increíble de relojes que parecían tener vida propia. Había relojes que sonaban melodías, relojes que mostraban imágenes en movimiento y relojes que parecían hablar.

Jorge salió de la trastienda y se acercó a Sofía. "Bienvenida a mi tienda", dijo con una sonrisa. "Aquí, el tiempo no existe. Solo hay el tic-tac de los relojes".

Sofía se quedó fascinada por la tienda y pasó horas explorándola. Jorge le mostró sus creaciones más increíbles, incluyendo un reloj que parecía ser una máquina del tiempo. Sofía se rió y le preguntó si realmente funcionaba. Jorge sonrió y le dijo que solo funcionaba para aquellos que creían en la magia del tiempo.

Sofía se despidió de Jorge y salió 

**5. REPL básico:**

El SDK proporciona `run_demo_loop` para realizar pruebas rápidas e interactivas del comportamiento de un agente directamente en tu terminal. Un agente NO recuerda el histórico de la conversación automáticamente, PERO run_demo_loop añade soporte automático de histórico.

In [None]:

from agents import Agent, run_demo_loop

# Crear agente usando modelo de Nebius
agent = Agent(
    name="Assistant", 
    instructions="You are a helpful assistant.",
    model=NEBUS_MODEL  # Usando modelo de Nebius con cliente personalizado
)
await run_demo_loop(agent)


**6. Function Tools:**

Convierte funciones Python en herramientas que el agente puede usar.

**Definición:**

In [None]:
from agents import function_tool

@function_tool
def multiply(x: float, y: float) -> float:
    """Multiplica `x` e `y` para dar una respuesta precisa."""
    return x*y


**Claves para una buena herramienta:**

* Nombre de función claro.
* Nombres de parámetros descriptivos.
* Anotaciones de tipo para entradas y salidas.
* Docstring explicativo (se convierte en la descripción de la herramienta).

**Uso:**

In [None]:
from agents import Agent, Runner

# Crear agente con herramientas usando modelo de Nebius (Llama 3.3)
agent_con_herramientas = Agent(
    name="Assistant",
    instructions="Usa las herramientas provistas para responder a la pregunta del usuario",
    model=NEBUS_MODEL,  # Usando Llama 3.3 de Nebius
    tools=[multiply] # Lista de herramientas disponibles
)

In [None]:
result = await Runner.run(
    starting_agent=agent_con_herramientas,
    input="Cuánto es 1.23456 multiplicado por 4.5678"
)

In [None]:
print(result)

RunResult:
- Last agent: Agent(name="Assistant", ...)
- Final output (str):
    1.23456 multiplicado por 4.5678 es aproximadamente 5.6392.
- 3 new item(s)
- 2 raw response(s)
- 0 input guardrail result(s)
- 0 output guardrail result(s)
(See `RunResult` for more details)


In [None]:
print(result.final_output)

1.23456 multiplicado por 4.5678 es aproximadamente 5.6392.


![Traza automática en OpenAI](https://ikasten.io/images/2025-traza.png)

## Guardrails (Barreras de Seguridad - Guardarraíles)

Hay dos tipos principales:

- **Input guardrails:** Validan o filtran la entrada del usuario antes de que llegue a tu agente.
- **Output guardrails:** Verifican y pueden bloquear o modificar la salida del agente antes de devolverla al usuario.

Los guardrails se implementan como funciones que pueden usar cualquier lógica, incluyendo llamadas a otros LLMs, para decidir si permiten o bloquean un mensaje.

---


### Ejemplo: Construyendo un Input Guardrail

Supongamos que quieres evitar que tu agente responda preguntas sobre opiniones políticas. Puedes usar un agente dedicado como guardrail para detectar este tipo de consultas.

In [None]:
from pydantic import BaseModel

# Definimos la estructura de salida para el agente guardrail
class Alerta(BaseModel):
    is_triggered: bool
    reasoning: str

# Agente que revisa si la consulta es sobre conflictos bélicos
# Usando modelo de Nebius con cliente personalizado
war_agent = Agent(
    name="Chequeo conflictos bélicos",
    instructions="Verifica si el usuario está preguntando sobre conflictos bélicos",
    output_type=Alerta,
    model=NEBUS_MODEL  # Usando modelo de Nebius con cliente personalizado
)

Puedes ejecutar este agente directamente:

In [None]:
query = "¿Qué opinas de la invasión de Ucrania por parte de Rusia?"
# query = "cuánto es 123*456?"

result = await Runner.run(starting_agent=war_agent, input=query)
print(result.final_output)


is_triggered=False reasoning='La pregunta es sobre una operación matemática, específicamente una multiplicación, y no tiene relación con conflictos bélicos.'


### Integrando Guardrails con tu Agente
Para usar este chequeo como guardrail, envuélvelo en una función decorada con `@input_guardrail`.

<img src="https://ikasten.io/images/guardrail.png" width="85%">





In [None]:
from agents import (
    GuardrailFunctionOutput,
    RunContextWrapper,
    input_guardrail
)

 Estas funciones deben aceptar un contexto (`ctx`), el agente y la entrada, y devolver un objeto `GuardrailFunctionOutput`.

In [None]:
@input_guardrail
async def war_guardrail(
    ctx: RunContextWrapper[None],
    agent: Agent,
    input: str,
) -> GuardrailFunctionOutput:
    # Usamos el war_agent para revisar la entrada
    response = await Runner.run(starting_agent=war_agent, input=input, context=ctx.context)
    return GuardrailFunctionOutput(
        output_info=response.final_output,
        tripwire_triggered=response.final_output.is_triggered,
    )

Ahora, añade este guardrail a tu agente principal:

In [None]:
# Crear agente con guardrails usando modelo de Nebius (Llama 3.3)
agent = Agent(
    name="Asistente",
    instructions=(
        "Eres un asistente útil. Utiliza siempre las "
        "herramientas proporcionadas cuando sea posible "
        " y no dependas sólo de tu propio conocimiento."
    ),
    model=NEBUS_MODEL,  # Usando Llama 3.3 de Nebius
    tools=[multiply],
    input_guardrails=[war_guardrail],  # Lista de guardrails de entrada
)

Cuando ejecutes tu agente, el guardrail revisará cada entrada:

In [None]:
result = await Runner.run(
    starting_agent=agent,
    input="¿Cuánto es 1.2345 * 6.892?"
)
print(result.final_output)


1.2345 multiplicado por 6.892 es igual a 8.508174.


In [None]:
# Ahora, probamos con una pregunta referida a un conflicto:
try:
  result = await Runner.run(
      starting_agent=agent,
      input="¿Qué opinas del asalto de Israel a la franja de Gaza?"
  )
  print(result.final_output)
except Exception as e:
  print(f"An error occurred: {e}")
# Lanza InputGuardrailTripwireTriggered: Guardrail InputGuardrail triggered tripwire

An error occurred: Guardrail InputGuardrail triggered tripwire


Cuando el guardrail se activa, el SDK lanza una excepción `InputGuardrailTripwireTriggered`, evitando que el agente responda a consultas no permitidas.


### Output Guardrails

Los guardrails de salida funcionan de manera muy similar, pero usan el decorador `@output_guardrail` y se configuran mediante el parámetro `output_guardrails` en tu agente. Esto permite aplicar políticas sobre lo que el agente puede decir, incluso después de procesar la entrada.

Ejemplo:
https://gist.github.com/juananpe/a0b8fea57630179fdddaa3f59139019c

---



**Buenas prácticas:**
- Utiliza guardrails para hacer cumplir políticas de negocio, legales o de seguridad.
- Los guardrails pueden llamar a otros LLMs, pero recuerda que esto incrementa el coste y la latencia.
- Puedes encadenar varios guardrails para una protección por capas.
- Usa tanto input como output guardrails para una cobertura completa.

---


# 7. Agentes Conversacionales:

El SDK facilita el mantenimiento del contexto en conversaciones multi-turno, bien gestionándolo de forma manual o a través de sesiones.

### 7.1 Mantenimiento manual del histórico de la conversación

In [None]:

result1 = await Runner.run(starting_agent=agent, input="recuerda el número 5")


In [None]:
print(result1)


RunResult:
- Last agent: Agent(name="Asistente", ...)
- Final output (str):
    He anotado el número 5. ¿Hay algo más en lo que te pueda ayudar?
- 1 new item(s)
- 1 raw response(s)
- 1 input guardrail result(s)
- 0 output guardrail result(s)
(See `RunResult` for more details)


In [None]:
result = await Runner.run(starting_agent=agent, input="cuál es el número que te dije que recordaras")


In [None]:
print(result)

RunResult:
- Last agent: Agent(name="Asistente", ...)
- Final output (str):
    Lo siento, pero no tengo la capacidad para recordar información de conversaciones anteriores. Si me das el número de nuevo, estaré encantado de ayudarte con lo que necesites.
- 1 new item(s)
- 1 raw response(s)
- 1 input guardrail result(s)
- 0 output guardrail result(s)
(See `RunResult` for more details)


In [None]:
result1.to_input_list()

[{'content': 'recuerda el número 5', 'role': 'user'},
 {'id': 'msg_055212774878820e00692c757b657c81a3a47de8ea405d4095',
  'content': [{'annotations': [],
    'text': 'He anotado el número 5. ¿Hay algo más en lo que te pueda ayudar?',
    'type': 'output_text',
    'logprobs': []}],
  'role': 'assistant',
  'status': 'completed',
  'type': 'message'}]


Para la siguiente interacción, pasar el historial:


In [None]:

input_history = result1.to_input_list()
result2 = await Runner.run(
    starting_agent=agent,
    input=input_history + [{"role": "user", "content":
    "multiplica por 3 el último número que te pasé"}]
)


In [None]:
print(result2)

RunResult:
- Last agent: Agent(name="Asistente", ...)
- Final output (str):
    La multiplicación de 5 por 3 es 15. ¿Necesitas algo más?
- 3 new item(s)
- 2 raw response(s)
- 1 input guardrail result(s)
- 0 output guardrail result(s)
(See `RunResult` for more details)


El método `to_input_list()` convierte el resultado en un historial de mensajes formateado correctamente.

### 7.2 Mantenimiento automático del histórico de la conversación mediante SESSION

In [None]:
!pip install nest-asyncio



In [None]:
import nest_asyncio

nest_asyncio.apply()

In [None]:
from agents import Agent, Runner, SQLiteSession
# from google.colab import userdata  # Comentado para uso local
import os

# Configurar API key de Nebius (ya debería estar configurada en celdas anteriores)
# Si no está configurada, descomenta las siguientes líneas:
# NEBIUS_API_KEY = "tu_api_key_aqui"
# os.environ['OPENAI_API_KEY'] = NEBIUS_API_KEY
# os.environ['OPENAI_BASE_URL'] = 'https://api.studio.nebius.com/v1'

# Para Colab, también puedes usar:
# from google.colab import userdata
# os.environ['OPENAI_API_KEY'] = userdata.get('NEBIUS_API_KEY')
# os.environ['OPENAI_BASE_URL'] = 'https://api.studio.nebius.com/v1'

from agents import set_tracing_export_api_key
set_tracing_export_api_key(os.getenv("OPENAI_API_KEY"))

# Create agent usando modelo de Nebius
agent = Agent(
    name="Assistant",
    instructions="Responde de forma muy concisa y breve.",
    model=NEBUS_MODEL  # Usando modelo de Nebius con cliente personalizado
)

# Create a session instance with a session ID
session = SQLiteSession("conversation_123", "chat.db")

# First turn
result = await Runner.run(
    agent,
    "¿En qué ciudad está El Peine de los Vientos?",
    session=session
)
print(result.final_output)  # "Donostia"

# Second turn - agent automatically remembers previous context
result = await Runner.run(
    agent,
    "¿A qué provincia pertenece?",
    session=session
)
print(result.final_output)  # "Gipuzkoa"

result = await Runner.run(
    agent,
    "¿Cuántos habitantes tiene esa provincia?",
    session=session
)
print(result.final_output)  # "Aproximadamente 730.000 habitantes."

San Sebastián.
Gipuzkoa.
Aproximadamente 729.000 habitantes (2023).


In [None]:
# Create a session instance with a session ID
session2 = SQLiteSession("conversation_123", "chat.db")
history = await session2.get_items()
print(history)
print(len(history))

last_item = await session2.pop_item()
print(last_item['content'])

# get size of history
print(len(await session2.get_items()))

[{'content': '¿En qué ciudad está El Peine de los Vientos?', 'role': 'user'}, {'id': 'msg_02965af89df9dba700692c75d35a688190aa54c48183e47c86', 'content': [{'annotations': [], 'text': 'San Sebastián.', 'type': 'output_text', 'logprobs': []}], 'role': 'assistant', 'status': 'completed', 'type': 'message'}, {'content': '¿A qué provincia pertenece?', 'role': 'user'}, {'id': 'msg_02965af89df9dba700692c75d6529c8190949cabe4505e8dc7', 'content': [{'annotations': [], 'text': 'Gipuzkoa.', 'type': 'output_text', 'logprobs': []}], 'role': 'assistant', 'status': 'completed', 'type': 'message'}, {'content': '¿Cuántos habitantes tiene esa provincia?', 'role': 'user'}, {'id': 'msg_02965af89df9dba700692c75d8855481909617fcfd99e4d421', 'content': [{'annotations': [], 'text': 'Aproximadamente 729.000 habitantes (2023).', 'type': 'output_text', 'logprobs': []}], 'role': 'assistant', 'status': 'completed', 'type': 'message'}]
6
[{'annotations': [], 'text': 'Aproximadamente 729.000 habitantes (2023).', 'type

Es posible continuar una sesión en cualquier momento:

In [None]:
# Create agent usando modelo de Nebius
agent2 = Agent(
    name="Assistant2",
    instructions="Responde de forma muy concisa y breve.",
    model=NEBUS_MODEL  # Usando modelo de Nebius con cliente personalizado
)

# Create a session instance with a session ID
session2 = SQLiteSession("conversation_123", "chat.db")

# First turn
result2 = await Runner.run(
    agent2,
    "¿de qué ciudad estamos hablando?",
    session=session2
)
print(result2.final_output)  # "Donostia"

San Sebastián.



**Conclusión**

OpenAI's Agents SDK (adaptado para Nebius AI) ofrece:

* Un framework estructurado para construir agentes LLM con herramientas, guardrails y gestión de conversaciones.

* Un enfoque Python-first que lo hace accesible y flexible.

* Compatible con APIs compatibles con OpenAI (como Nebius AI), permitiendo usar modelos como Llama 3.3.

**Nota:** Este notebook usa Nebius AI con el modelo Llama 3.3, demostrando la compatibilidad del SDK con proveedores alternativos.

---


**Ventajas clave:**

* Streaming incorporado.

* Guardrails estructurados.

* Definición simple de herramientas.

* Gestión de contexto conversacional.

* Capacidades de trazado para depuración.

Es una base sólida para construir aplicaciones de IA prácticas y robustas.