# Guía de inicio rápido de smolagents

*Esta guía es una versión adaptada de: https://huggingface.co/docs/smolagents/guided_tour *

En esta guía vamos a ver cómo crear un agente, ejecutarlo y adaptarlo a un caso de uso determinado.

La inicialización de un agente requiere la especificación de un *model* de generación de texto que sirva como motor del agente, y de una lista de herramientas (*tools*) que permitan realizar acciones determinadas extrayendo información del entorno o realizando acciones sobre él.

En el siguiente ejemplo, vamos a ejecutar un modelo Transformers en local, para ello, necesitamos configurar un token que nos dé acceso al API.

In [3]:
from smolagents import CodeAgent, HfApiModel
from smolagents import TransformersModel
from huggingface_hub import login
import os
import torch

login(token="put_your_token_here")
os.environ["HF_CACHE"] = "/mnt/netapp2/Store_uni/home/ulc/es/dac/"
#google/gemma-2-2b-it
#deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
#microsoft/phi-4
#model = TransformersModel(model_id="mistralai/Mistral-7B-Instruct-v0.3")
model = HfApiModel()

agent = CodeAgent(tools=[], model=model, add_base_tools=True)

agent.run(
    "Which would the current age of Jesus Christ?",
)

2020

El *CodeAgent* va a ejecutar código en tu entorno local. Esto debería ser seguro porque las únicas funciones que se pueden ejecutar se encuentran dentro de una lista de imports seguros permitidos. Si queremos añadir nuevas funcionalidades, podemos añadir imports adicionales siguiendo el mecanismo que vemos en el siguiente ejemplo.

In [2]:
model = HfApiModel()
agent = CodeAgent(tools=[], model=model, additional_authorized_imports=['requests', 'bs4'])
agent.run("Could you get me the title of the page at url 'https://huggingface.co/blog'?")

'Hugging Face – Blog'

La ejecución se parará si el código generado y ejecutado por el agente, intenta realizar alguna operación ilegal, o si hay un error de Python convencional. Existe un mecanismo que proporciona un nivel extra de seguridad, y aparece documentado aquí [E2B code executor](https://e2b.dev/docs#what-is-e2-b)

Existen dos mecanismos que nos permiten inspeccionar lo que pasó después de una ejecución de un gente:
- El diccionario *agent.logs* almacena los logs de grano fino del agente.
- La ejecución del método *agent.write_inner_memory_from_logs()* crea una memoria interior de los logs del agente para que sean inspeccionados por el LLM como una lista de mensajes. Este método inspecciona dichos mensajes y se queda con la información que considera relevante.

In [4]:
print(agent.logs)

[SystemPromptStep(system_prompt='You are an expert assistant who can solve any task using code blobs. You will be given a task to solve as best you can.\nTo do so, you have been given access to a list of tools: these tools are basically Python functions which you can call with code.\nTo solve the task, you must plan forward to proceed in a series of steps, in a cycle of \'Thought:\', \'Code:\', and \'Observation:\' sequences.\n\nAt each step, in the \'Thought:\' sequence, you should first explain your reasoning towards solving the task and the tools that you want to use.\nThen in the \'Code:\' sequence, you should write the code in simple Python. The code sequence must end with \'<end_code>\' sequence.\nDuring each intermediate step, you can use \'print()\' to save whatever important information you will then need.\nThese print outputs will then appear in the \'Observation:\' field, which will be available as input for the next step.\nIn the end you have to return a final answer using 

In [5]:
print(agent.write_inner_memory_from_logs())

[{'role': <MessageRole.SYSTEM: 'system'>, 'content': 'You are an expert assistant who can solve any task using code blobs. You will be given a task to solve as best you can.\nTo do so, you have been given access to a list of tools: these tools are basically Python functions which you can call with code.\nTo solve the task, you must plan forward to proceed in a series of steps, in a cycle of \'Thought:\', \'Code:\', and \'Observation:\' sequences.\n\nAt each step, in the \'Thought:\' sequence, you should first explain your reasoning towards solving the task and the tools that you want to use.\nThen in the \'Code:\' sequence, you should write the code in simple Python. The code sequence must end with \'<end_code>\' sequence.\nDuring each intermediate step, you can use \'print()\' to save whatever important information you will then need.\nThese print outputs will then appear in the \'Observation:\' field, which will be available as input for the next step.\nIn the end you have to return 

## Tools (herramientas)

Las herramientas son funciones atómicas que pueden ser utilizadas por un agente. Para ello, necesita unos pocos atributos que constituyen su API y serán utilizados para al LLM cómo invocar a dicha herramienta:

- Un nombre
- Una descripción
- Descripción de las entradas y sus tipos
- Tipo de la salida

Puedes echarle un vistazo, por ejemplo, a la definición de la [*PythonInterpreterTool*](https://huggingface.co/docs/smolagents/v1.5.0/en/reference/tools#smolagents.PythonInterpreterTool). Durante la inicialización del agente, éste recibe un lista de las herramientas de las que dispone. La descripción de cada herramienta será procesada e incorporada al prompt de sistema del agente.

### Default toolbox

La caja de herramientas por defecto (*default toolbox*) proporciona un conjunto de herramientas que pueden ser añadidas fácilmente durante la inicialización del agente (*add_base_tools=True*):

- DuckDuckGo web search
- Python code interpreter
- Transcriber: tts (text-to-speech)

Además de permitir su uso, también podemos llamar a las herramientas directamente.

In [6]:
from smolagents import DuckDuckGoSearchTool

search_tool = DuckDuckGoSearchTool()
print(search_tool("Who's the current president of Russia?"))

## Search Results

[President of Russia - Wikipedia](https://en.wikipedia.org/wiki/President_of_Russia)
The president of Russia, officially the president of the Russian Federation (Russian: Президент Российской Федерации, romanized: Prezident Rossiyskoy Federatsii), is the executive head of state of Russia.The president is the chair of the Federal State Council and the supreme commander-in-chief of the Russian Armed Forces.It is the highest office in Russia.

[List of presidents of Russia - Wikipedia](https://en.wikipedia.org/wiki/List_of_presidents_of_Russia)
The office of the president of Russia is the highest authority in the Russian Federation.The holder is the federation's head of state and has formal presidency over the State Council as well as being the commander in chief of the Russian Armed Forces.The office was introduced in 1918 after the February Revolution with the current office emerging after a referendum of 1991. [1]

[Vladimir Putin - Wikipedia](https://en.wikipedia.or

### Creación de una nueva herramienta

También existe la posibilidad de crear una nueva herramienta. Imaginemos que tenemos un código Python que nos permite averigura cuál es el modelo más descargado para efectuar una determinada tarea. Veamos primero el código Python del que hablamos.

In [7]:
from huggingface_hub import list_models

task = "text-classification"

most_downloaded_model = next(iter(list_models(filter=task, sort="downloads", direction=-1)))
print(most_downloaded_model.id)

cross-encoder/ms-marco-MiniLM-L-6-v2


Veamos ahora este código encapsulado en forma de herramienta. Hay dos formas de hacerlo:
- Definiendo una función sobre la que aplicamos el decorador @tool.
- Definiendo una clase que hereda de la clase Tool, y en el que hay que cumplir una interfaz determinada.

Utilicemos el primer método para convertir nuestra funcionalidad en una herramienta usable.

In [8]:
from smolagents import tool

@tool
def model_download_tool(task: str) -> str:
    """
    This is a tool that returns the most downloaded model of a given task on the Hugging Face Hub.
    It returns the name of the checkpoint.

    Args:
        task: The task for which to get the download count.
    """
    most_downloaded_model = next(iter(list_models(filter=task, sort="downloads", direction=-1)))
    return most_downloaded_model.id

Ahora vamos a definir un agente que incorpore la nueva herramienta, y vamos a hacerle una pregunta que probablemente requiera su uso.

In [9]:
from smolagents import CodeAgent, HfApiModel
agent = CodeAgent(tools=[model_download_tool], model=HfApiModel())
agent.run(
    "Can you give me the name of the model that has the most downloads in the 'text-to-video' task on the Hugging Face Hub?"
)

'ByteDance/AnimateDiff-Lightning'

### Multi-agents

Los multiagentes son una funcionalidad avanzada de SmolAgents que permite que varios agentes colaboren para realizar una tarea. Para hacerlo, se establece una estructura jerárquica entre los agentes, por la que los agentes de nivel inferior, que a su vez pueden se llamados por otros agentes, se definen como un objeto de la clase *ManagedAgent*.

A continuación, mostramos un ejemplo en el que un agente secundario, se encarga de realizar las búsqueda de información en la web.

In [None]:
from smolagents import CodeAgent, HfApiModel, DuckDuckGoSearchTool, ManagedAgent

model = HfApiModel()

web_agent = CodeAgent(tools=[DuckDuckGoSearchTool()], model=model)

managed_web_agent = ManagedAgent(
    agent=web_agent,
    name="web_search",
    description="Runs web searches for you. Give it your query as an argument."
)

manager_agent = CodeAgent(
    tools=[], model=model, managed_agents=[managed_web_agent]
)

manager_agent.run("Who is the CEO of Hugging Face?")