In [1]:
# pip install smolagents

Collecting smolagents
  Downloading smolagents-1.0.0-py3-none-any.whl.metadata (7.3 kB)
Collecting pandas>=2.2.3 (from smolagents)
  Downloading pandas-2.2.3-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (89 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m89.9/89.9 kB[0m [31m6.4 MB/s[0m eta [36m0:00:00[0m
Collecting markdownify>=0.14.1 (from smolagents)
  Downloading markdownify-0.14.1-py3-none-any.whl.metadata (8.5 kB)
Collecting gradio>=5.8.0 (from smolagents)
  Downloading gradio-5.9.1-py3-none-any.whl.metadata (16 kB)
Collecting duckduckgo-search>=6.3.7 (from smolagents)
  Downloading duckduckgo_search-7.1.1-py3-none-any.whl.metadata (17 kB)
Collecting python-dotenv>=1.0.1 (from smolagents)
  Downloading python_dotenv-1.0.1-py3-none-any.whl.metadata (23 kB)
Collecting e2b-code-interpreter>=1.0.3 (from smolagents)
  Downloading e2b_code_interpreter-1.0.3-py3-none-any.whl.metadata (2.6 kB)
Collecting litellm>=1.55.10 (from smolagents)
  

In [2]:
from smolagents import CodeAgent, DuckDuckGoSearchTool, HfApiModel

* 'fields' has been removed


In [3]:
from huggingface_hub import login

In [4]:
login("MY_HUGGINGFACE_TOKEN")

In [6]:
agent = CodeAgent(tools=[DuckDuckGoSearchTool()], model=HfApiModel())

In [7]:
agent.run("how many seconds it take for a leopard at full speed to run through the Pont des Arts?")

5.978019401179869

Para crear agentes, se necesitan:

* `tools`, que puede aceptar una lista, incluso vacia o ser agregada
* `model`, que moldea el input

En cuanto a modedos:
* `TransformerModel` pre-inicializa el pipeline de `transformers` para ser ejecutado localmente
* `HfApiModel` usa `huggingface_hub.InferenceClient` por debajo
* `LiteLLMModel` permite invocar +100 modelos diferentes a traves de LiteLLM

In [9]:
agent = CodeAgent(tools=[], model=HfApiModel(), additional_authorized_imports=['requests', 'bs4'])
agent.run("Could you get me the title of the page at url 'https://huggingface.co/blog'?")

'Hugging Face – Blog'

In [10]:
# entiende espanol?
agent.run("Puedes obtener el titulo de la pagina del siguiente url 'https://thedatascience.academy/blog'?")

'BLOG'

### El mensaje del sistema

Al inicializar el sistema del agente, se crea automáticamente un mensaje del sistema (atributo system_prompt) convirtiendo la descripción extraída de las herramientas en una plantilla de mensaje del sistema predefinida.

In [11]:
print(agent.system_prompt_template)

You are an expert assistant who can solve any task using code blobs. You will be given a task to solve as best you can.
To do so, you have been given access to a list of tools: these tools are basically Python functions which you can call with code.
To solve the task, you must plan forward to proceed in a series of steps, in a cycle of 'Thought:', 'Code:', and 'Observation:' sequences.

At each step, in the 'Thought:' sequence, you should first explain your reasoning towards solving the task and the tools that you want to use.
Then in the 'Code:' sequence, you should write the code in simple Python. The code sequence must end with '<end_code>' sequence.
During each intermediate step, you can use 'print()' to save whatever important information you will then need.
These print outputs will then appear in the 'Observation:' field, which will be available as input for the next step.
In the end you have to return a final answer using the `final_answer` tool.

Here are a few examples using n

El mensaje del sistema incluye:

* Una *introducción* que explica cómo debe comportarse el agente y qué herramientas son.

* Una descripción de todas las herramientas definidas por un token {{tool_descriptions}} que se reemplaza dinámicamente en tiempo de ejecución con las herramientas definidas/seleccionadas por el usuario.

* La descripción de la herramienta proviene de los atributos de la herramienta, `name`, `description`, `inputs` y `output_type`, y una plantilla `jinja2` simple que puede refinar.

* El formato de salida esperado.

Se puede mejorar el mensaje del sistema, por ejemplo, agregando una explicación del formato de salida.

In [None]:
from smolagents import ToolCallingAgent, PythonInterpreterTool, TOOL_CALLING_SYSTEM_PROMPT

modified_prompt = TOOL_CALLING_SYSTEM_PROMPT

agent = ToolCallingAgent(tools=[PythonInterpreterTool()], model=model, system_prompt=modified_prompt)

Please make sure to define the {{tool_descriptions}} string somewhere in the `template` so the agent is aware of the available tools.

### Tools

Una 'tool' (herramienta) es una función atómica que un agente debe usar. Para que un LLM la use, también necesita algunos atributos que constituyen su API y que se usarán para describir al LLM cómo llamar a esta herramienta:

* Un nombre (name)
* Una descripción (description)
* Tipos de entrada y descripciones (input type and description)
* Un tipo de salida (output type)

Por ejemplo, puede consultar `PythonInterpreterTool`: tiene un nombre, una descripción, descripciones de entrada, un tipo de salida y un método `__call__` para realizar la acción.

Cuando se inicializa el agente, los atributos de la herramienta se utilizan para generar una descripción de la herramienta que se integra en el indicador del sistema del agente. Esto permite que el agente sepa qué herramientas puede usar y por qué.

**Caja de herramientas predeterminada**

Transformers viene con una caja de herramientas predeterminada para empoderar a los agentes, que puede agregar a su agente al momento de la inicialización con el argumento `add_base_tools = True`:

* Búsqueda web DuckDuckGo*: realiza una búsqueda web utilizando el navegador DuckDuckGo.
* Intérprete de código Python: ejecuta el código Python generado por LLM en un entorno seguro. Esta herramienta solo se agregará a *ToolCallingAgent* si la inicializa con `add_base_tools=True`, ya que el agente basado en código ya puede ejecutar código Python de forma nativa.
* Transcriber: un canal de conversión de voz a texto creado en Whisper-Turbo que transcribe un audio a texto.

Puede usar una herramienta manualmente llamando a la función `load_tool()` y una tarea a realizar.

In [12]:
from transformers import load_tool

search_tool = load_tool("web_search")
print(search_tool("Quien es el presidente actual de Australia?"))

[{'title': 'Scott Morrison - Wikipedia, la enciclopedia libre', 'href': 'https://es.wikipedia.org/wiki/Scott_Morrison', 'body': 'Scott John Morrison (Sídney, 13 de mayo de 1968) es un político australiano, líder del Partido Liberal y primer ministro de Australia desde 2018 hasta 2022. 2 Es miembro de la Cámara de Representantes desde 2007, representando a la división de Cook en Nueva Gales del Sur.'}, {'title': 'Gobierno de Australia - Wikipedia, la enciclopedia libre', 'href': 'https://es.wikipedia.org/wiki/Gobierno_de_Australia', 'body': 'El Gobierno de Australia, también conocido como Gobierno de la Mancomunidad, es el gobierno nacional de Australia, una monarquía constitucional parlamentaria federal.'}, {'title': 'Anthony Albanese - Wikipedia, la enciclopedia libre', 'href': 'https://es.wikipedia.org/wiki/Anthony_Albanese', 'body': 'Anthony Norman Albanese (Sídney, Nueva Gales del Sur; 2 de marzo de 1963) es un político australiano que se desempeña como primer ministro de Australia

In [None]:
# Se puede crear un nuevo tool, agregando a @tool:


from transformers import tool

@tool
def model_download_tool(task: str) -> str:
    """
    This is a tool that returns the most downloaded model of a given task on the Hugging Face Hub.
    It returns the name of the checkpoint.

    Args:
        task: The task for which
    """
    most_downloaded_model = next(iter(list_models(filter=task, sort="downloads", direction=-1)))
    return most_downloaded_model.id

# Multi Agent

En este tipo de framework, varios agentes trabajan juntos para resolver una tarea o proyecto, en lugar de uno solo.

Esto produce un mejor rendimiento en la mayoría de los puntos de referencia. La razón de este mejor rendimiento es conceptualmente simple: para muchas tareas, en lugar de utilizar un sistema que lo haga todo, es preferible especializar las unidades en subtareas.

En este caso, tener agentes con conjuntos de herramientas y memorias independientes permite lograr una especialización eficiente.

Para ello, hay que encapsular el agente en un objeto `ManagedAgent`. Este objeto necesita los argumentos `agent`, `name` y `description`, que luego se incorporarán en el **system prompt** del agente administrador, para que sepa cómo llamar a este agente administrado, al igual que con las `tools`

In [14]:
# ejemplo de multiagente que realiza una búsqueda específica

from smolagents import CodeAgent, HfApiModel, DuckDuckGoSearchTool, ManagedAgent

model = HfApiModel()

web_agent = CodeAgent(tools=[DuckDuckGoSearchTool()], model=model)

managed_web_agent = ManagedAgent(
    agent=web_agent,
    name="web_search",
    description="Runs web searches for you. Give it your query as an argument."
)

manager_agent = CodeAgent(
    tools=[], model=model, managed_agents=[managed_web_agent]
)

manager_agent.run("Quien es el actual CEO de Telefonica en España?")

'Sergio Oslé'

In [15]:
manager_agent.run("cual fue el beneficio neto de Telefonica España en 2022?")

'2.01 billion'

In [None]:
# create a Gradio App

from smolagents import (
    load_tool,
    CodeAgent,
    HfApiModel,
    GradioUI
)

# Import tool from Hub
image_generation_tool = load_tool("m-ric/text-to-image")

model = HfApiModel(model_id)

# Initialize the agent with the image generation tool
agent = CodeAgent(tools=[image_generation_tool], model=model)

GradioUI(agent).launch()