# 2. Agentes con Function Calling Nativo de OpenAI

## Objetivos de Aprendizaje
- Comprender el mecanismo de "Function Calling" de OpenAI y sus ventajas.
- Definir herramientas en el formato JSON Schema que requiere la API.
- Implementar un agente que utiliza function calling para interactuar con una API externa (Wikipedia).
- Manejar el flujo de una conversaci√≥n donde el modelo solicita la ejecuci√≥n de una funci√≥n.

## ¬øQu√© es Function Calling y por qu√© es mejor?

En el notebook anterior, construimos un agente que funcionaba parseando texto. El LLM escrib√≠a su intenci√≥n de usar una herramienta en un formato espec√≠fico ("Action: {...}"), y nosotros us√°bamos expresiones regulares para extraer esa intenci√≥n. Este m√©todo funciona, pero es fr√°gil:

- El LLM puede cometer errores y no generar el texto en el formato exacto.
- El parsing puede fallar si la estructura del texto cambia ligeramente.
- Los argumentos de la funci√≥n se pasan como un string que debemos convertir a JSON, lo cual puede dar errores.

**Function Calling** es la soluci√≥n nativa de OpenAI a este problema. En lugar de pedirle al modelo que *escriba* qu√© herramienta quiere usar, le permitimos que nos devuelva una estructura de datos **JSON bien formada** que especifica el nombre de la funci√≥n y los argumentos que quiere usar. 

**Ventajas:**
1.  **Fiabilidad**: El modelo est√° entrenado para generar un JSON v√°lido, eliminando casi por completo los errores de formato.
2.  **Seguridad**: Evita la necesidad de ejecutar c√≥digo que el LLM genera directamente.
3.  **Simplicidad**: No m√°s parsing con expresiones regulares. La intenci√≥n del modelo es clara y estructurada.

### 1. Instalaci√≥n y Configuraci√≥n

In [None]:
!pip install openai wikipedia -q

In [1]:
import os
import json
import wikipedia
from openai import OpenAI

# Configurar el idioma de Wikipedia
wikipedia.set_lang("es")

# --- Configuraci√≥n del Cliente OpenAI ---
try:
    client = OpenAI(
        base_url=os.environ.get("GITHUB_BASE_URL"),
        api_key=os.environ.get("GITHUB_TOKEN")
    )
    print("‚úÖ Cliente OpenAI configurado correctamente.")
except Exception as e:
    print(f"‚ùå Error configurando el cliente: {e}")
    client = None

‚úÖ Cliente OpenAI configurado correctamente.


### 2. Definici√≥n de Herramientas en formato OpenAI

Primero, definimos la funci√≥n de Python que queremos que nuestro agente pueda usar. En este caso, una funci√≥n que busca un resumen en Wikipedia.

Luego, y esto es lo m√°s importante, describimos esa funci√≥n en un formato de **JSON Schema**. Esta descripci√≥n le dice al LLM qu√© es la herramienta, para qu√© sirve y qu√© argumentos necesita.

In [2]:
# La funci√≥n de Python que realiza la acci√≥n
def get_wikipedia_summary(query):
    """Busca en Wikipedia un tema y devuelve un resumen de 2 frases."""
    try:
        # sentences=2 pide a la librer√≠a que devuelva un resumen de 2 frases
        summary = wikipedia.summary(query, sentences=2)
        return summary
    except wikipedia.exceptions.PageError:
        return f"No se encontr√≥ ninguna p√°gina para '{query}'."
    except wikipedia.exceptions.DisambiguationError as e:
        return f"La b√∫squeda para '{query}' es ambigua. Opciones: {e.options[:3]}"

# Lista de herramientas en formato JSON Schema para la API de OpenAI
tools_definition = [
    {
        "type": "function",
        "function": {
            "name": "get_wikipedia_summary",
            "description": "Obtiene un resumen conciso de un art√≠culo de Wikipedia para un tema o persona espec√≠fica.",
            "parameters": {
                "type": "object",
                "properties": {
                    "query": {
                        "type": "string",
                        "description": "El tema o nombre a buscar en Wikipedia. Por ejemplo, 'Albert Einstein'."
                    }
                },
                "required": ["query"]
            }
        }
    }
]

print("‚úÖ Herramienta y su definici√≥n para OpenAI listas.")

‚úÖ Herramienta y su definici√≥n para OpenAI listas.


### 3. El Flujo del Agente con Function Calling

El proceso ahora es m√°s estructurado:

1.  **Usuario -> Agente**: Enviamos la pregunta del usuario y la lista de herramientas (`tools_definition`) al LLM.
2.  **LLM -> Agente**: El LLM analiza la pregunta. Si decide que necesita una herramienta, en lugar de devolver un mensaje de texto, devuelve un objeto `tool_calls`.
3.  **Agente**: Verificamos si la respuesta contiene `tool_calls`. Si es as√≠, ejecutamos la funci√≥n correspondiente en nuestro c√≥digo Python.
4.  **Agente -> LLM**: Enviamos el resultado de la funci√≥n de vuelta al LLM en un nuevo mensaje con `role="tool"`.
5.  **LLM -> Usuario**: El LLM, ahora con la informaci√≥n de la herramienta, genera la respuesta final en lenguaje natural.

In [4]:
def run_agent_with_function_calling(user_query, client, tools_definition):
    if not client:
        return "Cliente no inicializado."

    # Mapeo de nombres de funci√≥n a las funciones de Python reales
    available_tools = {
        "get_wikipedia_summary": get_wikipedia_summary,
    }

    messages = [{"role": "user", "content": user_query}]
    
    print(f"--- üöÄ Iniciando agente para la consulta: '{user_query}' ---")

    # Primera llamada al modelo
    response = client.chat.completions.create(
        model="gpt-4o",
        messages=messages,
        tools=tools_definition, # Aqu√≠ pasamos la definici√≥n de las herramientas
        tool_choice="auto",  # El modelo decide si usar una herramienta o no
    )

    response_message = response.choices[0].message
    messages.append(response_message) # A√±adir la respuesta del LLM al historial

    # Comprobar si el modelo quiere llamar a una funci√≥n
    if response_message.tool_calls:
        print("ü§ñ El modelo ha decidido usar una herramienta...")
        for tool_call in response_message.tool_calls:
            function_name = tool_call.function.name
            function_args = json.loads(tool_call.function.arguments)
            
            print(f"   - Herramienta: {function_name}")
            print(f"   - Argumentos: {function_args}")
            
            # Ejecutar la funci√≥n
            function_to_call = available_tools[function_name]
            function_response = function_to_call(**function_args)
            
            print(f"   - Resultado: {function_response}")
            
            # Enviar el resultado de vuelta al modelo
            messages.append(
                {
                    "tool_call_id": tool_call.id,
                    "role": "tool",
                    "name": function_name,
                    "content": function_response,
                }
            )
        
        # Segunda llamada al modelo, ahora con el resultado de la herramienta
        print("üß† El modelo est√° procesando el resultado de la herramienta...")
        second_response = client.chat.completions.create(
            model="gpt-4o",
            messages=messages
        )
        return second_response.choices[0].message.content
    else:
        # Si el modelo no us√≥ una herramienta, devuelve su respuesta directamente
        print("‚úÖ El modelo ha respondido directamente.")
        return response_message.content

print("‚úÖ L√≥gica del agente con Function Calling definida.")

‚úÖ L√≥gica del agente con Function Calling definida.


### 4. Ejecuci√≥n del Agente

Probemos con una pregunta que claramente necesita conocimiento externo.

In [5]:
query = "¬øQui√©n fue Marie Curie y cu√°les fueron sus logros m√°s importantes?"
final_answer = run_agent_with_function_calling(query, client, tools_definition)

print(f"üèÅ Respuesta Final del Agente:{final_answer}")

--- üöÄ Iniciando agente para la consulta: '¬øQui√©n fue Marie Curie y cu√°les fueron sus logros m√°s importantes?' ---
ü§ñ El modelo ha decidido usar una herramienta...
   - Herramienta: get_wikipedia_summary
   - Argumentos: {'query': 'Marie Curie'}
   - Resultado: Maria Salomea Sk≈Çodowska-Curie,[A]‚Äã[B]‚Äã m√°s conocida como Marie Curie[C]‚Äã[B]‚Äã o Madame Curie (Varsovia, 7 de noviembre de 1867-Passy, 4 de julio de 1934), fue una f√≠sica y qu√≠mica de origen polaco. Pionera en el campo de la radiactividad, es la primera y √∫nica persona en recibir dos premios Nobel en distintas especialidades cient√≠ficas: F√≠sica y Qu√≠mica.[D]‚Äã Tambi√©n fue la primera mujer en ocupar el puesto de profesora en la Universidad de Par√≠s y la primera en recibir sepultura con honores en el Pante√≥n de Par√≠s por m√©ritos propios en 1995.[E]‚Äã
Naci√≥ en Varsovia, en lo que entonces era el Zarato de Polonia (territorio administrado por el Imperio ruso).
üß† El modelo est√° procesando el resulta

## Conclusiones

El uso de **Function Calling** nativo representa un salto cualitativo en la construcci√≥n de agentes. La comunicaci√≥n entre el LLM y nuestro c√≥digo es ahora mucho m√°s **robusta, predecible y f√°cil de depurar**.

Hemos eliminado la necesidad de crear prompts complejos para el formato ReAct y de parsear la salida del modelo. Sin embargo, todav√≠a gestionamos manualmente el estado de la conversaci√≥n (`messages`) y el flujo de llamadas.

En el pr√≥ximo notebook, introduciremos **LangChain**, un framework que abstrae esta l√≥gica y nos permite construir agentes a√∫n m√°s potentes con mucho menos c√≥digo.