**Métodos iniciales**

Ejecuta estas celdas antes de comenzar. Incluyen funciones clave y configuración necesaria para que el resto del notebook funcione correctamente.

In [7]:
from dotenv import load_dotenv
import os

load_dotenv()
     
if not os.getenv("OPENAI_API_KEY"):
    print("Error: La variable de entorno OPENAI_API_KEY no está definida.")

print("OPENAI_API_KEY cargada correctamente.")

OPENAI_API_KEY cargada correctamente.


In [3]:
import requests 

docs_url = 'https://github.com/alexeygrigorev/llm-rag-workshop/raw/main/notebooks/documents.json'
docs_response = requests.get(docs_url)
documents_raw = docs_response.json()

documents = []

for course in documents_raw:
    course_name = course['course']

    for doc in course['documents']:
        doc['course'] = course_name
        documents.append(doc)

In [4]:
from minsearch import AppendableIndex

index = AppendableIndex(
    text_fields=["question", "text", "section"],
    keyword_fields=["course"]
)

index.fit(documents)

<minsearch.append.AppendableIndex at 0x7f3c161caa50>

# Function calling

**Llamado a Funciones en OpenAI**

En versiones anteriores, toda la lógica necesaria debía incluirse directamente en el *prompt*.

Sin embargo, OpenAI y otros proveedores ahora ofrecen una API más flexible y poderosa para extender las capacidades del modelo con funcionalidades adicionales, como realizar búsquedas externas o consultar bases de datos.

🔗 [Documentación oficial sobre Function Calling](https://platform.openai.com/docs/guides/function-calling)

Esta funcionalidad se conoce como **"function calling"** (*llamado a funciones*): defines funciones que el modelo puede invocar según el contexto de la conversación. Si el modelo considera apropiado llamar a una función, devolverá una salida estructurada con los parámetros necesarios para su ejecución.

![image.png](attachment:fc9a03a5-0904-450c-8c0e-5146b35b3c43.png)

Por ejemplo, tomemos nuestra función de búsqueda:

In [5]:
def search(query):
    boost = {'question': 3.0, 'section': 0.5}

    results = index.search(
        query=query,
        filter_dict={'course': 'data-engineering-zoomcamp'},
        boost_dict=boost,
        num_results=5,
        output_ids=True
    )

    return results

Lo describimos de la siguiente manera:

In [6]:
search_tool = {
    "type": "function",
    "name": "search",
    "description": "Search the FAQ database",
    "parameters": {
        "type": "object",
        "properties": {
            "query": {
                "type": "string",
                "description": "Search query text to look up in the course FAQ."
            }
        },
        "required": ["query"],
        "additionalProperties": False
    }
}

Aquí tenemos:

- **name**: `search`  
- **description**: cuándo utilizarla  
- **parameters**: todos los argumentos que la función puede recibir y su descripción  

Para poder usar *function calling*, utilizaremos una API más reciente: la API de **"responses"** (no la de **"chat completions"** como antes):

In [8]:
import json
from openai import OpenAI

client = OpenAI()

In [9]:
question = "How do I do well in module 1?"

developer_prompt = """
You're a course teaching assistant. 
You're given a question from a course student and your task is to answer it.
""".strip()

tools = [search_tool]

chat_messages = [
    {"role": "developer", "content": developer_prompt},
    {"role": "user", "content": question}
]

response = client.responses.create(
    model='gpt-4o-mini',
    input=chat_messages,
    tools=tools
)

response.output

[ResponseFunctionToolCall(arguments='{"query":"module 1 tips"}', call_id='call_tCwz47xw0tsXVtrjBODdgcfF', name='search', type='function_call', id='fc_6890f5c7d458819cb39fba2573a348030ea34d1e14c7e400', status='completed')]

Si el modelo considera que se debe realizar una llamada a una función, nos lo indicará de la siguiente manera:
```
[ResponseFunctionToolCall(arguments='{"query":"How to do well in module 1"}', call_id='call_sgNsqrTNHeoCPQbTj0RxPNz5', name='search', type='function_call', id='fc_688ffe5ef64881a3a7b1235c5d12bb6d07999b626201318c', status='completed')]
```

Podemos saber el tipo, los argumentos que debemos pasar al metodo y el nombre del mismo:

In [10]:
response.output[0].type, response.output[0].arguments, response.output[0].name

('function_call', '{"query":"module 1 tips"}', 'search')

In [11]:
calls = response.output
call = calls[0]
call

ResponseFunctionToolCall(arguments='{"query":"module 1 tips"}', call_id='call_tCwz47xw0tsXVtrjBODdgcfF', name='search', type='function_call', id='fc_6890f5c7d458819cb39fba2573a348030ea34d1e14c7e400', status='completed')

In [12]:
call_id = call.call_id
call_id

'call_tCwz47xw0tsXVtrjBODdgcfF'

In [13]:
f_name = call.name
f_name

'search'

In [14]:
arguments = json.loads(call.arguments)
arguments, type(arguments)

({'query': 'module 1 tips'}, dict)

Hagamos una llamada a la función `search`.  
Usando `f_name`, podemos identificar la función que necesitamos ejecutar.

Para esto, utilizamos `f = globals()`, que nos permite acceder a todas las funciones definidas en el ámbito global como un diccionario.  
De esta forma, podemos obtener una referencia a la función con `f[f_name]` y luego ejecutarla pasando los argumentos necesarios.


In [15]:
f = globals()

In [17]:
# descomenta y ejecuta para ver todo lo que se obtiene
#f

In [18]:
type(f)

dict

In [19]:
f = f[f_name]
f

<function __main__.search(query)>

In [20]:
results = f(**arguments)

In [21]:
search_results = json.dumps(results, indent=2)
print(search_results)

[
  {
    "text": "Even after installing pyspark correctly on linux machine (VM ) as per course instructions, faced a module not found error in jupyter notebook .\nThe solution which worked for me(use following in jupyter notebook) :\n!pip install findspark\nimport findspark\nfindspark.init()\nThereafter , import pyspark and create spark contex<<t as usual\nNone of the solutions above worked for me till I ran !pip3 install pyspark instead !pip install pyspark.\nFilter based on conditions based on multiple columns\nfrom pyspark.sql.functions import col\nnew_final.filter((new_final.a_zone==\"Murray Hill\") & (new_final.b_zone==\"Midwood\")).show()\nKrishna Anand",
    "section": "Module 5: pyspark",
    "question": "Module Not Found Error in Jupyter Notebook .",
    "course": "data-engineering-zoomcamp",
    "_id": 322
  },
  {
    "text": "Following dbt with BigQuery on Docker readme.md, after `docker-compose build` and `docker-compose run dbt-bq-dtc init`, encountered error `ModuleNotF

Guardar tanto la respuesta como el resultado de la llamada a la función:

In [22]:
chat_messages.append(call)

chat_messages.append({
    "type": "function_call_output",
    "call_id": call.call_id,
    "output": search_results,
})

Ahora `chat_messages` contiene tanto la descripción de la llamada (para mantener el historial) como los resultados.

Vamos a hacer otra llamada al modelo:

In [23]:
len(chat_messages)

4

In [24]:
response = client.responses.create(
    model='gpt-4o-mini',
    input=chat_messages,
    tools=tools
)

Esta vez debería ser la respuesta `ResponseOutputMessage` (aunque también puede ser otra llamada `ResponseFunctionToolCall`):

In [25]:
response.output[0]

ResponseOutputMessage(id='msg_6890f61939a0819cb9e737f6b20d6d870ea34d1e14c7e400', content=[ResponseOutputText(annotations=[], text='To do well in Module 1, here are some key tips:\n\n1. **Understand the Basics**: Make sure you grasp the foundational concepts of Docker and Terraform, as they are critical in this module.\n\n2. **Hands-On Practice**: Engage with the practical exercises. Set up your local environment as instructed, and ensure you can run Docker and Terraform commands successfully.\n\n3. **Installation Issues**: If you encounter any installation issues (like `ModuleNotFoundError` for `psycopg2`), follow the troubleshooting steps:\n   - For `psycopg2`, try running:\n     ```bash\n     pip install psycopg2-binary\n     ```\n     If that fails, update your conda or pip, uninstall the package, and reinstall it.\n\n4. **Review the Documentation**: Familiarize yourself with the relevant documentation for Docker and Terraform to understand how they work under the hood.\n\n5. **Shar

In [26]:
r = response.output[0]

print(f"Pregunta: {question}")
print()
print(f"Respuesta:\n{r.content[0].text}")

Pregunta: How do I do well in module 1?

Respuesta:
To do well in Module 1, here are some key tips:

1. **Understand the Basics**: Make sure you grasp the foundational concepts of Docker and Terraform, as they are critical in this module.

2. **Hands-On Practice**: Engage with the practical exercises. Set up your local environment as instructed, and ensure you can run Docker and Terraform commands successfully.

3. **Installation Issues**: If you encounter any installation issues (like `ModuleNotFoundError` for `psycopg2`), follow the troubleshooting steps:
   - For `psycopg2`, try running:
     ```bash
     pip install psycopg2-binary
     ```
     If that fails, update your conda or pip, uninstall the package, and reinstall it.

4. **Review the Documentation**: Familiarize yourself with the relevant documentation for Docker and Terraform to understand how they work under the hood.

5. **Share and Collaborate**: Don’t hesitate to ask questions in forums or study groups. Engaging with 

**Realizando múltiples llamadas**

*¿Qué pasa si queremos hacer múltiples llamadas?*

**Cambio en el `developer_prompt` para permitir múltiples llamadas**

Antes, el prompt indicaba simplemente que el asistente debía responder a una única pregunta de un estudiante, enfocándose en una sola interacción.

```
You're a course teaching assistant. 
You're given a question from a course student and your task is to answer it.
```

Con el nuevo prompt, se añade la instrucción de que si el asistente necesita buscar algo en una FAQ, debe convertir la pregunta del estudiante en múltiples consultas.

```
You're a course teaching assistant. 
You're given a question from a course student and your task is to answer it.
If you look up something in FAQ, convert the student question into multiple queries.
```

**¿Cómo ayuda esto a hacer múltiples llamadas?**

- Al dividir la pregunta original en varias consultas específicas, el modelo genera múltiples solicitudes que pueden ser enviadas como llamadas separadas a la API.

- Esto permite manejar preguntas complejas o con varios subtemas de forma más eficiente y precisa.

- Cada llamada puede recuperar información diferente o complementar la respuesta, facilitando un flujo de trabajo dinámico basado en múltiples interacciones.

- Así, en lugar de una única llamada que intenta responder todo, se puede construir la respuesta final agregando los resultados de varias llamadas.

In [27]:
developer_prompt = """
You're a course teaching assistant. 
You're given a question from a course student and your task is to answer it.
If you look up something in FAQ, convert the student question into multiple queries.
""".strip()

chat_messages = [
    {"role": "developer", "content": developer_prompt},
    {"role": "user", "content": question}
]

In [28]:
response = client.responses.create(
    model='gpt-4o-mini',
    input=chat_messages,
    tools=tools
)

In [29]:
len(response.output), response.output

(2,
 [ResponseFunctionToolCall(arguments='{"query":"how to do well in module 1"}', call_id='call_mKYAzGVACFzaot9lLHEidivP', name='search', type='function_call', id='fc_6890f65b8ba48191b536e715650143730b115f90aeaf8511', status='completed'),
  ResponseFunctionToolCall(arguments='{"query":"tips for success in module 1"}', call_id='call_XxaQ4wi3jtwy4MCRYsd7tEwL', name='search', type='function_call', id='fc_6890f65be3948191944d17041490a5390b115f90aeaf8511', status='completed')])

Esta vez, vamos a comenzar a organizar un poco el código.

Primero, crea una función llamada `do_call`:

La función `do_call` ejecuta dinámicamente una función a partir de una llamada definida por el modelo (tool call). 

1. **Obtiene el nombre de la función** desde el objeto `tool_call_response`.
2. **Convierte los argumentos** (que vienen como cadena JSON) a un diccionario de Python.
3. **Busca la función en el entorno global** usando `globals()` y la ejecuta con los argumentos extraídos.
4. **Devuelve un diccionario** con el resultado de la ejecución, incluyendo el `call_id` original y la salida formateada en JSON.

Esto permite automatizar la ejecución de funciones solicitadas por el modelo, manteniendo trazabilidad de cada llamada.

In [30]:
def do_call(tool_call_response):
    function_name = tool_call_response.name
    arguments = json.loads(tool_call_response.arguments)

    f = globals()[function_name]
    result = f(**arguments)

    return {
        "type": "function_call_output",
        "call_id": tool_call_response.call_id,
        "output": json.dumps(result, indent=2),
    }

Ahora procesamos cada entrada en la salida del modelo.

**¿Qué hace el siguiente fragmento?**

- Recorre cada elemento generado por el modelo en su respuesta.
- Agrega cada entrada al historial de conversación (`chat_messages`) y muestra su tipo (por ejemplo, llamada a función o mensaje).
- Si la entrada es una llamada a función, se ejecuta con `do_call` y su resultado también se añade al historial.
- Si la entrada es un mensaje de texto, se imprime directamente.

Este flujo permite manejar tanto las respuestas del modelo como las llamadas a funciones, manteniendo el historial actualizado y listo para la siguiente interacción.

In [31]:
for entry in response.output:
    chat_messages.append(entry)
    print(entry.type)

    if entry.type == 'function_call':      
        result = do_call(entry)
        chat_messages.append(result)
    elif entry.type == 'message':
        print(entry.text)

function_call
function_call


Probablemente la primera llamada sea una llamada a función, así que hagamos otra más.

**¿Por qué hacer otra llamada?**

La primera interacción del modelo suele generar una llamada a función para obtener datos o realizar una acción específica. Una vez que esa función ha sido ejecutada y el resultado se ha agregado al historial (`chat_messages`), es necesario hacer una nueva llamada al modelo para que procese ese resultado y genere una respuesta completa o decida el siguiente paso (como continuar la conversación o hacer otra llamada).

Esto permite mantener un flujo interactivo y dinámico entre el modelo, las herramientas y el usuario.

In [32]:
response = client.responses.create(
    model='gpt-4o-mini',
    input=chat_messages,
    tools=tools
)

for entry in response.output:
    chat_messages.append(entry)
    print(entry.type)
    print()

    if entry.type == 'function_call':      
        result = do_call(entry)
        chat_messages.append(result)
    elif entry.type == 'message':
        print(entry.content[0].text) 

message

To excel in Module 1 of the course, consider the following tips:

1. **Understand the Course Structure**: Familiarize yourself with the module's content and objectives. This will help you identify key areas to focus on.

2. **Practice Coding**: Aim to write and run code regularly. Make use of Jupyter Notebook to test SQLAlchemy and Docker commands.

3. **Resolve Common Errors**:
   - If you encounter `ModuleNotFoundError: No module named 'psycopg2'`, install the module using:
     ```bash
     pip install psycopg2-binary
     ```
     Upgrade if necessary:
     ```bash
     pip install psycopg2-binary --upgrade
     ```

   - For the error `"TypeError: 'module' object is not callable"` when using SQLAlchemy, ensure you are using the correct connection string:
     ```python
     conn_string = "postgresql+psycopg://root:root@localhost:5432/ny_taxi"
     engine = create_engine(conn_string)
     ```

4. **Utilize Resources**: Look for provided materials such as documentation, vid

**Poniendo todo junto**

El prompt queda de la siguiente forma:

1. Uso estratégico de la FAQ:
   En lugar de simplemente sugerir consultar la FAQ si no se tiene suficiente conocimiento, ahora se instruye explícitamente al modelo a usarla como fuente secundaria cuando su conocimiento no es suficiente.

2. Exploración profunda del tema:
   Se añade una estrategia de búsqueda más avanzada. El modelo debe:
   - Hacer una primera consulta general a la FAQ.
   - Luego, basándose en los resultados obtenidos, realizar consultas adicionales para explorar el tema en mayor profundidad.
   Esto promueve un razonamiento iterativo y la obtención de respuestas más completas y precisas.

3. Pregunta de seguimiento al final:
   Cada respuesta debe finalizar con una pregunta de seguimiento relevante, fomentando una conversación más fluida, natural y centrada en el aprendizaje.  
   Esto no solo mejora la experiencia del usuario, sino que también ayuda a descubrir posibles dudas o temas relacionados.

In [33]:
developer_prompt = """
You're a course teaching assistant. 
You're given a question from a course student and your task is to answer it.

Use FAQ if your own knowledge is not sufficient to answer the question.
When using FAQ, perform deep topic exploration: make one request to FAQ,
and then based on the results, make more requests.

At the end of each response, ask the user a follow up question based on your answer.
""".strip()



chat_messages = [
    {"role": "developer", "content": developer_prompt},
]

Vamos a estructurar la lógica en dos bucles:

1. Bucle principal de preguntas y respuestas:
   Este ciclo espera una pregunta del usuario, la envía al modelo y gestiona el flujo general de la conversación. Si el usuario escribe `stop`, el ciclo se detiene.

2. Bucle de solicitudes al modelo:
   Una vez enviada una pregunta, este segundo ciclo se encarga de interactuar con la API de forma continua hasta obtener una respuesta final del modelo.  
   Si el modelo responde con una o varias llamadas a funciones (`function_call`), estas se ejecutan una por una y se agregan sus resultados al historial.  
   Luego, se vuelve a consultar al modelo con el historial actualizado, hasta que finalmente responde con un mensaje completo (texto para el usuario).

In [34]:
while True: # main Q&A loop
    question = input() # How do I do my best for module 1
    if question == 'stop':
        break

    message = {"role": "user", "content": question}
    chat_messages.append(message)

    while True: # request-response loop - query API till get a message
        response = client.responses.create(
            model='gpt-4o-mini',
            input=chat_messages,
            tools=tools
        )

        has_tool_calls = False
        
        for entry in response.output:
            chat_messages.append(entry)
        
            if entry.type == 'function_call':      
                print('function_call:', entry)
                print()
                result = do_call(entry)
                chat_messages.append(result)
                has_tool_calls = True

            elif entry.type == 'message':
                print(entry.content[0].text)
                print()

        if not has_tool_calls:
            break

 How do I do my best for module 1


function_call: ResponseFunctionToolCall(arguments='{"query":"best practices for module 1"}', call_id='call_sLt0ehYmjUCgxTC4yfAPbHzF', name='search', type='function_call', id='fc_6890f6b9a09c81a0b43d3313a36bde0e0b81fbc479147cc4', status='completed')

function_call: ResponseFunctionToolCall(arguments='{"query":"Module 1 Docker Terraform best practices"}', call_id='call_uAl0HLuhS6IxybjBgiVsMRNJ', name='search', type='function_call', id='fc_6890f6bad46081a0804f3f145702da2e0b81fbc479147cc4', status='completed')

To do your best in Module 1 of the course (focused on Docker and Terraform), here are some key practices and tips:

1. **Use Docker Efficiently**:
   - Store all your code in your default Linux distribution. This approach optimizes file system performance, especially if you’re using WSL2 on Windows 10 or 11.
   - Familiarize yourself with the [Docker Best Practices Documentation](https://docs.docker.com/develop/develop-images/dockerfile_best-practices/) for guidance on creating effi

 stop


Hagámoslo un poco más bonito usando HTML:

In [35]:
from IPython.display import display, HTML
import markdown

In [36]:
def shorten(text, max_length=50):
    if len(text) <= max_length:
        return text

    return text[:max_length - 3] + "..."

def display_function_call(entry, result):
    call_html = f"""
        <details>
        <summary>Function call: <tt>{entry.name}({shorten(entry.arguments)})</tt></summary>
        <div>
            <b>Call</b>
            <pre>{entry}</pre>
        </div>
        <div>
            <b>Output</b>
            <pre>{result['output']}</pre>
        </div>
        </details>
    """
    display(HTML(call_html))

**¿Qué hace la función `display_function_call`?**

Esta función genera una visualización interactiva en HTML para mostrar detalles de una llamada a función:

- **Muestra un resumen colapsable** con el nombre de la función y sus argumentos (acortados).
- **Dentro del panel desplegable**, presenta:
  - La llamada completa (`entry`) con todos sus datos.
  - El resultado de la ejecución (`result['output']`).
- Usa `display(HTML(...))` para renderizar el contenido en entornos como notebooks de Jupyter.


In [37]:
def display_response(entry):
    response_html = markdown.markdown(entry.content[0].text)
    html = f"""
        <div>
            <div><b>Assistant:</b></div>
            <div>{response_html}</div>
        </div>
    """
    display(HTML(html))

La función `display_response` recibe un objeto `entry` y realiza lo siguiente:

- Convierte el texto en formato Markdown contenido en `entry.content[0].text` a HTML usando la librería `markdown`.
- Construye un bloque HTML que incluye un título **Assistant:** y el contenido ya convertido a HTML.
- Muestra este bloque HTML en una celda de Jupyter Notebook (o entorno compatible) usando la función `display` de IPython.

In [38]:
chat_messages = [
    {"role": "developer", "content": developer_prompt},
]

# Chat loop
while True:
    question = input()    
    
    if question.strip().lower() == 'stop':
        print("Chat ended.")
        break

    message = {"role": "user", "content": question}
    chat_messages.append(message)

    while True:  # inner request loop
        response = client.responses.create(
            model='gpt-4o-mini',
            input=chat_messages,
            tools=tools
        )
        
        has_messages = False

        for entry in response.output:
            chat_messages.append(entry)

            if entry.type == "function_call":
                result = do_call(entry)
                chat_messages.append(result)
                display_function_call(entry, result)

            elif entry.type == "message":
                display_response(entry)
                has_messages = True

        if has_messages:
            break

 How do I do my best for module 1


 stop


Chat ended.


**Usando múltiples herramientas**

¿Qué pasa si también queremos usar esta aplicación de chat para agregar nuevas entradas a las preguntas frecuentes (FAQ)? Necesitaremos otra función para ello:


In [39]:
def add_entry(question, answer):
    doc = {
        'question': question,
        'text': answer,
        'section': 'user added',
        'course': 'data-engineering-zoomcamp'
    }
    index.append(doc)

In [40]:
add_entry_description = {
    "type": "function",
    "name": "add_entry",
    "description": "Add an entry to the FAQ database",
    "parameters": {
        "type": "object",
        "properties": {
            "question": {
                "type": "string",
                "description": "The question to be added to the FAQ database",
            },
            "answer": {
                "type": "string",
                "description": "The answer to the question",
            }
        },
        "required": ["question", "answer"],
        "additionalProperties": False
    }
}

In [46]:
tools = [search_tool, add_entry_description]
tools

[{'type': 'function',
  'name': 'search',
  'description': 'Search the FAQ database',
  'parameters': {'type': 'object',
   'properties': {'query': {'type': 'string',
     'description': 'Search query text to look up in the course FAQ.'}},
   'required': ['query'],
   'additionalProperties': False}},
 {'type': 'function',
  'name': 'add_entry',
  'description': 'Add an entry to the FAQ database',
  'parameters': {'type': 'object',
   'properties': {'question': {'type': 'string',
     'description': 'The question to be added to the FAQ database'},
    'answer': {'type': 'string', 'description': 'The answer to the question'}},
   'required': ['question', 'answer'],
   'additionalProperties': False}}]

In [47]:
chat_messages = [
    {"role": "developer", "content": developer_prompt},
]

while True:
    question = input()    
    
    if question.strip().lower() == 'stop':
        print("Chat ended.")
        break

    message = {"role": "user", "content": question}
    chat_messages.append(message)

    while True:
        response = client.responses.create(
            model='gpt-4o-mini',
            input=chat_messages,
            tools=tools
        )
        
        has_messages = False

        for entry in response.output:
            chat_messages.append(entry)

            if entry.type == "function_call":
                result = do_call(entry)
                chat_messages.append(result)
                display_function_call(entry, result)

            elif entry.type == "message":
                display_response(entry)
                has_messages = True

        if has_messages:
            break

 How do I do well in module 1?


 Add to FAQ


 stop


Chat ended.


**Alternativa**

Otra opción es **refactorizar el código para que sea más limpio y modular**, separando los métodos en un archivo independiente.  
Puedes consultar el resultado en [`chat_assistant.py`](./chat_assistant.py).

Tambien puedes descargarlo usando `wget`:

In [None]:
! wget https://raw.githubusercontent.com/alexeygrigorev/rag-agents-workshop/refs/heads/main/chat_assistant.py

**Aquí definimos múltiples clases:**

**`Tools` – Administra las funciones que el agente puede usar**
- `add_tool(function, description)`: Registra una función junto con su descripción.
- `get_tools()`: Devuelve una lista de las descripciones de funciones registradas.
- `function_call(tool_call_response)`: Ejecuta una llamada a función y devuelve el resultado.

**`ChatInterface` – Maneja la entrada del usuario y el formato de salida**
- `input()`: Obtiene la entrada del usuario.
- `display(message)`: Muestra un mensaje por consola.
- `display_function_call(entry, result)`: Muestra las llamadas a funciones en formato HTML.
- `display_response(entry)`: Muestra las respuestas del asistente en Markdown.

**`ChatAssistant` – Orquestador principal de la conversación**
- `__init__(tools, developer_prompt, chat_interface, client)`: Inicializa el asistente.
- `gpt(chat_messages)`: Realiza llamadas a la API de OpenAI.
- `run()`: Bucle principal del chat que maneja entradas del usuario y respuestas del asistente.


In [48]:
import chat_assistant

tools = chat_assistant.Tools()
tools.add_tool(search, search_tool)

tools.get_tools()

[{'type': 'function',
  'name': 'search',
  'description': 'Search the FAQ database',
  'parameters': {'type': 'object',
   'properties': {'query': {'type': 'string',
     'description': 'Search query text to look up in the course FAQ.'}},
   'required': ['query'],
   'additionalProperties': False}}]

In [49]:
developer_prompt = """
You're a course teaching assistant. 
You're given a question from a course student and your task is to answer it.

Use FAQ if your own knowledge is not sufficient to answer the question.

At the end of each response, ask the user a follow up question based on your answer.
""".strip()

chat_interface = chat_assistant.ChatInterface()

chat = chat_assistant.ChatAssistant(
    tools=tools,
    developer_prompt=developer_prompt,
    chat_interface=chat_interface,
    client=client
)

In [50]:
chat.run()

You: How do I do my best for module 1?


You: stop


Chat ended.


Para que el asistente pueda realizar una nueva acción (por ejemplo, **agregar entradas a una FAQ**), debemos registrar una nueva función utilizando el método `add_tool()` de la clase `Tools`.

In [51]:
tools.add_tool(add_entry, add_entry_description)
tools.get_tools()

[{'type': 'function',
  'name': 'search',
  'description': 'Search the FAQ database',
  'parameters': {'type': 'object',
   'properties': {'query': {'type': 'string',
     'description': 'Search query text to look up in the course FAQ.'}},
   'required': ['query'],
   'additionalProperties': False}},
 {'type': 'function',
  'name': 'add_entry',
  'description': 'Add an entry to the FAQ database',
  'parameters': {'type': 'object',
   'properties': {'question': {'type': 'string',
     'description': 'The question to be added to the FAQ database'},
    'answer': {'type': 'string', 'description': 'The answer to the question'}},
   'required': ['question', 'answer'],
   'additionalProperties': False}}]

In [52]:
chat.run()

You: How do I do my best for module 1?


You: Add entry


You: stop


Chat ended.


In [53]:
index.docs[-1]

{'question': 'How do I do my best for module 1?',
 'text': 'To excel in Module 1, understand Docker fundamentals, optimize file system performance by storing code in your Linux distribution, check for required Python modules like psycopg2, practice hands-on exercises, and engage in discussions for clarification.',
 'section': 'user added',
 'course': 'data-engineering-zoomcamp'}