# La Api de OpenAI.
```{index} assistants
```
Los assistants de OpenAI representan una revoluci√≥n en la integraci√≥n de inteligencia artificial personalizada y conversacional en aplicaciones y servicios. Son agentes que utilizan modelos de lenguaje avanzados, como GPT-4 Turbo, para automatizar tareas, interactuar con usuarios en lenguaje natural y ejecutar funciones adaptadas seg√∫n las necesidades espec√≠ficas del contexto.

## ¬øQu√© son los OpenAI Assistants?
Un OpenAI Assistant es un agente digital configurable que utiliza modelos de lenguaje entrenados con grandes cantidades de datos para responder preguntas, ejecutar funciones, analizar informaci√≥n y brindar asistencia en una amplia variedad de tareas. Estos asistentes se configuran a trav√©s de instrucciones (que definen personalidad y comportamiento), conjuntos de datos personalizados, y funciones programadas por el desarrollador.

Los asistentes son inteligencias artificiales generativas dise√±adas para prop√≥sitos espec√≠ficos, utilizando los modelos de OpenAI (como GPT-4 y GPT-3.5, etc.). Estos asistentes tienen acceso a archivos, pueden mantener el contexto de la conversaci√≥n (historial) y pueden usar herramientas especializadas.

## Caracter√≠sticas principales
**Personalizaci√≥n:** Es posible definir el comportamiento y personalidad del asistente mediante instrucciones precisas, as√≠ como entrenarlo con datos propios (PDFs, art√≠culos, bases de datos, etc.).

**Funci√≥n de llamada:** Los assistants pueden integrarse con funciones externas y APIs para acceder a informaci√≥n en tiempo real, automatizar c√°lculos o interactuar con otros servicios digitales.

**Gesti√≥n de datos:** Capaces de procesar tanto datos estructurados (JSON, hojas de c√°lculo) como no estructurados (texto libre, documentos), extrayendo y transformando informaci√≥n relevante.

**Escalabilidad:** La infraestructura de OpenAI permite atender miles de usuarios en simult√°neo sin perder calidad en las respuestas.

**Aprendizaje continuo:** Gracias a su naturaleza de entrenamiento, los assistants pueden mejorar su precisi√≥n y relevancia conforme reciben nuevos datos o retroalimentaci√≥n.

## Ventajas de utilizar OpenAI Assistants
**Automatizaci√≥n y productividad:** Permiten gestionar tareas repetitivas, asistir en proyectos, analizar grandes vol√∫menes de datos y mejorar la atenci√≥n al cliente.

**Accesibilidad y apertura:** El enfoque suele ser abierto para desarrolladores, lo que facilita la colaboraci√≥n, la creaci√≥n de asistentes especializados y la r√°pida evoluci√≥n tecnol√≥gica.

**Integraci√≥n sencilla:** Herramientas y APIs modernas permiten que los asistentes se integren f√°cilmente en aplicaciones web, equipos de trabajo y sistemas empresariales.

Es de advertir que tal y como figura en su p√°gina oficial, en el momento de redactar este documento, esta api est√° *deprecated* y dejar√° de estar disponible el 26 de agosto de 2026, siendo sustituida por la api de *responses*. 

A pesar de todo esto se ha cre√≠do conveniente proceder a presentar esta las dos API's, con la finalidad de que el lector sepa de donde estamos y cuales ser√°n los nuevos cambios hacia la nueva API.


En la siguiente imagen mostramos una visualizaci√≥n que detalla c√≥mo esta compuesta esta API. 


![](fig/esquema.PNG/)

En esa figura, observamos los siguientes componentes que pueden configurar el assitants de OpenAi:

* Los modelos LLM, que puede ser cualquiera de los modelos que tiene OpenAi, en esta caso se hace referencia a los modelos GPT 4 √≥ GPT 3.5 turbo.

* Un asistente va a tener un identificador (Id) que es √∫nico para cada asistente, un nombre, una descripci√≥n e instrucciones.

* Herramientas o Tools. Las mas importantes son las de recuperaci√≥n (retrieval), interprete de C√≥digo (para trabajar c√≥digo python) y la llamada a funciones.

* Los Thread o hilos de conversaciones. Cada hilo viene a ser una sesion conversaci√≥n con un usuario. En cada hilo se guarda los promts del usuario y las respuestas correspondientes del asistente

* Los Run son los engranajes entre los asistentes y los thread.


A continuaci√≥n vamos a mostrar un ejemplo de c√≥mo podemos crear un asistente con la herramienta de retrieval.



In [None]:
#!pip install --upgrade openai

In [4]:
# de esta forma obtenemos los resultados de forma m√°s est√©tica
from pprint import pprint
# importamos JSON para poder trabajar con este tipo de datos
import json
# importamos el paqute de openai
from openai import OpenAI
import time

## Ficheros de configuraci√≥n de claves API

A continuaci√≥n, lo que hacemos es recuperar la clave API de OpenAI, pero para no mostrarla aqu√≠ utilizaremos una t√©cnica muy extendida entre los desarrolladores de Python, que consiste en generar un fichero denominado .env y que haciendo una peque√±a digresi√≥n del tema central de este documento consiste en lo siguiente:
Un archivo .env en Python es un archivo de texto plano que almacena variables de entorno, como contrase√±as o claves API, para mantener la informaci√≥n sensible fuera del c√≥digo fuente y del repositorio de control de versiones. Se utiliza con la biblioteca python-dotenv, la cual carga estos pares clave-valor en el entorno de ejecuci√≥n de la aplicaci√≥n. Para usarlo, se instala la biblioteca, se crea un archivo .env con las variables, y luego se utiliza os.getenv() para acceder a ellas en el c√≥digo de Python. 

```{index} .env, ficheros de claves
```
### ¬øPara qu√© se usan los archivos .env?

* **Seguridad**: Permiten mantener informaci√≥n confidencial, como credenciales de bases de datos o claves de API, separada del c√≥digo fuente, evitando que se exponga accidentalmente.
  
* **Configuraci√≥n**: Facilitan la gesti√≥n de diferentes configuraciones para distintos entornos (desarrollo, pruebas, producci√≥n) sin tener que modificar el c√≥digo.

  
* **Buenas pr√°cticas**: Es una pr√°ctica recomendada para separar los datos de configuraci√≥n del c√≥digo, lo que hace el proyecto m√°s limpio y seguro.

### ¬øC√≥mo se usan en Python?.

Primero instalamos la biblioteca:

``` Python
    pip install python-dotenv
```

Se crea un archivo denominado .env enla ra√≠z del proyecto y se a√±aden las variables de entorno en formato CLAVE = VALOR, por ejemplo:

```{note}
    API_KEY=tu_clave_secreta
    DATABASE_URL=postgresql://usuario:contrase√±a@host:puerto/db
```
 Y ahora ya podemos cargar y usar las variables de entorno en el c√≥digo de la siguiente manera:

 ```Python
    import os
    from dotenv import load_dotenv

    # Carga las variables del archivo .env en el entorno
    load_dotenv()

    # Accede a las variables con os.getenv()
    api_key = os.getenv("API_KEY")
    db_url = os.getenv("DATABASE_URL")

    print(f"La API Key es: {api_key}")
    print(f"La URL de la base de datos es: {db_url}")
```

In [5]:
import os
from dotenv import load_dotenv
load_dotenv()
openai_key = os.getenv("openai_key")

In [6]:
# Si queremos ver la api key
#print(openai_key)

In [7]:
# Creamos el cliente de OpenAI
client = OpenAI(
api_key = openai_key
)

In [None]:
# paso 2: Cargar archivos que nuestro asistente necesita para el tipo retrieval
# pueden ser de tipo .pdf, excel, worf, etc
#El tama√±o m√°ximo del archivo debe ser 512 MB
# m√°ximo almacenamiento 100 GB
# Cargamos un peque√±o fichero .pdf que se encuenta en : https://www.semfyc.es/storage/wp-content/uploads/2021/12/02_Unidad_2020-8.pdf
# El contenido del fichero es el dolor de o√≠dos en personas adultas 
file = client.files.create(
    file = open("oidos.pdf","rb"),
    purpose = 'assistants'
)

# imprimimos el identificador del fichero
print(f"El identificador del fichero es:{file.id}")

Este identificador tambi√©n lo podemos ver en el *playground de OpenAI* (https://platform.openai.com/chat/edit?models=gpt-5) en el men√∫ denominado: *Storage*.

![](fig/Playground.PNG)

In [None]:
file

In [None]:
# creamos un asistente sin vector_stores

assistant = client.beta.assistants.create(
    name="Mi Assistant",
    instructions="Eres un otorrino de mucho prestigio y con grandes conocimientos sobre el funcionamiento del o√≠do",
    model="gpt-4-turbo",
    tools=[{"type": "file_search"}]
)

In [None]:
# 3. Crear thread con archivo adjunto
thread = client.beta.threads.create(
    messages=[
        {
            "role": "user", 
            "content": "¬øCu√°les son los puntos principales de este documento?",
            "attachments": [
                {
                    "file_id": file.id,
                    "tools": [{"type": "file_search"}]
                }
            ]
        }
    ]
)

In [None]:
# 4. Ejecutar 
run = client.beta.threads.runs.create(
    thread_id=thread.id,
    assistant_id=assistant.id
)

In [None]:
run

In [None]:
print(f"Run creado: {run.id}")
print(f"Estado inicial: {run.status}")

In [None]:
# 1. ESPERAR A QUE TERMINE LA EJECUCI√ìN
while run.status in ['queued', 'in_progress', 'cancelling']:
    time.sleep(1)  # Esperar 1 segundo
    run = client.beta.threads.runs.retrieve(
        thread_id=thread.id,
        run_id=run.id
    )
    print(f"Estado actual: {run.status}")

In [None]:

# 1. ESPERAR A QUE TERMINE LA EJECUCI√ìN
while run.status in ['queued', 'in_progress', 'cancelling']:
    time.sleep(1)  # Esperar 1 segundo
    run = client.beta.threads.runs.retrieve(
        thread_id=thread.id,
        run_id=run.id
    )
    print(f"Estado actual: {run.status}")

# 2. VERIFICAR SI COMPLET√ì EXITOSAMENTE
if run.status == 'completed':
    print("‚úÖ Ejecuci√≥n completada")
    
    # 3. OBTENER TODOS LOS MENSAJES DEL THREAD
    messages = client.beta.threads.messages.list(
        thread_id=thread.id,
        order="asc"  # Del m√°s antiguo al m√°s reciente
    )
    
    # 4. EXTRAER LA RESPUESTA DEL ASSISTANT
    print("\n" + "="*50)
    print("RESPUESTA DEL ASSISTANT:")
    print("="*50)
    
    # El √∫ltimo mensaje ser√° la respuesta del assistant
    last_message = messages.data[-1]  # √öltimo mensaje
    
    if last_message.role == 'assistant':
        # Extraer el texto de la respuesta
        respuesta_texto = last_message.content[0].text.value
        print(respuesta_texto)
        
        # 5. OBTENER CITAS Y ANOTACIONES (si las hay)
        annotations = last_message.content[0].text.annotations
        
        if annotations:
            print("\n" + "="*30)
            print("CITAS Y REFERENCIAS:")
            print("="*30)
            
            for i, annotation in enumerate(annotations):
                if hasattr(annotation, 'file_citation'):
                    citation = annotation.file_citation
                    print(f"Cita {i+1}: {citation.quote}")
                    print(f"Archivo ID: {citation.file_id}")
                elif hasattr(annotation, 'file_path'):
                    file_path = annotation.file_path
                    print(f"Archivo referenciado {i+1}: {file_path.file_id}")
    
elif run.status == 'failed':
    print(f"‚ùå Error en la ejecuci√≥n: {run.last_error}")
    
elif run.status == 'requires_action':
    print("‚ö†Ô∏è Requiere acci√≥n adicional")
    print(f"Acci√≥n requerida: {run.required_action}")

else:
    print(f"Estado inesperado: {run.status}")


In [None]:
# Ahora borramos el fichero que hemos almacenado anteriormente, al fin de no incurrir en costos por el almacenamiento
client.files.delete(file.id)

## Llamadas a funciones.

Ya hemos visto antes que otra de las herramientas que se pueden utilizar con los assistents, son las llamadas a funciones, cuya documentaci√≥n la podemos encontrar en el siguiente enlace:

https://platform.openai.com/docs/guides/function-calling



In [None]:
# cramos nestra primera funci√≥n
# NOMBRE-DESCRPCI√ìN-PAR√ÅMETROS
sendEmail = {
    "name" : "sendEmail",
    "description":"The function allows us to send email by specifying an email address and the title and descrption of the email.",
    "parameters":{
        "type": "object",
        "properties":{
            "email": {
                "type":"string",
                "description":"Email address of the receiver"
            },
            "subject":{
                "type":"string",
                "description": "Subject of the email"
            },
            "textBody":{
                "type":"string",
                "description":"Body of the email"
            }
        },
         "required":["email","subject","textBody"]
    }
}


In [None]:
# creamos la segunda funci√≥n
getCurrentWeather ={
    "name":"getCurrentWeather",
    "description": "Get the weather in location",
    "parameters" :{
        "type": "object",
        "properties":{
            "location": {"type":"string","description":"The city and e.g. San Francisco , CA"},
            "unit":{"type":"string","enum":["c","f"]}
        },
        "required": ["location"]
    }
}


In [None]:
# creamos el asistente
assistant = client.beta.assistants.create(
    name="Chatbot que responde a las preguntas del cliente",
    instructions="Eres un chatbot de la Peluqueria LLM Master  y te has especializado en enviar emails. Usa tu concimiento para responder a las preguntas del usuario",
    model = "gpt-3.5-turbo-1106",
    tools = [
        ({'type':'function','function': sendEmail}),
        ({'type':'function','function': getCurrentWeather})
    ]
)

print(assistant.id)


In [None]:
# creamos el hilo
thread = client.beta.threads.create()
print(thread.id)

In [None]:
# creamos el primer mensaje del usuario y lo pasamos al hilo
message = client.beta.threads.messages.create(
    thread_id = thread.id,
    role = "user",
    content ="que tiempo hace en Madrid?"
)

In [None]:
# ejecutamos el asistente para obtener la respuesta
run= client.beta.threads.runs.create(
    thread_id = thread.id,
        assistant_id = assistant.id
)

print(run.id)

In [None]:
# Recupera el estado de ejecuci√≥n (aqui vemos que require_action)
# Esto le est√° diciendo al modelo, que necesita informaci√≥n de nuestra funci√≥n
# es decir, que necesitamos llamar a una funci√≥n que permita enviar el email
run = client.beta.threads.runs.retrieve(
    thread_id = thread.id,
    run_id=run.id
)

print(run.status)

In [None]:
# como obtenemos requires_action entonces tenemos que llamar a una funci√≥n
# ejemplo una llamada a una api para enciar un mail, titulo y descripci√≥n
# Ejemplo: Una llamada a un api para obtener la temperatura de Madrid

## tools_to_call= a qu√© funci√≥n tenemos que llamar
tools_to_call = run.required_action.submit_tool_outputs.tool_calls
print(len(tools_to_call)) # cuantas llamadas tengoq ue hacer, imaginate que es m√°s de una
print(tools_to_call)


## Interprete de c√≥digo.

Recordar que esta es otra de las herramientas de los asistentes, seg√∫n hemos visto al comienzo de este tema. Esta herramienta permite escribir y ejecutar c√≥digo en python en un entorno seguro y aislado. Este entorno es capaz de procesar archivos de diversos formatos, generar resultados en tiempo real y crear im√°genes de gr√°ficos.
Veamos a continuaci√≥n c√≥mo funciona este interprete de c√≥digo.

In [None]:
# suponemos que ya hemos creado el ciente 

In [None]:
assistant = client.beta.assistants.create(
    name = "profesor matem√°ticas",
    instructions = "Eres un chatbot especializado en resolver problemas matem√°ticos. Escribe y ejecuta c√≥digo para responder las preguntas de matem√°ticas",
    model = "gpt-3.5-turbo-1106",
    tools =[({'type':'code_interpreter'})]
)

print(assistant.id)

In [None]:
#creamos el hilo
thread = client.beta.threads.create()
print(thread.id)

In [None]:
# creamos el primer mensaje del usuario y lo pasamos al hilo
message = client.beta.threads.messages.create(
    thread_id=thread.id,
    role = "user",
    content="tengo el siguiente problema matem√°tico '5x+5=10'. ¬øcual es el valor de x?"
)

In [None]:
# ejecutamos el asistente para obtener la respuesta
run = client.beta.threads.runs.create(
    thread_id=thread.id,
    assistant_id=assistant.id
)

print(run.id)

In [None]:
# leemos los mensaje
messages = client.beta.threads.messages.list(
    thread_id=thread.id
)

with open("messages.json","w") as f:
    messages_json = messages.model_dump()
    json.dump(messages_json,f,indent=4)

print("Ver conversaci√≥n:")
for message in messages.data:
    pprint(message.role+": "+message.content[0].text.value)

# Responses.

Como ya se ha dicho anteriormente, la API de asistentes quedar√° obsoleta a partir del 26  de agosto de 2026, y ser√° sustituida por la API de Responses. Para ayuda de la migraci√≥n, OpenAi ha creado la p√°gina siguiente:

https://platform.openai.com/docs/assistants/migration

La equivalencia entre una API y la otra se puede ver en el siguiente cuadro:

![](fig/cambios.PNG)

En lo que sigue vamos a hacer una introducci√≥n a esta nueva API denominada **Responses**. Para seguir con este c√≥digo, vamos a suponer que ya tenemos creado el objeto client como se ha hecho al comienzo de este documento. Comenzamos con un ejemplo bien sencillo para hacer una introducci√≥n a este elemento.

In [None]:
from openai import OpenAI

In [None]:
response = client.responses.create(
    model ="gpt-4o-mini",
    input="Dime algo sobre la historia de Valladolid"
)

Lo que se devuelve es un objeto de tipo JSON, cuyo contenido se ve a continuaci√≥n.

In [None]:
pprint(response)

Para obtener el contenido e la respuesta devuelta, lo podemos hace dela siguiente manera:

In [None]:
response.output[0].content[0].text

## Persistencia entre conversaciones.
```{index} Responses, Conversation
```
La API de Responses de OpenAI puede utilizarse con objetos **conversation** para mantener el estado de conversaci√≥n de manera persistente. Aqu√≠ te proporciono un ejemplo completo de c√≥mo utilizarla:

In [None]:
from openai import OpenAI

# 1. Crear un objeto conversation
conversation = client.conversations.create()

# 2. Primera respuesta usando el conversation
response = client.responses.create(
    model="gpt-4o-mini",
    input=[{"role": "user", "content": "¬øCu√°les son los 5 Ds del dodgeball?"}],
    conversation=conversation.id
)

print(f"Primera respuesta: {response.output_text}")

# 3. Segunda respuesta usando la misma conversation
# El contexto se mantiene autom√°ticamente
second_response = client.responses.create(
    model="gpt-4o-mini",
    input=[{"role": "user", "content": "¬øPuedes explicar el √∫ltimo D?"}],
    conversation=conversation.id
)

print(f"Segunda respuesta: {second_response.output_text}")


:::{note}
* La API de Responses la podemos encontrar en el siguiente enlace:

https://platform.openai.com/docs/api-reference/responses/create

* La API de conversation la podemos encontrar en la siguiente direcci√≥n:

https://platform.openai.com/docs/api-reference/conversations/create

* El mantenimiento del estado de una conversaci√≥n lo podemos encontrar en el siguiente enlace

https://platform.openai.com/docs/guides/conversation-state?api-mode=responses 

:::

Un ejemplo similar, pero con gesti√≥n manual del historial es el siguiente:

In [None]:
from openai import OpenAI

#client = OpenAI()

# Mantener historial manualmente
history = [
    {"role": "user", "content": "cu√©ntame un chiste"}
]

response = client.responses.create(
    model="gpt-4o-mini",
    input=history,
    store=False
)

print(f"Chiste: {response.output_text}")

# Agregar la respuesta al historial
history += [{"role": el.role, "content": el.content} for el in response.output]
history.append({"role": "user", "content": "explica por qu√© es gracioso"})

second_response = client.responses.create(
    model="gpt-4o-mini",
    input=history,
    store=False
)

print(f"Explicaci√≥n: {second_response.output_text}")


Se puede conseguir un efecto similar utilizando el par√°metro *previous_response_id*. Veamos un ejemplo:

In [None]:
from openai import OpenAI

#client = OpenAI()

# Primera respuesta
response = client.responses.create(
    model="gpt-4o-mini",
    input="cu√©ntame un chiste",
    store=True
)

print(f"Chiste: {response.output_text}")

# Segunda respuesta enlazada
second_response = client.responses.create(
    model="gpt-4o-mini",
    previous_response_id=response.id,
    input=[{"role": "user", "content": "explica por qu√© es gracioso"}],
    store=True
)

print(f"Explicaci√≥n: {second_response.output_text}")


**Ventajas del objeto conversation:**

El objeto conversation ofrece varias ventajas :

Persistencia: Mantiene el estado a trav√©s de sesiones, dispositivos o trabajos

Identificador durable: Cada conversaci√≥n tiene un ID √∫nico persistente

Gesti√≥n autom√°tica: No necesitas manejar manualmente el historial de mensajes

Sin l√≠mite de 30 d√≠as: A diferencia de las respuestas individuales, las conversaciones no tienen TTL

**Consideraciones importantes**:

Las respuestas individuales se guardan por 30 d√≠as por defecto

Todos los tokens de entrada previos en la cadena se facturan como tokens de entrada

Las conversaciones almacenan items que pueden ser mensajes, llamadas a herramientas y otros datos

OpenAI no utiliza datos enviados v√≠a API para entrenar modelos sin consentimiento expl√≠cito

El **m√©todo m√°s recomendado** es usar el objeto conversation ya que simplifica significativamente la gesti√≥n del estado y proporciona persistencia a largo plazo.


## La API de Files.

Existe tambi√©n esta API para poder almacenar ficheros con los que se va a trabajar en OpenAi (tenr en cuenta que mantener estos ficheros tiene un coste). La documentaci√≥n de esta API se puede encontrar en el siguiente enlace:

https://platform.openai.com/docs/api-reference/files/create

Existen diferentes posibilidades qur ofrece esta API, como subir ficheros, recuperarlos, borrarlos,etc. Vamos a generar ahora un ejemplo de como subir un fichero:

In [None]:
from openai import OpenAI
client = OpenAI()

file = client.files.create(
  file=open("oidos.pdf", "rb"),
  purpose="assistants",
  expires_after={
    "anchor": "created_at",
    "seconds": 4000
  }
)

In [None]:
# Veamos los ficheros existente:
client.files.list()

Como ya hemos indicado en un apartado anterior, podemos ver el fichero en el dashboard de OpenAi y alli borrarrlo, pero otra forma de hacer esto es la siguiente:

In [None]:
client.files.delete(file.id)

## Vector store.

Un ‚Äúvector store‚Äù en OpenAI es un almac√©n de informaci√≥n dise√±ado para b√∫squeda sem√°ntica y recuperaci√≥n aumentada por recuperaci√≥n (RAG), donde los documentos se dividen en fragmentos, se convierten en incrustaciones vectoriales y se indexan para consultas por similitud, de modo que un asistente pueda responder con precisi√≥n citando y recuperando los trozos m√°s relevantes de los archivos adjuntos.

En la pr√°ctica, un objeto vector store act√∫a como contenedor de archivos procesados para b√∫squeda: al a√±adir un archivo, se parsea, se trocea en chunks, se generan embeddings y se guarda en un √≠ndice que soporta coincidencias por palabras clave y por sem√°ntica, lo que permite recuperar pasajes relevantes dado un prompt o pregunta.

Estos almacenes pueden vincularse a asistentes o a conversaciones, habilitando la herramienta de b√∫squeda de archivos para que el modelo consulte directamente los propios datos; al adjuntarlo, las respuestas del agente pueden fundamentarse en los documentos, mejorando precisi√≥n y trazabilidad.

Flujo t√≠pico:
- Ingesta: crear el vector store y subir uno o varios archivos; la plataforma gestiona el an√°lisis, chunking y embeddings de forma as√≠ncrona, con estado visible en contadores de ingesta.
- Consulta: la pregunta del usuario se convierte en vector y se ejecuta una b√∫squeda por similitud (p. ej., distancia coseno) sobre los chunks, devolviendo los m√°s relevantes para que el modelo los use como contexto.
- Gesti√≥n: se pueden a√±adir o eliminar archivos individualmente o por lotes (hasta 500 por batch), y hay l√≠mites como tama√±o m√°ximo por archivo (512 MB) y tope de tokens por archivo.

Casos de uso comunes:
- B√∫squeda sem√°ntica y FAQ sobre documentaci√≥n t√©cnica o bases de conocimiento internas.
- Asistentes de soporte que responden con fragmentos de manuales o pol√≠ticas adjuntas al vector store.
- Recomendaci√≥n, clustering y clasificaci√≥n basados en proximidad sem√°ntica de embeddings.

Detalles operativos relevantes:
- Adjuntar un vector store otorga capacidad de ‚Äúfile search‚Äù al asistente o al hilo, normalmente con un √∫nico vector store por asistente/hilo para control de √°mbito.
- La ingesta es as√≠ncrona; los SDK proporcionan utilidades ‚Äúcreate and poll‚Äù para esperar a que finalice antes de consultar.
- Existen endpoints y objetos espec√≠ficos para archivos y lotes de archivos dentro del vector store, con propiedades para auditar el estado y conteos de items procesados.

En resumen, los objetos vector store son la pieza nativa de OpenAI para convertir archivos en contexto consultable mediante embeddings y similitud, permitiendo construir agentes y flujos RAG sin desplegar una base vectorial externa.

El API de estos elementos se puede encontrar en este enlace:

https://platform.openai.com/docs/api-reference/vector-stores/create

 continuaci√≥n se muestran algunos ejemplos de c√≥mo poder utilizar estos elementos:

 ### Creaci√≥n de Vector Store

 ```python
from openai import OpenAI

client = OpenAI()

# Crear un nuevo vector store
vector_store = client.beta.vector_stores.create(
    name="Mi Base de Conocimientos",
    expires_after={
        "anchor": "last_active_at",
        "days": 7
    }
)

print(f"Vector Store creado con ID: {vector_store.id}")

```

### Subida de archivos.

```python
# Subir archivos uno por uno
file = client.files.create(
    file=open("documento.pdf", "rb"),
    purpose="assistants"
)

# A√±adir archivo al vector store
vector_store_file = client.beta.vector_stores.files.create(
    vector_store_id=vector_store.id,
    file_id=file.id
)

# Subida masiva (m√°s eficiente para m√∫ltiples archivos)
file_paths = ["doc1.pdf", "doc2.txt", "doc3.docx"]
file_streams = [open(path, "rb") for path in file_paths]

file_batch = client.beta.vector_stores.file_batches.upload_and_poll(
    vector_store_id=vector_store.id,
    files=file_streams
)

print(f"Batch procesado: {file_batch.status}")

```

### Gesti√≥n de estados.
```python
# Monitorear el progreso de procesamiento
import time

def wait_for_processing(vector_store_id):
    while True:
        vs = client.beta.vector_stores.retrieve(vector_store_id)
        print(f"Estado: {vs.status}")
        print(f"Archivos procesados: {vs.file_counts.completed}/{vs.file_counts.total}")
        
        if vs.status == "completed":
            break
        elif vs.status == "failed":
            raise Exception("Error en el procesamiento")
        
        time.sleep(2)

wait_for_processing(vector_store.id)

```

### Vinculaci√≥n con asistentes

```python
# Crear asistente con vector store
assistant = client.beta.assistants.create(
    name="Asistente Documentos",
    instructions="Responde bas√°ndote en los documentos adjuntos",
    model="gpt-4-turbo",
    tools=[{"type": "file_search"}],
    tool_resources={
        "file_search": {
            "vector_store_ids": [vector_store.id]
        }
    }
)

# O actualizar asistente existente
client.beta.assistants.update(
    assistant_id=assistant.id,
    tool_resources={
        "file_search": {
            "vector_store_ids": [vector_store.id]
        }
    }
)
```

### Consultas y b√∫squedas.

```python
# Crear hilo de conversaci√≥n
thread = client.beta.threads.create()

# Hacer pregunta que active la b√∫squeda
message = client.beta.threads.messages.create(
    thread_id=thread.id,
    role="user",
    content="¬øCu√°les son las pol√≠ticas de vacaciones seg√∫n la documentaci√≥n?"
)

# Ejecutar asistente
run = client.beta.threads.runs.create_and_poll(
    thread_id=thread.id,
    assistant_id=assistant.id
)

# Obtener respuesta
messages = client.beta.threads.messages.list(thread_id=thread.id)
print(messages.data[0].content[0].text.value)

```
### Administraci√≥n de archivos.
```python
# Listar archivos en el vector store
files = client.beta.vector_stores.files.list(
    vector_store_id=vector_store.id
)

for file in files.data:
    print(f"Archivo: {file.id}, Estado: {file.status}")

# Eliminar archivo espec√≠fico
client.beta.vector_stores.files.delete(
    vector_store_id=vector_store.id,
    file_id=file.id
)

# Obtener informaci√≥n detallada
file_info = client.beta.vector_stores.files.retrieve(
    vector_store_id=vector_store.id,
    file_id=file.id
)

```

### Gesti√≥n completa del ciclo de vida.

```python
class VectorStoreManager:
    def __init__(self, client):
        self.client = client
    
    def create_knowledge_base(self, name, documents):
        # Crear vector store
        vs = self.client.beta.vector_stores.create(name=name)
        
        # Subir documentos en lote
        file_streams = [open(doc, "rb") for doc in documents]
        batch = self.client.beta.vector_stores.file_batches.upload_and_poll(
            vector_store_id=vs.id,
            files=file_streams
        )
        
        # Cerrar streams
        for stream in file_streams:
            stream.close()
        
        return vs.id if batch.status == "completed" else None
    
    def cleanup_expired(self):
        # Listar todos los vector stores
        stores = self.client.beta.vector_stores.list()
        
        for store in stores.data:
            if store.status == "expired":
                self.client.beta.vector_stores.delete(store.id)
                print(f"Eliminado vector store expirado: {store.id}")

# Uso
manager = VectorStoreManager(client)
vs_id = manager.create_knowledge_base(
    "Pol√≠ticas Empresa", 
    ["politicas.pdf", "manual.docx", "procedimientos.txt"]
)

```

### Manejo de errores

```python
try:
    # Operaci√≥n con vector store
    result = client.beta.vector_stores.files.create(
        vector_store_id="vs_invalid",
        file_id="file_invalid"
    )
except Exception as e:
    if "not found" in str(e).lower():
        print("Vector store o archivo no encontrado")
    elif "limit" in str(e).lower():
        print("L√≠mite de archivos alcanzado")
    else:
        print(f"Error inesperado: {e}")

```

## Caso de uso con Responses.

En este apartado vamos a replicar el apartado anterior de leer un fichero y sacar informaci√≥n del mismo pero en este caso utilizando la API de Responses en lugar de assistant.

In [None]:
file = client.files.create(
    file = open("oidos.pdf","rb"),
    purpose = 'assistants'
)

# imprimimos el identificador del fichero
print(f"El identificador del fichero es:{file.id}")

In [None]:
response = client.responses.create(
    model="gpt-4o-mini",
    input=[
        {
            "role": "user",
            "content": [
                {
                    "type": "input_text",
                    "text": "¬øCu√°les son los puntos principales de este documento?"
                },
                {
                    "type": "input_file",
                    "file_id": file.id  # Aqu√≠ usas el file.id directamente
                }
            ]
        }
    ]
)

print(response)

In [None]:
# Borramos el objero response
response2 = client.responses.delete(response.id)
print(response2)

Ahora realizamos el mismo procedimiento pero utilizando un vector store

In [None]:
# 2. Crear vector store
vector_store = client.vector_stores.create(
    name="Documentos para an√°lisis"
)

# 3. Agregar archivo al vector store
client.vector_stores.files.create(
    vector_store_id=vector_store.id,
    file_id=file.id
)

# 4. Usar el Responses API con el vector store
response = client.responses.create(
    model="gpt-4o-mini",
    tools=[{
        "type": "file_search",
        "vector_store_ids": [vector_store.id],
        "max_num_results": 20
    }],
    input="¬øCu√°les son los puntos principales de este documento?",
)


In [None]:
print(response)

In [None]:
response.output[1].content[0].text

In [None]:
# borramos elobjeto response
# Borramos el objero response
response = client.responses.delete(response.id)
print(response)

In [None]:
# Veamos cuantos vector Store tenemos
vector_stores = client.vector_stores.list()
print(vector_stores)

Un codigo mas completo seria el siguiente:

In [None]:
from datetime import datetime

def listar_vector_stores():
    try:
        # Obtener la lista de vector stores
        vector_stores = client.vector_stores.list()
        
        if not vector_stores.data:
            print("No tienes vector stores creados.")
            return
        
        print(f"Encontrados {len(vector_stores.data)} vector stores:")
        print("=" * 80)
        
        for i, vs in enumerate(vector_stores.data, 1):
            # Convertir timestamp a fecha legible
            created_date = datetime.fromtimestamp(vs.created_at).strftime("%Y-%m-%d %H:%M:%S")
            
            print(f"{i}. Vector Store:")
            print(f"   ID: {vs.id}")
            print(f"   Nombre: {vs.name or 'Sin nombre'}")
            print(f"   Creado: {created_date}")
            print(f"   Estado: {vs.status}")
            print(f"   Archivos:")
            print(f"     - Total: {vs.file_counts.total}")
            print(f"     - En progreso: {vs.file_counts.in_progress}")
            print(f"     - Completados: {vs.file_counts.completed}")
            print(f"     - Fallidos: {vs.file_counts.failed}")
            print(f"     - Cancelados: {vs.file_counts.cancelled}")
            print(f"   Tama√±o: {vs.usage_bytes} bytes ({vs.usage_bytes / (1024*1024):.2f} MB)")
            
            # Si hay metadatos, mostrarlos
            if hasattr(vs, 'metadata') and vs.metadata:
                print(f"   Metadatos: {vs.metadata}")
            
            print("-" * 80)
            
    except Exception as e:
        print(f"Error al obtener vector stores: {e}")

# Ejecutar la funci√≥n
listar_vector_stores()

In [None]:
# Borramos los cuatro vector store
from datetime import datetime, timedelta
import time

def eliminar_todos_los_vector_stores():
    """
    Elimina todos los vector stores de tu cuenta OpenAI
    PRECAUCI√ìN: Esta operaci√≥n es irreversible
    """
    try:
        # Obtener lista de todos los vector stores
        print("Obteniendo lista de vector stores...")
        vector_stores = client.vector_stores.list()
        
        if not vector_stores.data:
            print("No se encontraron vector stores para eliminar.")
            return
        
        total = len(vector_stores.data)
        print(f"Se encontraron {total} vector stores.")
        
        # Confirmaci√≥n de seguridad
        confirmacion = input(f"\n‚ö†Ô∏è  ADVERTENCIA: Esto eliminar√° TODOS los {total} vector stores de tu cuenta.\n"
                           "Esta operaci√≥n es IRREVERSIBLE.\n"
                           "Escribe 'ELIMINAR TODO' para confirmar: ")
        
        if confirmacion != "ELIMINAR TODO":
            print("Operaci√≥n cancelada.")
            return
        
        print(f"\nEliminando {total} vector stores...")
        eliminados = 0
        errores = 0
        
        for i, vs in enumerate(vector_stores.data, 1):
            try:
                print(f"[{i}/{total}] Eliminando vector store: {vs.id}")
                if vs.name:
                    print(f"    Nombre: {vs.name}")
                
                # Eliminar el vector store
                response = client.vector_stores.delete(vector_store_id=vs.id)
                
                if hasattr(response, 'deleted') and response.deleted:
                    eliminados += 1
                    print(f"    ‚úÖ Eliminado exitosamente")
                else:
                    print(f"    ‚ùå No se pudo confirmar la eliminaci√≥n")
                    errores += 1
                
                # Peque√±a pausa para evitar sobrecarga de la API
                time.sleep(0.5)
                
            except Exception as e:
                print(f"    ‚ùå Error al eliminar {vs.id}: {e}")
                errores += 1
        
        print(f"\nüìä Resumen:")
        print(f"   Vector stores eliminados: {eliminados}")
        print(f"   Errores: {errores}")
        print(f"   Total procesados: {eliminados + errores}")
        
    except Exception as e:
        print(f"Error general: {e}")

# Ejecutar la funci√≥n
eliminar_todos_los_vector_stores()

In [None]:
# LISTAMOS AHORA TODOS LOS FILES

from datetime import datetime


def listar_archivos():
    """
    Lista todos los archivos almacenados en tu cuenta OpenAI
    """
    try:
        # Obtener lista de todos los archivos
        print("Obteniendo lista de archivos...")
        files = client.files.list()
        
        if not files.data:
            print("No se encontraron archivos en tu cuenta.")
            return
        
        total = len(files.data)
        print(f"Se encontraron {total} archivos:")
        print("=" * 80)
        
        for i, file in enumerate(files.data, 1):
            # Convertir timestamp a fecha legible
            created_date = datetime.fromtimestamp(file.created_at).strftime("%Y-%m-%d %H:%M:%S")
            size_mb = file.bytes / (1024 * 1024) if file.bytes > 0 else 0
            
            print(f"{i}. Archivo:")
            print(f"   ID: {file.id}")
            print(f"   Nombre: {file.filename}")
            print(f"   Prop√≥sito: {file.purpose}")
            print(f"   Creado: {created_date}")
            print(f"   Tama√±o: {file.bytes} bytes ({size_mb:.2f} MB)")
            print(f"   Estado: {getattr(file, 'status', 'N/A')}")
            print("-" * 80)
            
    except Exception as e:
        print(f"Error al obtener archivos: {e}")

# Ejecutar la funci√≥n
listar_archivos()


In [None]:
#Ahora un c√≥digo para borrar los ficheros
from openai import OpenAI
from datetime import datetime, timedelta
import time

def eliminar_archivos_avanzado():
    """
    Versi√≥n avanzada que permite filtrar por prop√≥sito, fecha, etc.
    """
    try:
        # Obtener todos los archivos
        files = client.files.list()
        
        if not files.data:
            print("No se encontraron archivos.")
            return
        
        print(f"Se encontraron {len(files.data)} archivos:")
        print("=" * 80)
        
        # Mostrar informaci√≥n detallada agrupada por prop√≥sito
        archivos_por_proposito = {}
        for file in files.data:
            purpose = file.purpose
            if purpose not in archivos_por_proposito:
                archivos_por_proposito[purpose] = []
            archivos_por_proposito[purpose].append(file)
        
        for purpose, file_list in archivos_por_proposito.items():
            total_size = sum(f.bytes for f in file_list)
            size_mb = total_size / (1024 * 1024)
            print(f"üìÅ {purpose.upper()}: {len(file_list)} archivos ({size_mb:.2f} MB)")
            
            for file in file_list[:3]:  # Mostrar solo los primeros 3
                created_date = datetime.fromtimestamp(file.created_at)
                print(f"   ‚Ä¢ {file.filename} - {created_date.strftime('%Y-%m-%d')}")
            
            if len(file_list) > 3:
                print(f"   ... y {len(file_list) - 3} archivos m√°s")
            print()
        
        print("\nOpciones de eliminaci√≥n:")
        print("1. Eliminar TODOS los archivos")
        print("2. Eliminar archivos por prop√≥sito espec√≠fico")
        print("3. Eliminar archivos m√°s antiguos que X d√≠as")
        print("4. Eliminar archivos de un tama√±o espec√≠fico")
        print("5. Cancelar")
        
        opcion = input("\nSelecciona una opci√≥n (1-5): ")
        
        if opcion == "1":
            eliminar_todos(files.data)
        elif opcion == "2":
            eliminar_por_proposito(archivos_por_proposito)
        elif opcion == "3":
            eliminar_por_fecha(files.data)
        elif opcion == "4":
            eliminar_por_tama√±o(files.data)
        else:
            print("Operaci√≥n cancelada.")
            
    except Exception as e:
        print(f"Error: {e}")

def eliminar_todos(files):
    """Elimina todos los archivos"""
    confirmacion = input(f"\n‚ö†Ô∏è  Confirma que quieres eliminar TODOS los {len(files)} archivos.\n"
                        "Escribe 'SI ELIMINAR TODO': ")
    
    if confirmacion == "SI ELIMINAR TODO":
        procesar_eliminacion(files)
    else:
        print("Cancelado.")

def eliminar_por_proposito(archivos_por_proposito):
    """Elimina archivos de un prop√≥sito espec√≠fico"""
    print("\nProp√≥sitos disponibles:")
    propositos = list(archivos_por_proposito.keys())
    for i, purpose in enumerate(propositos, 1):
        count = len(archivos_por_proposito[purpose])
        print(f"{i}. {purpose} ({count} archivos)")
    
    try:
        seleccion = int(input("\nSelecciona el n√∫mero del prop√≥sito: ")) - 1
        if 0 <= seleccion < len(propositos):
            purpose_elegido = propositos[seleccion]
            archivos_elegidos = archivos_por_proposito[purpose_elegido]
            
            print(f"\nSe eliminar√°n {len(archivos_elegidos)} archivos con prop√≥sito '{purpose_elegido}':")
            for file in archivos_elegidos:
                print(f"  - {file.filename} ({file.id})")
            
            confirmacion = input(f"\nConfirmar eliminaci√≥n? (si/no): ")
            if confirmacion.lower() == 'si':
                procesar_eliminacion(archivos_elegidos)
        else:
            print("Selecci√≥n inv√°lida.")
    except ValueError:
        print("Por favor, ingresa un n√∫mero v√°lido.")

def eliminar_por_fecha(files):
    """Elimina archivos m√°s antiguos que X d√≠as"""
    try:
        dias = int(input("Eliminar archivos m√°s antiguos que cu√°ntos d√≠as? "))
        fecha_limite = datetime.now() - timedelta(days=dias)
        
        antiguos = [f for f in files 
                   if datetime.fromtimestamp(f.created_at) < fecha_limite]
        
        if not antiguos:
            print(f"No hay archivos m√°s antiguos que {dias} d√≠as.")
            return
        
        print(f"Se eliminar√°n {len(antiguos)} archivos m√°s antiguos que {dias} d√≠as:")
        for file in antiguos:
            fecha = datetime.fromtimestamp(file.created_at).strftime('%Y-%m-%d')
            print(f"  - {file.filename} - {fecha}")
        
        confirmacion = input(f"\nConfirmar eliminaci√≥n? (si/no): ")
        if confirmacion.lower() == 'si':
            procesar_eliminacion(antiguos)
            
    except ValueError:
        print("Por favor, ingresa un n√∫mero v√°lido de d√≠as.")

def eliminar_por_tama√±o(files):
    """Elimina archivos basado en criterios de tama√±o"""
    print("\nOpciones de tama√±o:")
    print("1. Archivos mayores a X MB")
    print("2. Archivos menores a X MB")
    print("3. Archivos de 0 bytes (vac√≠os)")
    
    opcion = input("Selecciona una opci√≥n (1-3): ")
    
    if opcion == "1":
        try:
            mb_limite = float(input("Eliminar archivos mayores a cu√°ntos MB? "))
            bytes_limite = mb_limite * 1024 * 1024
            grandes = [f for f in files if f.bytes > bytes_limite]
            
            if grandes:
                print(f"Se eliminar√°n {len(grandes)} archivos mayores a {mb_limite} MB:")
                for file in grandes:
                    size_mb = file.bytes / (1024 * 1024)
                    print(f"  - {file.filename} ({size_mb:.2f} MB)")
                
                confirmacion = input("\nConfirmar eliminaci√≥n? (si/no): ")
                if confirmacion.lower() == 'si':
                    procesar_eliminacion(grandes)
            else:
                print(f"No hay archivos mayores a {mb_limite} MB.")
        except ValueError:
            print("Por favor, ingresa un n√∫mero v√°lido.")
            
    elif opcion == "3":
        vacios = [f for f in files if f.bytes == 0]
        if vacios:
            print(f"Se eliminar√°n {len(vacios)} archivos vac√≠os:")
            for file in vacios:
                print(f"  - {file.filename}")
            
            confirmacion = input("\nConfirmar eliminaci√≥n? (si/no): ")
            if confirmacion.lower() == 'si':
                procesar_eliminacion(vacios)
        else:
            print("No hay archivos vac√≠os.")

def procesar_eliminacion(archivos_a_eliminar):
    """Procesa la eliminaci√≥n de los archivos seleccionados"""
    total = len(archivos_a_eliminar)
    eliminados = 0
    errores = 0
    
    print(f"\nEliminando {total} archivos...")
    
    for i, file in enumerate(archivos_a_eliminar, 1):
        try:
            print(f"[{i}/{total}] Eliminando: {file.filename}")
            
            response = client.files.delete(file.id)
            
            if hasattr(response, 'deleted') and response.deleted:
                eliminados += 1
                print(f"    ‚úÖ Eliminado")
            else:
                errores += 1
                print(f"    ‚ùå Error en la eliminaci√≥n")
            
            # Pausa para no sobrecargar la API
            time.sleep(0.2)
            
        except Exception as e:
            errores += 1
            print(f"    ‚ùå Error: {e}")
    
    print(f"\nüìä Resultado final:")
    print(f"   Eliminados exitosamente: {eliminados}")
    print(f"   Errores: {errores}")

# Ejecutar la versi√≥n avanzada
eliminar_archivos_avanzado()



## Structred Outputs
```{index} Structred Outputs,response_format
```

Los **Structured Outputs** son una funcionalidad que asegura que las salidas del modelo cumplan exactamente con los esquemas JSON Schema proporcionados por el desarrollador. A diferencia del modo JSON tradicional, esta caracter√≠stica garantiza el cumplimiento del esquema al 100%. Tambi√©n puede decirse que los **Structured Output* es una capacidad reciente de la API de OpenAI que permite que los modelos generen salidas que cumplan exactamente un esquema JSON definido por el desarrollador. Es decir, en vez de depender de que el modelo ‚Äúimite‚Äù un formato, podemos forzar que la salida obedezca una estructura dada.

OpenAI lo presenta como una mejora respecto al ‚ÄúJSON mode‚Äù anterior: con Structured Outputs, el modelo garantiza que el formato siga el esquema proporcionado.

Esto se logra mediante decodificaci√≥n con restricciones (constrained decoding), es decir, el modelo no puede salirse de la gram√°tica/estructura permitida.

## Bneficios y casos de uso.

**Algunos de los beneficios**:

* Fiabilidad en la salida: elimina muchos errores de formato.

* Facilidad para integrarse con sistemas que esperan datos estructurados (bases de datos, APIs, frontends).

* Menor necesidad de ‚Äúparsing‚Äù manual o correcciones posteriores.

* Permite separar la l√≥gica de razonamiento del ‚Äúempaquetado‚Äù del resultado.

* Compatible con llamadas a funciones (‚Äútool calling‚Äù) para hacer flujos m√°s robustos.

Casos de uso t√≠picos:

* Extracci√≥n de datos de documentos (por ejemplo: nombres, fechas, direcciones).

* Respuestas de APIs conversacionales donde se necesita un formato predecible.

* Automatizaci√≥n de flujos multi-paso con agentes que llaman funciones internamente.

* Generaci√≥n de interfaces din√°micas basadas en la intenci√≥n del usuario (por ejemplo: generar un formulario JSON a partir de la consulta).

## Modelos compatibles:

Los Structured Outputs est√°n disponibles en los siguientes modelos :

* gpt-4o-2024-08-06 (m√°s reciente)

* gpt-4o-mini

* gpt-4o-mini-2024-07-18

* Modelos fine-tuned basados en estos

## C√≥mo habilitar Structured Outputs.

Hay dos modos principales de usarlo:

### Usando response_format + JSON Schema.

Puedes pedirle al modelo que responda bajo un esquema JSON concreto, pasando un objeto **response_format**. Este objeto contiene un tipo "json_schema" y la especificaci√≥n del esquema JSON que el modelo debe obedecer.

Por ejemplo, en una petici√≥n HTTP (o v√≠a SDK):

```json
{
  "model": "gpt-4o-2024-08-06",
  "messages": [
    { "role": "system", "content": "..." },
    { "role": "user", "content": "..." }
  ],
  "response_format": {
    "type": "json_schema",
    "json_schema": {
      "name": "mi_esquema",
      "schema": {
        "type": "object",
        "properties": {
          "campo1": { "type": "string" },
          "campo2": { "type": "integer" }
        },
        "required": ["campo1", "campo2"]
      }
    }
  }
}


```

Cuando haces esto, el modelo garantiza que la salida ser√° un JSON v√°lido que respete ese esquema (o fallar√° con un rechazo/refusal).

Importante: esta funcionalidad (con response_format) est√° disponible en modelos como gpt-4o-mini y gpt-4o-2024-08-06 y sus fine-tunes basados en ellos.

### Usando llamadas a funciones (tool calling) con strict: true

Otra forma poderosa es usar la funcionalidad de function calling (herramientas) de la API, combinada con strict: true en la definici√≥n de la funci√≥n. De esta forma, cuando el modelo ‚Äúllama‚Äù a la funci√≥n generando argumentos, esos argumentos deben ajustarse al esquema de la funci√≥n.
Por ejemplo, defines una funci√≥n con par√°metros estructurados:

```Python
from pydantic import BaseModel

class WeatherQuery(BaseModel):
    location: str
    date: str

tools = [
  openai.pydantic_function_tool(WeatherQuery, strict=True)
]

response = client.chat.completions.create(
  model="gpt-4o-2024-08-06",
  messages=[...],
  tools=tools
)

```

El modelo generar√° una llamada a esa funci√≥n con argumentos que satisfacen el esquema. 

**Advertencia**: no funciona bien si se permiten llamadas paralelas (parallel tool calls). Cuando se usa strict: true, se recomienda desactivar paralelismo.

### Ejemplos pr√°cticos:

Supongamos que queremos que el modelo clasifique el sentimiento de una rese√±a como "positive", "negative" o "neutral", y que la salida sea:

```json
{
  "sentiment": "positive"
}
```

In [8]:
from pydantic import BaseModel
from typing import Literal
from openai import OpenAI

class SentimentResponse(BaseModel):
    sentiment: Literal["positive", "negative", "neutral"]

#client = OpenAI()

response = client.chat.completions.parse(
    model="gpt-4o-2024-08-06",
    messages=[
      {"role": "system", "content": "Eres un clasificador de sentimiento."},
      {"role": "user", "content": "The food was amazing but the room was small."}
    ],
    response_format=SentimentResponse
)
print(response.choices[0].message.content)


{"sentiment":"neutral"}


#### Resolver un problema matem√°tico.

Imagina que quieres que el modelo devuelva una serie de pasos para resolver un problema:

El esquema podr√≠a ser:

```json
{
  "steps": [
    {
      "explanation": "texto explicativo",
      "output": "resultado en esa etapa"
    }
  ],
  "final_answer": "respuesta final"
}

```

In [None]:
class Step(BaseModel):
    explanation: str
    output: str

class MathReasoning(BaseModel):
    steps: list[Step]
    final_answer: str

response = client.chat.completions.parse(
    model="gpt-4o-2024-08-06",
    messages=[...],
    response_format=MathReasoning
)


El modelo devolver√° un objeto con la propiedad steps (array de objetos con explanation y output) y el campo final_answer.

Veamos un ejemplo b√°sico con Pydantic

In [9]:
from pydantic import BaseModel
from typing import List

class EventoCalendario(BaseModel):
    nombre: str
    fecha: str
    participantes: List[str]

# Usando la API Responses
response = client.responses.parse(
    model="gpt-4o-2024-08-06",
    input=[
        {"role": "system", "content": "Extrae la informaci√≥n del evento."},
        {
            "role": "user", 
            "content": "Ana y Bob van a una feria de ciencias el viernes."
        }
    ],
    text_format=EventoCalendario,
)

evento = response.output_parsed
print(evento.nombre)  # Acceso tipado al resultado


Feria de Ciencias


In [10]:
print(evento)

EventoCalendario(nombre='Feria de Ciencias', fecha='Viernes', participantes=['Ana', 'Bob'])

A continuaci√≥n vemos un ejemplo con curl y JSON Schema
```json
curl https://api.openai.com/v1/responses \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
  "model": "gpt-4o-2024-08-06",
  "input": [
    {
      "role": "system",
      "content": "Eres un tutor de matem√°ticas. Gu√≠a al usuario paso a paso."
    },
    {
      "role": "user",
      "content": "¬øc√≥mo puedo resolver 8x + 7 = -23?"
    }
  ],
  "text": {
    "format": {
      "type": "json_schema",
      "name": "razonamiento_matematico",
      "schema": {
        "type": "object",
        "properties": {
          "pasos": {
            "type": "array",
            "items": {
              "type": "object",
              "properties": {
                "explicacion": { "type": "string" },
                "resultado": { "type": "string" }
              },
              "required": ["explicacion", "resultado"],
              "additionalProperties": false
            }
          },
          "respuesta_final": { "type": "string" }
        },
        "required": ["pasos", "respuesta_final"],
        "additionalProperties": false
      },
      "strict": true
    }
  }
}'

```

Otro ejemplo de un profesor de matem√°ticas:

In [11]:
from pydantic import BaseModel
from typing import List

class Paso(BaseModel):
    explicacion: str
    resultado: str

class RazonamientoMatematico(BaseModel):
    pasos: List[Paso]
    respuesta_final: str

response = client.responses.parse(
    model="gpt-4o-2024-08-06",
    input=[
        {
            "role": "system",
            "content": "Eres un tutor de matem√°ticas. Gu√≠a al usuario paso a paso."
        },
        {"role": "user", "content": "¬øc√≥mo puedo resolver 8x + 7 = -23?"}
    ],
    text_format=RazonamientoMatematico,
)

razonamiento = response.output_parsed
for paso in razonamiento.pasos:
    print(f"Paso: {paso.explicacion}")
    print(f"Resultado: {paso.resultado}")
print(f"Respuesta final: {razonamiento.respuesta_final}")


Paso: Comienza aislando el t√©rmino que contiene la variable. Restamos 7 de ambos lados de la ecuaci√≥n para eliminar el 7 de la izquierda.
Resultado: 8x + 7 - 7 = -23 - 7
Paso: Simplifica ambos lados de la ecuaci√≥n despu√©s de restar.
Resultado: 8x = -30
Paso: Ahora, resuelve para x dividiendo ambos lados de la ecuaci√≥n por 8.
Resultado: 8x / 8 = -30 / 8
Paso: Simplifica la fracci√≥n en el lado derecho de la ecuaci√≥n.
Resultado: x = -15/4 o x = -3.75
Respuesta final: x = -3.75


Extracci√≥n de datos estructurados

In [12]:
from pydantic import BaseModel
from typing import List

class ArticuloInvestigacion(BaseModel):
    titulo: str
    autores: List[str]
    resumen: str
    palabras_clave: List[str]

response = client.responses.parse(
    model="gpt-4o-2024-08-06",
    input=[
        {
            "role": "system",
            "content": "Eres experto en extracci√≥n de datos estructurados. Convierte el texto no estructurado de un art√≠culo de investigaci√≥n en la estructura dada."
        },
        {
            "role": "user", 
            "content": "Texto del art√≠culo de investigaci√≥n aqu√≠..."
        }
    ],
    text_format=ArticuloInvestigacion,
)

articulo = response.output_parsed
print(f"T√≠tulo: {articulo.titulo}")
print(f"Autores: {', '.join(articulo.autores)}")


T√≠tulo: Impacto de la Nutrici√≥n en el Desarrollo Cognitivo Infantil: Un Estudio Longitudinal
Autores: Dra. Ana L√≥pez, Dr. Carlos M√©ndez, Dra. Luc√≠a Garc√≠a


Generaci√≥n de Interfaces de Usuario

In [13]:
from pydantic import BaseModel
from typing import List
from enum import Enum

class TipoUI(str, Enum):
    div = "div"
    boton = "button"
    header = "header"
    seccion = "section"
    campo = "field"
    formulario = "form"

class Atributo(BaseModel):
    nombre: str
    valor: str

class ComponenteUI(BaseModel):
    tipo: TipoUI
    etiqueta: str
    hijos: List['ComponenteUI']
    atributos: List[Atributo]

ComponenteUI.model_rebuild()  # Necesario para tipos recursivos

response = client.responses.parse(
    model="gpt-4o-2024-08-06",
    input=[
        {
            "role": "system",
            "content": "Eres un generador de UI. Convierte la entrada del usuario en una UI."
        },
        {"role": "user", "content": "Crea un formulario de perfil de usuario"}
    ],
    text_format=ComponenteUI,
)

ui = response.output_parsed


In [None]:
Sistema de Moderaci√≥n de Contenido

In [None]:
from pydantic import BaseModel
from typing import Optional
from enum import Enum

class CategoriaViolacion(str, Enum):
    violencia = "violence"
    sexual = "sexual"
    autolesion = "self_harm"

class ComplianceContenido(BaseModel):
    es_violacion: bool
    categoria: Optional[CategoriaViolacion]
    explicacion_si_viola: Optional[str]

response = client.responses.parse(
    model="gpt-4o-2024-08-06",
    input=[
        {
            "role": "system",
            "content": "Determina si la entrada del usuario viola directrices espec√≠ficas y explica si las viola."
        },
        {
            "role": "user", 
            "content": "¬øC√≥mo me preparo para una entrevista de trabajo?"
        }
    ],
    text_format=ComplianceContenido,
)

compliance = response.output_parsed


In [None]:
#### Manejo de rechazos y errores

Gesti√≥n de Rechazos de Seguridad

In [None]:
response = client.responses.parse(
    model="gpt-4o-2024-08-06",
    input=[
        {"role": "system", "content": "Responde al usuario de forma √∫til."},
        {"role": "user", "content": "Contenido potencialmente problem√°tico"}
    ],
    text_format=MiEsquema,
)

# Verificar si hubo rechazo por seguridad
if hasattr(response, 'refusal') and response.refusal:
    print(f"Solicitud rechazada: {response.refusal}")
else:
    resultado = response.output_parsed
    # Procesar resultado normal


In [None]:
Manejo de Errores Comunes

In [None]:
try:
    response = client.responses.parse(
        model="gpt-4o-2024-08-06",
        input=mensajes,
        text_format=MiEsquema,
    )
    
    if response.output_parsed:
        datos = response.output_parsed
        # Procesar datos exitosos
    else:
        print("No se pudo parsear la respuesta")
        
except Exception as e:
    print(f"Error en la llamada a la API: {e}")


## Caso de uso: Generaci√≥n de test

En este apartado vamos a utilizar diversas herramientas que nos proporciona la API de OpenAI para obtener c√≥digo que nos genere una serie de preguntas de tipo test con cuatro posibles respuestas y solo una de ellas la verdadera.

Para proceder a conseguir esto, vamos a disponer de dos ficheros de tipo PDF denominados Tema_2_Mortalidad.pdf  y Tema_3_Natalidad.pdf, situados en la misma carpeta donde se encuentra el c√≥digo y que nos van a servir como referencia para el desarrollo de este apartado.

Lo primero que debemos hacer es subir estos ficheros a la plataforma de OpenAI para que los podamos ver en su Dashboard. Para conseguir esto lo hacemos de la siguiente manera (ver apartado anterior: La API de Files): (ver <a href="https://platform.openai.com/docs/api-reference/files/create" target="_blank"> esta referencia </a>)

In [None]:
# Esta ser√≠a una forma de hacerlo para cada uno de los ficheros
from openai import OpenAI
# Recordemos que en un blok anterior ya hemos creado el cliente


#file = client.files.create(
#  file=open("Tema_2_Mortalidad.pdf", "rb"),
#  purpose="assistants",
#  expires_after={
#    "anchor": "created_at",
#    "seconds": 4000
  }
)

In [8]:
# Pero si queremos subir los dos con un s√≥lo c√≥digo lo hacemos de la siguiente manera
file_paths = ["Tema_2_Mortalidad.pdf", "Tema_3_Natalidad.pdf"] 

file_ids = []  # Para guardar IDs si los necesitas despu√©s

for path in file_paths:
    uploaded_file = client.files.create(
        file = open(path,"rb"),
        purpose = "assistants"  # Para uso con assistants/tools/vector stores        
    )
    file_ids.append(uploaded_file.id)
    print(f"Archivo subido: {path}")
    print(f"  ID: {uploaded_file.id}")
    print(f"  Filename: {uploaded_file.filename}")
    print(f"  Bytes: {uploaded_file.bytes}\n")    

print("Ambos archivos subidos exitosamente. IDs:", file_ids)

Archivo subido: Tema_2_Mortalidad.pdf
  ID: file-FFoSFbTCe1jTuxXLhE13Vq
  Filename: Tema_2_Mortalidad.pdf
  Bytes: 1057614

Archivo subido: Tema_3_Natalidad.pdf
  ID: file-CFAhZ6STeupLYfknMKBctd
  Filename: Tema_3_Natalidad.pdf
  Bytes: 692116

Ambos archivos subidos exitosamente. IDs: ['file-FFoSFbTCe1jTuxXLhE13Vq', 'file-CFAhZ6STeupLYfknMKBctd']


Si ahora nos vamos al Dashboard de OpenAi y elegimos "Storage" como opci√≥n del men√∫, podemos ver estos dos archivos. Hay que tener en cuenta que por la utilizaci√≥n de los vestor stores que usaremos m√°s adelante OpenAi cobra por ello, aunque tiene una parte gratuita (en el momento de redactar estas l√≠neas). En concreto:

En OpenAI, mantener archivos subidos en el endpoint Files no tiene coste de almacenamiento publicado; el cargo aparece cuando esos archivos se a√±aden a un vector store, que cuesta 0,10 USD por GB de almacenamiento vectorial al d√≠a **con el primer GB gratis**.‚Äã

**Archivos en Files**:

* La tabla oficial de precios no publica ninguna tarifa por ‚Äúalmacenar‚Äù archivos en el endpoint Files; los cargos publicados para documentos aparecen cuando se usa File Search/Vector Stores, no por el mero hecho de subirlos.‚Äã

* En la pr√°ctica, la comunidad y documentaci√≥n informal confirman que puedes mantener archivos subidos sin facturaci√≥n por almacenamiento, y los costes empiezan al procesarlos en Vector Stores o usar herramientas sobre ellos.‚Äã

**Vector store**.

El almacenamiento vectorial cuesta 0,10 USD por GB al d√≠a, con *1 GB gratuito de almacenamiento vectorial* por cuenta, aplic√°ndose al tama√±o procesado (fragmentos + embeddings) que el sistema mantiene para b√∫squeda.‚Äã
**Otros cargos relacionados**.

Llamadas a la herramienta de File Search cuando se usa via Responses API tienen un coste de 2,50 USD por 2.000 llamadas, adem√°s de los tokens del modelo para el contenido recuperado.‚Äã

Los ‚Äúsearch content tokens‚Äù que se inyectan al modelo desde el √≠ndice se cobran a las tarifas de tokens del modelo elegido.‚Äã

**Consideraciones √∫tiles**.

No hay ‚Äúdoble pago‚Äù por tener un archivo en Files y adem√°s en un vector store; el cargo relevante es el del vector store y, si aplica, el de llamadas a File Search via Responses.‚Äã

Si adjuntas el mismo archivo a varios vector stores, el almacenamiento vectorial se factura por cada vector store de forma independiente.‚Äã

### Craci√≥n de un vector store.

Una vez subidos esos ficheros a la plataforma  de OpenAI, vamos a <a href="https://platform.openai.com/docs/api-reference/vector-stores" traget="_blank"> crear un vector store </a> donde posteriormente vamos a almacenar  los embedings de esos dos ficheros. A este vector store, lo vamos a llamar "almacenamiento".

In [10]:
vector_store = client.vector_stores.create(
  name="almacenamiento"
)
print(vector_store)

VectorStore(id='vs_690c2e2f2e608191be88de11bea3c73e', created_at=1762405935, file_counts=FileCounts(cancelled=0, completed=0, failed=0, in_progress=0, total=0), last_active_at=1762405935, metadata={}, name='almacenamiento', object='vector_store', status='completed', usage_bytes=0, expires_after=None, expires_at=None, description=None)


Este vector store que acabamos de crear, lo podemos ver en el Dashboard de OpenAI, en el mismo sitio que hemos visto los Files anteriores, pero haciendo clock en la solapa "Vector stores".

Bien una vez creado este vector stores, que no es m√°s que un lugar de almacenamiento, ahora debemos cargar los dos ficheros anteriores en el vector store "almacenamiento", creado anteriormente. La API que rige esto la <a href="https://platform.openai.com/docs/api-reference/vector-stores-files/createFile" target="_blank"> podemos ver en este enlace </a> .

Es muy importante tener en cuenta que para procesos posteriores relacionados con b√∫squedas es muy importante definir *metadatos* con la opci√≥n *atributes* de esta clase: Veamos c√≥mo hacemos esto :


In [15]:
# obtenemos el ID del vector store creado anteriomente
vector_store_id= vector_store.id

vector_store_file_ids = []  # Para trackear
#para cada elemento FILE identificadi por su ID
# Recordar que file_ids es una lista de ID de los Files creados anteriormente
# Lo hacemos para el primer FILe
vector_store_file =client.vector_stores.files.create(
    vector_store_id=vector_store_id,
    file_id=file_ids[0],
    attributes={
        "materia":"Demografia",
        "Tema":"2"
    }
)
vector_store_file_ids.append(vector_store_file.id)
print(f"Archivo {file_id} adjuntado: vector_store_file_id {vector_store_file.id}, status inicial: {vector_store_file.status}")

# Lo hacemos para el segundo FILe
vector_store_file =client.vector_stores.files.create(
    vector_store_id=vector_store_id,
    file_id=file_ids[1],
    attributes={
        "materia":"Demografia",
        "Tema":"3"
    }
)

vector_store_file_ids.append(vector_store_file.id)


NameError: name 'file_id' is not defined

In [16]:
print(f"Archivo {file_ids} adjuntado: vector_store_file_id {vector_store_file.id}, status inicial: {vector_store_file.status}")    

Archivo ['file-FFoSFbTCe1jTuxXLhE13Vq', 'file-CFAhZ6STeupLYfknMKBctd'] adjuntado: vector_store_file_id file-FFoSFbTCe1jTuxXLhE13Vq, status inicial: in_progress


In [21]:
# Paso 3: Pollear status para cada vector store file (opcional pero recomendado)
for vsf_id, file_id in zip(vector_store_file_ids, file_ids):
    while True:
        vsf = client.vector_stores.files.retrieve(
            vector_store_id=vector_store_id,
            file_id=vsf_id
        )
        print(f"Status de {file_id} (vsf_id: {vsf_id}): {vsf.status}")
        if vsf.status == "completed":
            break
        elif vsf.status == "failed":
            print(f"Error procesando {file_id}: {vsf.last_error}")
            break
        time.sleep(5)

print("Todos los archivos procesados.")

Status de file-FFoSFbTCe1jTuxXLhE13Vq (vsf_id: file-FFoSFbTCe1jTuxXLhE13Vq): completed
Todos los archivos procesados.


Ahora que ya tenemos subidos todos los elementos que necesitamos, podemos crear las preguntas del test que necesitamos

In [36]:
from openai import OpenAI
from pydantic import BaseModel, Field
from typing import List

#client = OpenAI(api_key="tu_api_key") # Ya lo tenemos creado de pasos anteriores

# Schema JSON para structured outputs (mismo que antes)
class Option(BaseModel):
    text: str = Field(..., description="Una de las 4 opciones posibles")

class MCQ(BaseModel):
    question: str = Field(..., description="La pregunta de opci√≥n m√∫ltiple")
    options: List[Option] = Field(..., description="Lista de 4 opciones (A, B, C, D)")
    correct_answer: int = Field(..., description="√çndice de la respuesta correcta (0-3 para A-D)")
    explanation: str = Field(..., description="Explicaci√≥n breve de por qu√© es correcta")

class MCQsResponse(BaseModel):
    questions: List[MCQ] = Field(..., description="Lista de exactamente 10 preguntas generadas del vector store")

# Llamada corregida a Responses API
response = client.responses.parse(
    model="gpt-4o-mini",  # O "gpt-4o" para precisi√≥n
    input="Analiza el contenido de los archivos en el vector store y genera exactamente 5 preguntas de opci√≥n m√∫ltiple. Cada pregunta debe cubrir temas clave de los documentos, con 4 opciones (A, B, C, D) donde solo una es correcta. Aseg√∫rate de que sean educativas y basadas en hechos del contenido.",
    tools=[
        {
            "type": "file_search",
            "vector_store_ids": ["vs_690c2e2f2e608191be88de11bea3c73e"]  # ID de tu vector store con los 2 files
        }
    ],
    text_format=MCQsResponse  # Fuerza salida estructurada
)




In [43]:
response

ParsedResponse[MCQsResponse](id='resp_05043d2df129b7e000690c684226848191a84eb5a239eecf21', created_at=1762420802.0, error=None, incomplete_details=None, instructions=None, metadata={}, model='gpt-4o-mini-2024-07-18', object='response', output=[ResponseFileSearchToolCall(id='fs_05043d2df129b7e000690c684337a88191b595f3b41687ad41', queries=['Principales temas del documento', ' contenido clave del archivo', 'Resumen de los archivos subidos', 'Aspectos destacados de los documentos', 'Puntos importantes en el vector store'], status='completed', type='file_search_call', results=None), ResponseFileSearchToolCall(id='fs_05043d2df129b7e000690c684589188191baf78d3538b0cffb', queries=['mortalidad infantil', 'Tasa de Mortalidad por causas', 'Tablas de mortalidad', 'An√°lisis de la mortalidad', 'Efectos de envejecimiento en la mortalidad'], status='completed', type='file_search_call', results=None), ResponseFileSearchToolCall(id='fs_05043d2df129b7e000690c684822ec819187f97cdee7c6cdfb', queries=['morta

In [None]:
# Extrae y muestra las preguntas (igual que antes)
mcqs = response.choices[0].output.parsed
for i, q in enumerate(mcqs.questions, 1):
    print(f"Pregunta {i}: {q.question}")
    for j, opt in enumerate(q.options):
        letter = chr(65 + j)  # A, B, C, D
        print(f"  {letter}. {opt.text}")
    correct_letter = chr(65 + q.correct_answer)
    print(f"  Respuesta correcta: {correct_letter} ({q.options[q.correct_answer].text})")
    print(f"  Explicaci√≥n: {q.explanation}\n")

## Ap√©ndice:

* <a href="https://www.datacamp.com/tutorial/open-ai-assistants-api-tutorial" target="_blank"> Tutorial </a>

* <a href="https://www.youtube.com/watch?v=wIQePhB5KZI" target="_blank"> Tutorial en ingl√©s</a>

* <a href="https://openai.com/es-ES/index/introducing-structured-outputs-in-the-api/" target='_blank'>Introducci√≥n de outputs estructurados en la API </a>

* <a href="https://www.youtube.com/watch?v=nbtJToGckQM&t=19s" target="_blank"> V√≠deo sobre Structured Output</a>

* <a href="https://www.youtube.com/watch?v=dIccw6fsuP4" target="_blank"> V√≠deo sobre Structured Output</a>

* <a href="https://www.youtube.com/watch?v=dIccw6fsuP4" target="_blank"> V√≠deo sobre Structured Output</a>

* <a href="https://www.youtube.com/watch?v=VUkBgnezdPs" target="_blank"> Agents SDK y Responses API en acci√≥n</a>


