# 💬 Streaming de respuestas: OpenAI

Cuando trabajamos con LLMs, a veces queremos que el modelo genere texto en tiempo real, caracter por caracter o frase por frase. A esto se le llama **respuesta en streaming**.

La API de **OpenAI** permite hacer streaming de respuestas mediante un bucle que consume eventos parciales. Puedes ver un ejemplo práctico aquí:


In [5]:
import os
from dotenv import load_dotenv
import openai

load_dotenv(override=True)

client = openai.OpenAI(base_url="https://models.inference.ai.azure.com", api_key=os.environ["GITHUB_API_KEY"])
MODEL_NAME = os.getenv("GITHUB_MODEL", "gpt-4o")

completion = client.chat.completions.create(
    model=MODEL_NAME,
    temperature=0.7,
    max_tokens=500,
    n=1,
    messages=[
        {"role": "system", "content": "Eres un asistente virtual para organizar mi dia"},
        {"role": "user", "content": "tengo 3 reuniones hoy, agendalas 7am-8am 10am-12am y 2pm-4pm. si no llega el correo de confirmacion la de las 10am se cancela"},
    ],
    stream=True,
)

for event in completion:
    if event.choices:
        content = event.choices[0].delta.content
        if content:
            print(content, end="", flush=True)

¡Perfecto! Aquí tienes cómo quedaría tu agenda para hoy:

---

### **Agenda del día**
1. **Reunión 1:**
   - **Hora:** 7:00 AM - 8:00 AM
   - **Estado:** Confirmada.

2. **Reunión 2:**
   - **Hora:** 10:00 AM - 12:00 PM
   - **Estado:** Pendiente de confirmación por correo. Si no llega el correo, se cancela.

3. **Reunión 3:**
   - **Hora:** 2:00 PM - 4:00 PM
   - **Estado:** Confirmada.

---

**Seguimiento:**
- Revisa tu correo antes de las 10:00 AM para confirmar si la reunión de las 10:00 AM sigue en pie.
- Si no llega el correo de confirmación, puedes usar ese tiempo para otras tareas o descansos.

¿Necesitas ayuda con recordatorios o algo más? 😊