# Instalar la libreria

In [None]:
pip install openai

# importar la libreria

In [2]:
from openai import OpenAI

openai = OpenAI(api_key='Ingresa aquí tu API Key de OpenAI')

# chat completions

¿Qué son las chat completions y cómo funcionan?

Las chat completions son una forma más avanzada de interactuar con modelos de lenguaje porque trabajan con una conversación estructurada, no con un único prompt aislado.

A diferencia de las completions tradicionales (una entrada → una salida), en chat completions tú envías una lista de mensajes que representan el historial del diálogo. Ese historial le da al modelo contexto, lo ayuda a entender qué se está preguntando ahora y qué se dijo antes, y permite respuestas más coherentes y alineadas con lo que necesitas.

---

¿Cómo se estructuran los roles en las chat completions?

En una conversación, cada mensaje lleva un role que indica quién “habla” y con qué intención:

- system: define el comportamiento general del asistente (reglas, tono, rol profesional, límites, etc.).
Ej: “Eres un asistente experto en deportes”.

- user: representa lo que pregunta o solicita la persona usuaria.

- assistant: representa respuestas anteriores del asistente (puedes incluirlas para mantener continuidad o para “anclar” el contexto con ejemplos).
---

## **¿Qué hace cada parte?**

1. **`openai.chat.completions.create(...)`**
   Llama al modelo para que genere la siguiente respuesta del chat, basándose en el historial.

2. **`model='gpt-3.5-turbo'`**
   Indica qué modelo usar para generar la respuesta.

3. **`messages=[...]`**
   Es el **historial de conversación** en orden:

   * `system`: fija el rol (“asistente de deportes”).
   * `user`: pregunta 1: “¿Quién ganó el mundial…?”
   * `assistant`: respuesta previa (la incluyes para dar continuidad explícita).
   * `user`: pregunta 2: “¿Dónde se jugó?”
     Como el historial incluye que se habla del **Mundial 2022**, el modelo entiende que “¿Dónde se jugó?” se refiere a ese mundial.

4. **`response`**
   Guarda la respuesta completa del modelo (incluye metadatos, opciones, etc.).

5. **`response.choices[0].message.content`**
   Extrae el texto final de la respuesta generada por el asistente (la “mejor” opción devuelta en la primera posición).


In [3]:
response = openai.chat.completions.create(
    model = 'gpt-3.5-turbo',
    messages = [
        {"role": "system", "content" :"Eres un asistente que da informacion sobre deportes"},
        {"role": "user", "content" :"¿Quién ganó el mundial de fútbol?"},
        {"role": "assistant", "content" : "El mundial de 2022 lo ganó Argentina"},
        {"role": "user", "content" :"¿Dónde se jugó?"}
    ]
)

print(response.choices[0].message.content)

El Mundial de Fútbol de 2022 se jugó en Qatar. Fue la primera vez que este país de Medio Oriente organizó el torneo.



## Paso a paso: ¿qué hace cada parte?

1. **`openai.chat.completions.create(...)`**

   * Envía una solicitud al modelo para generar la **próxima respuesta del asistente** basándose en la conversación (los mensajes).

2. **`model='gpt-3.5-turbo'`**

   * Define qué modelo se va a usar para generar la respuesta.

3. **`messages=[...]` (historial del chat)**

   * **`system`**: fija el comportamiento del asistente:

     * “Eres un asistente que da información sobre deportes”
   * **`user`**: primera pregunta:

     * “¿Quién ganó el mundial de fútbol?”
   * **`assistant`**: respuesta anterior que tú incluyes para dar contexto:

     * “El mundial de 2022 lo ganó Argentina”
   * **`user`**: segunda pregunta:

     * “¿Dónde se jugó?”
   * Gracias a ese historial, el modelo entiende que “¿Dónde se jugó?” se refiere al **Mundial 2022** (no a cualquier mundial).

4. **`temperature=0.2`**

   * Controla la **variabilidad** de la respuesta:

     * Valores **bajos** (como 0.2) → respuestas más **consistentes, directas y menos creativas**.
     * Valores **altos** (0.8–1.0) → respuestas más **creativas**, con más variación.
   * En este caso, como la pregunta tiene una respuesta factual (“Qatar”), un valor bajo ayuda a que responda **de forma más estable**.

5. **`print(response.choices[0].message.content)`**

   * Imprime el texto de la respuesta generada por el modelo.
   * Normalmente devolvería algo como: **“Se jugó en Qatar.”**



In [4]:
response = openai.chat.completions.create(
    model = 'gpt-3.5-turbo',
    messages = [
        {"role": "system", "content" :"Eres un asistente que da informacion sobre deportes"},
        {"role": "user", "content" :"¿Quién ganó el mundial de fútbol?"},
        {"role": "assistant", "content" : "El mundial de 2022 lo ganó Argentina"},
        {"role": "user", "content" :"¿Dónde se jugó?"}
    ],
    temperature = 0.2
)
print(response.choices[0].message.content)

El Mundial de Fútbol de 2022 se jugó en Qatar. Fue la primera vez que este país de Oriente Medio fue sede de la Copa del Mundo.


## ¿Qué hace este código?

### 1) Llamada al modelo

* `openai.chat.completions.create(...)` envía una solicitud al modelo para que genere **la próxima respuesta** del rol `assistant`.
* `model='gpt-3.5-turbo'` define qué modelo responde.

### 2) Contexto conversacional con `messages`

Le entregas al modelo una conversación en orden:

* **`system`**: define el comportamiento del asistente.

  > “Eres un asistente que da información sobre deportes.”
  > Esto guía el tono y el tipo de contenido esperado.

* **`user`**: pregunta inicial.

  > “¿Quién ganó el mundial de fútbol?”

* **`assistant`**: respuesta previa (incluida por ti).

  > “El mundial de 2022 lo ganó Argentina”
  > Esto “ancla” el contexto: ya no es un mundial genérico, sino el de **2022**.

* **`user`**: nueva pregunta dependiente del contexto.

  > “¿Dónde se jugó?”
  > El modelo interpreta “¿Dónde se jugó?” como “¿Dónde se jugó el Mundial 2022?” gracias a lo anterior.

### 3) Control de creatividad con `temperature=1`

* `temperature` ajusta cuánta **variación** y **azar** se permite en la generación:

  * **Baja** (ej. 0.0–0.3): respuestas más **predecibles**, directas y consistentes.
  * **Alta** (ej. 0.8–1.2): respuestas más **variadas**, con más libertad para elegir diferentes palabras, estructuras, detalles e incluso agregar contexto adicional.

Con `temperature = 1`, el modelo tiene más margen para:

* Expandir la respuesta con detalles (por ejemplo, mencionar que Qatar fue el país anfitrión).
* Usar redacciones alternativas: “se celebró en…”, “tuvo lugar en…”, “se disputó en…”
* Cambiar el nivel de detalle de una ejecución a otra, aun con la misma pregunta.

### 4) Impresión del resultado

* `response` contiene la respuesta del modelo y metadatos.
* `response.choices[0].message.content` extrae el texto final del **primer candidato** (“choice”) devuelto.
* `print(...)` lo muestra en la salida del notebook.

---

## Diferencias con el código anterior (temperature = 0.2)

La estructura del código es esencialmente la misma (mismo modelo, mismos mensajes). La diferencia importante está en el comportamiento esperado de la generación:

### 1) Variabilidad de la respuesta

* **Antes (0.2):** respuesta más “cerrada”, breve, estable.
* **Ahora (1):** respuesta potencialmente más “abierta”, con más variación en estilo y detalle.

### 2) Consistencia entre ejecuciones

* **Antes (0.2):** si ejecutas varias veces, es más probable que obtengas respuestas casi idénticas.
* **Ahora (1):** si ejecutas varias veces, es más probable que el texto cambie (sin cambiar el significado principal).

### 3) Riesgo de “inventar” detalles

* Con temperaturas más altas, el modelo puede agregar contexto adicional. En preguntas simples suele estar bien, pero en temas sensibles o muy precisos, una temperatura alta puede incrementar el riesgo de:

  * introducir detalles no solicitados,
  * cometer errores sutiles,
  * o sonar más especulativo.
    Para respuestas “tipo dato” (fechas, cifras, definiciones estrictas), normalmente conviene **temperaturas bajas**.

### 4) Uso típico recomendado

* **`temperature` baja:** chatbots de soporte, respuestas consistentes, extracción de información, formato estricto.
* **`temperature` alta:** lluvia de ideas, redacción creativa, generación de alternativas, explicaciones más narrativas.




In [5]:
response = openai.chat.completions.create(
    model = 'gpt-3.5-turbo',
    messages = [
        {"role": "system", "content" :"Eres un asistente que da informacion sobre deportes."},
        {"role": "user", "content" :"¿Quién ganó el mundial de fútbol?"},
        {"role": "assistant", "content" : "El mundial de 2022 lo ganó Argentina"},
        {"role": "user", "content" :"¿Dónde se jugó?"}
    ],
    temperature = 1
)
print(response.choices[0].message.content)

El mundial de fútbol de 2022 se llevó a cabo en Qatar.
