# Gu√≠a de Instalaci√≥n y Pr√°ctica ‚Äî Sesi√≥n 1 (Notebook)
Curso: **IA en el Aula ‚Äî Nivel Avanzado**  
Profesor: **Luis Daniel Benavides Navarro**  
Fecha: **22 de octubre de 2025**

Este cuaderno gu√≠a a los participantes para configurar el entorno, conectarse a una API de modelos de lenguaje y realizar las primeras consultas con **par√°metros clave** como `temperature`, `max_tokens`, `top_p`, etc. Se incluyen explicaciones paso a paso y ejercicios.


## 1) Requisitos previos
- Python 3.10 o superior
- Cuenta y **clave API** en un proveedor de modelos de lenguaje (ej. OpenAI)
- Editor/entorno: VSCode, Jupyter o Colab
- Conexi√≥n a Internet

Si est√°s en **Colab**, puedes ejecutar el siguiente comando para instalar dependencias. En local, usa tu terminal.

In [2]:
# (Opcional en local/Colab) Instalar dependencias
%pip install --quiet openai python-dotenv

Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 24.0 -> 25.3
[notice] To update, run: C:\Users\usuario\AppData\Local\Microsoft\WindowsApps\PythonSoftwareFoundation.Python.3.11_qbz5n2kfra8p0\python.exe -m pip install --upgrade pip


## 2) Preparar variables de entorno
Crea un archivo `.env` en la carpeta del proyecto con:

```
OPENAI_API_KEY=tu_clave_aqui
```
Nunca publiques tu clave. Evita subir `.env` a repositorios p√∫blicos.


In [1]:
# 3) Cargar la clave y crear el cliente
import os
from dotenv import load_dotenv
from openai import OpenAI

load_dotenv()  # Lee el archivo .env
client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))
print("Cliente inicializado. Modelo listo para consultas.")

Cliente inicializado. Modelo listo para consultas.


Si est√° en Google Colab, debe incluir la llave en los secretos (en el men√∫ de la izquierda), activar la variable y luego inicializar as√≠:

In [2]:
# 3) Cargar la clave y crear el cliente en google Colab
from openai import OpenAI
from google.colab import userdata


client = OpenAI(api_key=userdata.get('OPENAI_API_KEY'))
print("Cliente inicializado. Modelo listo para consultas.")

ModuleNotFoundError: No module named 'google'

## 4) Par√°metros importantes de la API (explicaci√≥n breve)
- **`model`**: identifica el modelo a consultar (p.ej., `gpt-4o-mini`).
- **`messages`**: lista de turnos conversacionales. Usa roles `system` (instrucciones generales), `user` (tu prompt), `assistant` (respuestas previas si las hay).
- **`temperature`**: *aleatoriedad* de la salida. Valores bajos (0.0‚Äì0.3) hacen respuestas m√°s deterministas; valores altos (0.7‚Äì1.0) hacen respuestas m√°s creativas.
- **`top_p`**: alternativa a `temperature` basada en muestreo por probabilidad acumulada; usa uno u otro (no ambos a la vez a valores lejanos) para afinar el estilo.
- **`max_tokens`**: tope de tokens generados en la respuesta. Si es muy bajo, el texto puede cortarse.
- **`stop`**: secuencias de corte; si aparecen, la generaci√≥n se detiene.
- **`frequency_penalty` / `presence_penalty`**: penalizaciones para reducir repeticiones y fomentar aparici√≥n de nuevos t√©rminos.

**Buenas pr√°cticas:**
- Controlar `temperature` (0.2‚Äì0.7) seg√∫n la tarea (evaluaci√≥n ‚Üí bajo; lluvia de ideas ‚Üí medio/alto).
- Estructurar prompts y, cuando sea √∫til, **pedir JSON** para facilitar la automatizaci√≥n.
- Evitar incluir datos personales o sensibles en prompts.


In [3]:
# 5) Primera consulta: respuesta libre
prompt = "Explica en dos frases qu√© es la inteligencia artificial en la educaci√≥n."
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": prompt}],
    temperature=0.7  # m√°s creativo que 0.2, menos que 1.0
)
print(response.choices[0].message.content)

La inteligencia artificial en la educaci√≥n se refiere al uso de tecnolog√≠as avanzadas para personalizar y mejorar el proceso de ense√±anza y aprendizaje, adaptando recursos y metodolog√≠as a las necesidades individuales de los estudiantes. Esto incluye herramientas como tutores virtuales, an√°lisis de datos para evaluar el rendimiento acad√©mico y sistemas que facilitan la administraci√≥n educativa.


### Comentarios sobre `temperature`
- A `0.0‚Äì0.2`: respuestas casi siempre iguales (√∫til en **rubricas** o **explicaciones est√°ndar**).
- A `0.5‚Äì0.8`: m√°s variaci√≥n l√©xica/estil√≠stica (√∫til en **generaci√≥n de materiales** o **brainstorming**).
- A `>0.9`: creatividad alta pero riesgo de salidas menos precisas.


In [7]:
# 6) Respuesta estructurada en JSON para automatizaci√≥n
import json

query = "¬øQu√© es aprendizaje supervisado?"
schema_instruction = (
    "Responde en formato JSON con las claves: operation, input, output. "
    "operation debe ser 'explanation'; input debe repetir la pregunta; output la explicaci√≥n clara y breve."
)
response_json = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {"role": "system", "content": schema_instruction},
        {"role": "user", "content": query}
    ],
    temperature=0.1,       # m√°s determinista para formatos estructurados
    max_tokens=300         # suficiente para una explicaci√≥n breve
)
text = response_json.choices[0].message.content
print(text)

# (Opcional) intentar cargar como JSON si el modelo devolvi√≥ un objeto v√°lido
try:
    data = json.loads(text)
    print("\nValid JSON ‚Üí", data)
except json.JSONDecodeError:
    print("\nLa salida no es JSON v√°lido literal. Puedes parsearla manualmente o usar validadores/funciones JSON del proveedor.")

{
  "operation": "explanation",
  "input": "¬øQu√© es aprendizaje supervisado?",
  "output": "El aprendizaje supervisado es un tipo de aprendizaje autom√°tico donde un modelo se entrena utilizando un conjunto de datos etiquetados. Esto significa que cada entrada del conjunto de datos tiene una salida conocida, lo que permite al modelo aprender a predecir la salida a partir de nuevas entradas. Se utiliza com√∫nmente en tareas como clasificaci√≥n y regresi√≥n."
}

Valid JSON ‚Üí {'operation': 'explanation', 'input': '¬øQu√© es aprendizaje supervisado?', 'output': 'El aprendizaje supervisado es un tipo de aprendizaje autom√°tico donde un modelo se entrena utilizando un conjunto de datos etiquetados. Esto significa que cada entrada del conjunto de datos tiene una salida conocida, lo que permite al modelo aprender a predecir la salida a partir de nuevas entradas. Se utiliza com√∫nmente en tareas como clasificaci√≥n y regresi√≥n.'}


## 7) Ejercicios propuestos
1. Cambia `temperature` a 0.1, 0.5 y 0.9 y compara el estilo de las respuestas.
2. Pide que el modelo responda **siempre en JSON** usando un `system` que lo exija. Verifica si cumple.
3. Crea un prompt de tu √°rea (p.ej., *programaci√≥n*, *arquitectura*, *matem√°ticas*) que devuelva un JSON con `operation`, `input`, `steps` (lista) y `output`.
4. Limita la longitud con `max_tokens` y observa si corta.


In [10]:
# Plantilla reutilizable para el curso
def ask_model(prompt: str,
              model: str = "gpt-4o-mini",
              temperature: float = 0.1,
              max_tokens: int = 400,
              system: str | None = None):
    messages = []
    if system:
        messages.append({"role": "system", "content": system})
    messages.append({"role": "user", "content": prompt})
    resp = client.chat.completions.create(
        model=model,
        messages=messages,
        temperature=temperature,
        max_tokens=max_tokens
    )
    return resp.choices[0].message.content

# Ejemplo de uso
print(ask_model(
    "Explica brevemente el principio de funcionamiento de un √°rbol de decisi√≥n.",
    temperature=0.4,
    system="Responde en dos oraciones, tono docente y preciso. Siempre responde JSON con llaves promt y respuesta"
))

{
  "prompt": "Explica brevemente el principio de funcionamiento de un √°rbol de decisi√≥n.",
  "respuesta": "Un √°rbol de decisi√≥n es un modelo de aprendizaje autom√°tico que utiliza una estructura jer√°rquica para tomar decisiones basadas en preguntas sobre las caracter√≠sticas de los datos. Cada nodo interno representa una prueba sobre un atributo, cada rama representa el resultado de la prueba y cada hoja representa una clase o resultado final, permitiendo clasificar o predecir resultados de manera intuitiva."
}


In [11]:
import openai
import os # Importar para obtener la clave API, si se usa un entorno

# ‚ö†Ô∏è ADVERTENCIA: Debes inicializar 'client' correctamente.
# Este es un ejemplo de c√≥mo podr√≠as inicializarlo (ajusta seg√∫n tu configuraci√≥n):
# Si usas variables de entorno:
# client = openai.OpenAI(api_key=os.environ.get("OPENAI_API_KEY"))

# üí° Para prop√≥sitos de este ejemplo, si no tienes la clave configurada 
# en el entorno, deber√°s inicializar 'client' o comentar esta l√≠nea si 
# la ejecuci√≥n real ocurre en un entorno donde 'client' ya est√° definido.
# Si est√°s ejecutando en un Jupyter/Colab con la clave ya definida, no es necesario.
# Si la variable 'client' no est√° definida, el c√≥digo fallar√°.

# --- Plantilla reutilizable para el curso ---
def ask_model(prompt: str,
              model: str = "gpt-4o-mini",
              temperature: float = 0.3,
              max_tokens: int = 400,
              system: str | None = None):
    """
    Funci√≥n para interactuar con un modelo de lenguaje.
    """
    
    # ‚ö†Ô∏è Esta funci√≥n requiere que la variable 'client' est√© definida globalmente
    # y que la conexi√≥n a la API sea exitosa.
    try:
        messages = []
        if system:
            messages.append({"role": "system", "content": system})
            
        messages.append({"role": "user", "content": prompt})
        
        resp = client.chat.completions.create(
            model=model,
            messages=messages,
            temperature=temperature,
            max_tokens=max_tokens
        )
        return resp.choices[0].message.content
    except NameError:
        return "ERROR: La variable 'client' (OpenAI client) no est√° definida. Por favor, inicial√≠zala."
    except Exception as e:
        return f"Error al comunicarse con la API: {e}"

# --- Definiciones para el Ejemplo de Uso (F√≠sica) ---

# üéØ PROMPT DE F√çSICA: C√°lculo de Energ√≠a Cin√©tica.
prompt_fisica = "Calcula la energ√≠a cin√©tica de un coche que tiene una masa de 1500 kg y se mueve a una velocidad constante de 20 m/s. Formula la ley f√≠sica utilizada."

# ü§ñ SYSTEM: Exige el formato JSON estricto.
system_json_request = """
Tu √∫nica tarea es resolver el problema de F√≠sica.
DEBES responder √∫nicamente con un objeto JSON que contenga las siguientes claves:
1. 'operation': La ley f√≠sica utilizada o el objetivo del c√°lculo (e.g., 'C√°lculo de Energ√≠a Cin√©tica').
2. 'input': Los datos iniciales proporcionados (e.g., 'm=1500 kg, v=20 m/s').
3. 'steps': Una lista de cadenas, donde cada elemento detalla una etapa del c√°lculo o la formulaci√≥n de la ley. Incluye la f√≥rmula.
4. 'output': El resultado final del c√°lculo con unidades (e.g., '300000 J').
NO incluyas texto adicional fuera del objeto JSON.
"""

# --- Ejemplo de Uso y Ejecuci√≥n ---

print("--- Ejecutando Modelo para C√°lculo de Energ√≠a Cin√©tica ---")
print(ask_model(
    prompt=prompt_fisica,
    temperature=0.1, # Baja temperatura para consistencia y precisi√≥n
    system=system_json_request
))
print("----------------------------------------------------------")

--- Ejecutando Modelo para C√°lculo de Energ√≠a Cin√©tica ---
{
  "operation": "C√°lculo de Energ√≠a Cin√©tica",
  "input": "m=1500 kg, v=20 m/s",
  "steps": [
    "La f√≥rmula de la energ√≠a cin√©tica es: EK = (1/2) * m * v^2",
    "Sustituyendo los valores: EK = (1/2) * 1500 kg * (20 m/s)^2",
    "Calculando: EK = (1/2) * 1500 kg * 400 m^2/s^2",
    "EK = 750 kg * 400 m^2/s^2",
    "EK = 300000 kg*m^2/s^2",
    "EK = 300000 J"
  ],
  "output": "300000 J"
}
----------------------------------------------------------


In [12]:
import openai
import os
import json # Importar para una mejor manipulaci√≥n de JSON

# ‚ö†Ô∏è ADVERTENCIA: Debes inicializar 'client' correctamente.
# Si usas la librer√≠a de OpenAI, la variable 'client' debe estar definida 
# con tu clave API para que el c√≥digo se ejecute correctamente.
# Ejemplo (ajusta seg√∫n tu entorno):
# client = openai.OpenAI(api_key=os.environ.get("OPENAI_API_KEY"))

# --- Plantilla reutilizable para el curso ---
def ask_model(prompt: str,
              model: str = "gpt-4o-mini",
              temperature: float = 0.3,
              max_tokens: int = 400,
              system: str | None = None):
    """
    Funci√≥n para interactuar con un modelo de lenguaje.
    """
    
    # ‚ö†Ô∏è Esta funci√≥n requiere que la variable 'client' est√© definida.
    try:
        messages = []
        if system:
            messages.append({"role": "system", "content": system})
            
        messages.append({"role": "user", "content": prompt})
        
        # Simulaci√≥n de la respuesta para entornos sin la clave API configurada
        # Si 'client' est√° definido y la clave es v√°lida, se ejecutar√° la llamada real.
        if 'client' not in globals() and 'client' not in locals():
            print("AVISO: 'client' no est√° definido. Devolviendo una respuesta de ejemplo simulada.")
            return json.dumps({
                "operation": "C√°lculo de Elasticidad Precio de la Demanda (EPD)",
                "input": "Precio inicial ($10), Cantidad inicial (100 unidades), Precio final ($12), Cantidad final (90 unidades)",
                "steps": [
                    "F√≥rmula de la EPD (M√©todo del Punto Medio): EPD = [(Qf - Qi) / ((Qf + Qi)/2)] / [(Pf - Pi) / ((Pf + Pi)/2)].",
                    "C√°lculo del cambio porcentual en la cantidad demandada: [(90 - 100) / ((90 + 100)/2)] = -10 / 95 ‚âà -0.1053.",
                    "C√°lculo del cambio porcentual en el precio: [(12 - 10) / ((12 + 10)/2)] = 2 / 11 ‚âà 0.1818.",
                    "C√°lculo de la EPD: -0.1053 / 0.1818 ‚âà -0.579."
                ],
                "output": "La Elasticidad Precio de la Demanda es aproximadamente -0.58. La demanda es inel√°stica porque el valor absoluto (|0.58|) es menor que 1."
            }, indent=2)

        # Llamada real a la API (si 'client' est√° definido)
        resp = client.chat.completions.create(
            model=model,
            messages=messages,
            temperature=temperature,
            max_tokens=max_tokens
        )
        return resp.choices[0].message.content
        
    except NameError:
        return "ERROR: La variable 'client' (OpenAI client) no est√° definida. Por favor, inicial√≠zala."
    except Exception as e:
        return f"Error al comunicarse con la API: {e}"

# --- Definiciones para el Ejemplo de Uso (Econom√≠a) ---

# üéØ PROMPT DE ECONOM√çA: C√°lculo de la EPD.
prompt_economia = "Calcula la Elasticidad Precio de la Demanda utilizando el m√©todo del punto medio si el precio de un bien sube de $10 a $12, causando que la cantidad demandada baje de 100 unidades a 90 unidades. Indica qu√© tipo de elasticidad es."

# ü§ñ SYSTEM: Exige el formato JSON estricto.
system_json_request = """
Tu √∫nica tarea es resolver el problema de Econom√≠a y proporcionar la interpretaci√≥n del resultado.
DEBES responder √∫nicamente con un objeto JSON que contenga las siguientes claves:
1. 'operation': La ley econ√≥mica utilizada (e.g., 'C√°lculo de Elasticidad Precio de la Demanda (EPD)').
2. 'input': Los datos iniciales proporcionados (e.g., 'Pi=$10, Qi=100, Pf=$12, Qf=90').
3. 'steps': Una lista de cadenas, donde cada elemento detalla una etapa del c√°lculo, la f√≥rmula y la interpretaci√≥n.
4. 'output': El resultado num√©rico final y el tipo de elasticidad.
NO incluyas texto adicional, explicaciones ni encabezados fuera del objeto JSON.
"""

# --- Ejemplo de Uso y Ejecuci√≥n ---

print("--- Ejecutando Modelo para C√°lculo de Elasticidad Precio de la Demanda ---")
print(ask_model(
    prompt=prompt_economia,
    temperature=0.1, # Muy baja temperatura para asegurar precisi√≥n num√©rica y formato
    system=system_json_request
))
print("--------------------------------------------------------------------------")

--- Ejecutando Modelo para C√°lculo de Elasticidad Precio de la Demanda ---
{
  "operation": "C√°lculo de Elasticidad Precio de la Demanda (EPD) utilizando el m√©todo del punto medio",
  "input": "Pi=$10, Qi=100, Pf=$12, Qf=90",
  "steps": [
    "1. Calcular el cambio en la cantidad demandada: ŒîQ = Qf - Qi = 90 - 100 = -10.",
    "2. Calcular el cambio en el precio: ŒîP = Pf - Pi = 12 - 10 = 2.",
    "3. Calcular el promedio de la cantidad demandada: Qprom = (Qi + Qf) / 2 = (100 + 90) / 2 = 95.",
    "4. Calcular el promedio del precio: Pprom = (Pi + Pf) / 2 = (10 + 12) / 2 = 11.",
    "5. Aplicar la f√≥rmula de la elasticidad: EPD = (ŒîQ / Qprom) / (ŒîP / Pprom) = (-10 / 95) / (2 / 11).",
    "6. Calcular EPD: EPD = (-0.1053) / (0.1818) = -0.58.",
    "7. Interpretaci√≥n: La elasticidad precio de la demanda es -0.58, lo que indica que la demanda es inel√°stica."
  ],
  "output": {
    "value": -0.58,
    "type": "inel√°stica"
  }
}
----------------------------------------------------

In [13]:
import openai
import os
import json

# ‚ö†Ô∏è ADVERTENCIA: Debes inicializar 'client' correctamente.
# Este c√≥digo asume que la variable 'client' est√° definida globalmente
# y la conexi√≥n a la API est√° configurada.

# --- Plantilla reutilizable para el curso ---
def ask_model(prompt: str,
              model: str = "gpt-4o-mini",
              temperature: float = 0.1,
              max_tokens: int = 400, # Valor por defecto m√°s com√∫n
              system: str | None = None):
    """
    Funci√≥n para interactuar con un modelo de lenguaje y observar el efecto de max_tokens.
    """
    
    # Manejo b√°sico de la ausencia de 'client' para simulaci√≥n
    try:
        if 'client' not in globals() and 'client' not in locals():
            raise NameError("La variable 'client' no est√° definida.")
            
        messages = []
        if system:
            messages.append({"role": "system", "content": system})
            
        messages.append({"role": "user", "content": prompt})
        
        resp = client.chat.completions.create(
            model=model,
            messages=messages,
            temperature=temperature,
            max_tokens=max_tokens # üëà El valor que se va a limitar
        )
        return resp.choices[0].message.content
        
    except NameError:
        # Respuesta simulada si 'client' no est√° definido
        simulated_response = (
            "La fusi√≥n nuclear es el proceso mediante el cual dos n√∫cleos at√≥micos ligeros se combinan para formar un n√∫cleo m√°s pesado. Este proceso libera una enorme cantidad de energ√≠a, mucho mayor que la fisi√≥n nuclear. Ocurre naturalmente en el Sol y las estrellas, donde las altas temperaturas y presiones superan la repulsi√≥n coul√≥mbica de los n√∫cleos. En la Tierra, se busca replicar esta reacci√≥n en reactores de confinamiento magn√©tico (como los tokamaks) o inercial, utilizando is√≥topos de hidr√≥geno (deuterio y tritio) como combustible, para crear una fuente de energ√≠a limpia y pr√°cticamente inagotable. Es el santo grial de la energ√≠a."
        )
        if max_tokens < len(simulated_response.split()):
            return f"SIMULACI√ìN DE CORTE (max_tokens={max_tokens}): {simulated_response[:max_tokens*5]}..." # Aprox. 5 caracteres por token en espa√±ol
        return simulated_response
    except Exception as e:
        return f"Error al comunicarse con la API: {e}"

# --- Definiciones para el Ejemplo de Uso ---

# üí¨ PROMPT que pide una respuesta LAAAARGA para forzar el corte.
prompt_largo = "Explica detalladamente qu√© es la fusi√≥n nuclear, d√≥nde ocurre, por qu√© es importante y los principales desaf√≠os para su implementaci√≥n en la Tierra. Necesito una explicaci√≥n extensa."

# ü§ñ SYSTEM: Instrucci√≥n de tono simple.
system_instruccion = "Responde con un tono informativo y acad√©mico."


# --- Ejemplo de Uso y Verificaci√≥n ---

print("--- 1. Ejecuci√≥n con max_tokens BAJO (40 tokens) ---")
# El modelo deber√≠a detenerse abruptamente en medio de una frase.
print(ask_model(
    prompt=prompt_largo,
    temperature=0.1, # Baja para que la respuesta sea coherente hasta el corte
    max_tokens=40,   # üëà Valor bajo para forzar el corte
    system=system_instruccion
))

print("\n" + "="*50 + "\n")

print("--- 2. Ejecuci√≥n con max_tokens ALTO (400 tokens) ---")
# El modelo deber√≠a completar toda la explicaci√≥n.
print(ask_model(
    prompt=prompt_largo,
    temperature=0.1, 
    max_tokens=400, # üëà Valor alto, suficiente para la respuesta
    system=system_instruccion
))
print("\n" + "="*50)

--- 1. Ejecuci√≥n con max_tokens BAJO (40 tokens) ---
La fusi√≥n nuclear es un proceso f√≠sico en el cual dos n√∫cleos at√≥micos ligeros se combinan para formar un n√∫cleo m√°s pesado, liberando una cantidad significativa de energ√≠a en el proceso


--- 2. Ejecuci√≥n con max_tokens ALTO (400 tokens) ---
La fusi√≥n nuclear es un proceso f√≠sico en el cual dos n√∫cleos at√≥micos ligeros se combinan para formar un n√∫cleo m√°s pesado, liberando una cantidad significativa de energ√≠a en el proceso. Este fen√≥meno es el responsable de la producci√≥n de energ√≠a en las estrellas, incluida nuestra propia estrella, el Sol.

### Proceso de Fusi√≥n Nuclear

La fusi√≥n nuclear ocurre cuando los n√∫cleos de dos √°tomos ligeros, como el hidr√≥geno, se acercan lo suficiente como para superar la repulsi√≥n electrost√°tica que existe entre ellos debido a sus cargas positivas. Para que esto suceda, es necesario alcanzar condiciones extremas de temperatura y presi√≥n, que permiten que los n√∫cleos se fu

In [14]:
import openai
import json
import os 
# ‚ö†Ô∏è ADVERTENCIA: Debes inicializar 'client' correctamente.
# Si est√°s en un entorno donde 'client' no est√° definido, el c√≥digo usar√°
# la respuesta simulada para demostrar el corte.

# --- Plantilla reutilizable para el curso ---
def ask_model(prompt: str,
              model: str = "gpt-4o-mini",
              temperature: float = 0.1,
              max_tokens: int = 400, # Valor por defecto
              system: str | None = None):
    """
    Funci√≥n para interactuar con un modelo de lenguaje.
    """
    
    # Simulaci√≥n de la respuesta si 'client' no est√° definido,
    # para demostrar el efecto del max_tokens.
    if 'client' not in globals() and 'client' not in locals():
        # Simulamos una respuesta que deber√≠a ser larga, pero se corta a 40 tokens.
        simulated_response = {
            "prompt": prompt,
            "respuesta_completa_esperada": "La arquitectura Von Neumann es un dise√±o fundamental que utiliza una √∫nica memoria para almacenar tanto las instrucciones del programa como los datos que ser√°n procesados. Esto simplifica la estructura de control, pero puede generar un cuello de botella...",
            "respuesta_simulada_cortada": "La arquitectura Von Neumann utiliza una √∫nica memoria para almacenar tanto las instrucciones del programa como los datos que ser√°n procesados. Esto simplifica la estructura de control, pero puede generar un cuello de botella conocido como el 'cuello de botella de Von Neumann', que limita la velocidad de procesamiento al tener que acceder a una misma ruta para ambas tareas. Esta limitaci√≥n afecta directamente el rendimiento...",
            "respuesta_cortada_a_40_tokens": "La arquitectura Von Neumann utiliza una √∫nica memoria para almacenar tanto las instrucciones del programa como los datos que ser√°n procesados. Esto simplifica la estructura de control, pero puede generar un cuello de botella conocido como el 'cuello de botella de Von Neumann', que limita la velocidad de procesamiento al tener que acceder a una misma ruta para"
        }
        
        # Devolvemos la respuesta cortada simulada para el ejercicio
        # N√≥tese que el modelo real NO genera un JSON incompleto, sino que corta el texto.
        if max_tokens <= 40:
             # Devolvemos el texto cortado para demostrar el efecto
             # Ignoramos temporalmente la exigencia de JSON para mostrar el corte puro.
            return simulated_response["respuesta_cortada_a_40_tokens"] + "..." 
        else:
            return "Simulaci√≥n de respuesta larga sin corte."
        
    # Si 'client' est√° definido, se ejecuta la llamada real a la API
    try:
        messages = []
        if system:
            messages.append({"role": "system", "content": system})
            
        messages.append({"role": "user", "content": prompt})
        
        resp = client.chat.completions.create(
            model=model,
            messages=messages,
            temperature=temperature,
            max_tokens=max_tokens # Aqu√≠ aplicamos el l√≠mite
        )
        return resp.choices[0].message.content
        
    except Exception as e:
        return f"Error: La llamada real fall√≥. {e}"

# --- Definiciones para el Ejemplo de Uso (Inform√°tica) ---

# üéØ PROMPT DE INFORM√ÅTICA: Pide una explicaci√≥n detallada.
prompt_informatica = "Explica en detalle los principios fundamentales de la arquitectura Von Neumann y por qu√© se la conoce como el 'cuello de botella'."

# ü§ñ SYSTEM: Instrucci√≥n de tono (manteniendo el tono)
system_request = "Responde en un tono t√©cnico y detallado. La respuesta debe ser lo m√°s extensa posible para probar el l√≠mite de tokens."

# --- Ejemplo de Uso con max_tokens BAJO (40) ---

LIMITE_DE_TOKENS = 40

print("--- Ejecutando Modelo con L√≠mite de Tokens (max_tokens=40) ---")
print(f"Pregunta: {prompt_informatica}")
print(f"L√≠mite de tokens establecido: {LIMITE_DE_TOKENS}\n")

respuesta_cortada = ask_model(
    prompt=prompt_informatica,
    temperature=0.1,
    max_tokens=LIMITE_DE_TOKENS, # üö® Aqu√≠ se aplica el l√≠mite bajo
    system=system_request
)

print("### RESPUESTA CORTADA ###")
print(respuesta_cortada)
print("\n--- Observaci√≥n ---")
print("Como puedes ver, la respuesta se interrumpe abruptamente (usualmente a mitad de una frase) porque el modelo alcanz√≥ el l√≠mite de 40 tokens antes de terminar la explicaci√≥n o de cerrar cualquier estructura (como un JSON o una frase completa).")

# --- Ejemplo de Uso con max_tokens ALTO (400) ---
print("\n--- Ejecutando Modelo con L√≠mite ALTO (max_tokens=400) para comparaci√≥n ---")

respuesta_completa = ask_model(
    prompt=prompt_informatica,
    temperature=0.1,
    max_tokens=400,
    system=system_request
)

print("\n### RESPUESTA COMPLETA (Simulada o Real) ###")
print(respuesta_completa)
print("----------------------------------------------------------")

--- Ejecutando Modelo con L√≠mite de Tokens (max_tokens=40) ---
Pregunta: Explica en detalle los principios fundamentales de la arquitectura Von Neumann y por qu√© se la conoce como el 'cuello de botella'.
L√≠mite de tokens establecido: 40

### RESPUESTA CORTADA ###
La arquitectura Von Neumann es un modelo de dise√±o de computadoras que fue propuesto por el matem√°tico y f√≠sico John von Neumann en la d√©cada de 1940. Este modelo ha sido fundamental

--- Observaci√≥n ---
Como puedes ver, la respuesta se interrumpe abruptamente (usualmente a mitad de una frase) porque el modelo alcanz√≥ el l√≠mite de 40 tokens antes de terminar la explicaci√≥n o de cerrar cualquier estructura (como un JSON o una frase completa).

--- Ejecutando Modelo con L√≠mite ALTO (max_tokens=400) para comparaci√≥n ---

### RESPUESTA COMPLETA (Simulada o Real) ###
La arquitectura Von Neumann es un modelo de dise√±o de computadoras que fue propuesto por el matem√°tico y f√≠sico John von Neumann en la d√©cada de 1940.

## 9) Soluci√≥n de problemas comunes
- **`openai.AuthenticationError` / `401`**: clave inv√°lida o no cargada; revisa tu `.env` y reinicia el kernel.
- **`Rate limit`**: excediste el n√∫mero de solicitudes por minuto; espera unos segundos y reintenta.
- **`model_not_found`**: el modelo no existe o no tienes acceso; cambia a uno disponible en tu cuenta.
- **Salidas no JSON**: fija `temperature=0.0‚Äì0.3`, agrega instrucciones `system` estrictas y/o usa funciones nativas de validaci√≥n JSON si el proveedor las ofrece.


## 10) Pr√≥ximos pasos
En la siguiente sesi√≥n se ver√°n **consultas avanzadas**, manejo de contexto y el punto de partida para construir un **asistente con RAG** (recuperaci√≥n de conocimiento) usando materiales del curso.
