# 🧠 01 - Fundamentos de LLM (Large Language Models)

Este notebook te guía por los conceptos esenciales de los modelos de lenguaje (LLM) y cómo se usan para generar texto.

**Objetivos:**
- Entender qué es un LLM y cómo se usa mediante API.
- Explorar los parámetros de generación (temperature, top-p, etc.).
- Observar diferencias de comportamiento del modelo según el prompt.
- Prepararte para usar Amazon Bedrock y Titan más adelante.


## 🔧 Configuración inicial

Podés usar este notebook con **OpenAI** (requiere API key) o en modo **simulado** si todavía no la tenés.  
Para OpenAI, creá una variable de entorno llamada `OPENAI_API_KEY` o escribila directamente (no recomendable en entornos públicos).

In [1]:
# Si tenés una API key de OpenAI, descomentá y configurala:
# import os
# os.environ["OPENAI_API_KEY"] = "tu_api_key_aqui"

try:
    from openai import OpenAI
    client = OpenAI()
    test_model = True
except Exception as e:
    print("Modo simulado activado. No se encontró API key válida.")
    test_model = False

Modo simulado activado. No se encontró API key válida.


## ✍️ Ejemplo básico de generación de texto

In [2]:
prompt = "Explica en 3 frases qué es un modelo de lenguaje grande (LLM)."

if test_model:
    response = client.chat.completions.create(
        model="gpt-4o-mini",
        messages=[{"role": "user", "content": prompt}]
    )
    print(response.choices[0].message.content)
else:
    print("[Simulación] Un LLM es un modelo de IA que aprende patrones del lenguaje humano a partir de grandes volúmenes de texto. Puede generar, resumir o traducir contenido con coherencia contextual. Son la base de herramientas como ChatGPT o Claude.")

[Simulación] Un LLM es un modelo de IA que aprende patrones del lenguaje humano a partir de grandes volúmenes de texto. Puede generar, resumir o traducir contenido con coherencia contextual. Son la base de herramientas como ChatGPT o Claude.


## 🎛️ Explorando parámetros: temperature y top-p

- **temperature**: controla la *creatividad* (0 = más precisa, 1 = más aleatoria).  
- **top-p**: usa muestreo acumulativo; controla qué porcentaje de probabilidad se considera en cada predicción.

Probá con diferentes valores y observá cómo cambia el tono o la estructura.

In [3]:
prompt = "Describe la importancia de la IA en el sector salud."

if test_model:
    for temp in [0, 0.5, 1.0]:
        print(f"\n--- Temperature = {temp} ---")
        response = client.chat.completions.create(
            model="gpt-4o-mini",
            messages=[{"role": "user", "content": prompt}],
            temperature=temp
        )
        print(response.choices[0].message.content)
else:
    print("[Simulación] A menor temperature, las respuestas serán más técnicas y concisas; a mayor temperature, más creativas y variadas.")

[Simulación] A menor temperature, las respuestas serán más técnicas y concisas; a mayor temperature, más creativas y variadas.


## 🧩 Ejercicio guiado: comparación de prompts

Observá cómo cambia la respuesta dependiendo de **cómo pedís** lo mismo.

In [4]:
prompts = [
    "Explica qué es la computación cuántica.",
    "Explica qué es la computación cuántica como si tu interlocutor fuera un niño de 10 años.",
    "Dame una analogía para entender la computación cuántica.",
]

for p in prompts:
    print(f"\nPrompt: {p}\n")
    if test_model:
        response = client.chat.completions.create(
            model="gpt-4o-mini",
            messages=[{"role": "user", "content": p}]
        )
        print(response.choices[0].message.content)
    else:
        print(f"[Simulación] Respuesta ejemplo para: '{p}'")


Prompt: Explica qué es la computación cuántica.

[Simulación] Respuesta ejemplo para: 'Explica qué es la computación cuántica.'

Prompt: Explica qué es la computación cuántica como si tu interlocutor fuera un niño de 10 años.

[Simulación] Respuesta ejemplo para: 'Explica qué es la computación cuántica como si tu interlocutor fuera un niño de 10 años.'

Prompt: Dame una analogía para entender la computación cuántica.

[Simulación] Respuesta ejemplo para: 'Dame una analogía para entender la computación cuántica.'


## 💡 Reflexión
- Los LLM no *entienden* el lenguaje como humanos, sino que predicen patrones estadísticos.
- El diseño del **prompt** determina la calidad y precisión de la respuesta.
- Cambiar temperature/top-p afecta el balance entre coherencia y creatividad.

👉 En el próximo notebook (`02_rag_example.ipynb`), vas a combinar estas ideas con tus propios documentos (RAG).