# Introducci√≥n a APIs de Modelos de Lenguaje

## Objetivos de Aprendizaje

En este cuaderno vas a aprender:
- Qu√© es una API y c√≥mo nos permite acceder a modelos de lenguaje grandes (LLMs)
- C√≥mo configurar y autenticar tu conexi√≥n con OpenAI
- T√©cnicas de prompting b√°sicas para extraer informaci√≥n estructurada
- Casos de uso pr√°cticos del procesamiento del lenguaje natural

## ¬øQu√© es una API?

Una **API** (Application Programming Interface) es una interfaz que permite que dos sistemas se comuniquen entre s√≠. En nuestro caso, nos permite enviar texto a un modelo de lenguaje (como GPT-4) y recibir una respuesta procesada.

**Analog√≠a**: Imaginate que est√°s en un restaurante. Vos sos el cliente (tu programa), el mozo es la API, y la cocina es el modelo de lenguaje. Vos le ped√≠s algo al mozo (envi√°s un prompt), el mozo se lo lleva a la cocina (el modelo procesa), y te trae de vuelta el plato (la respuesta).

## Prerequisitos

Para usar este cuaderno necesit√°s:
1. Una cuenta en OpenAI (https://platform.openai.com)
2. Una API key (se genera en https://platform.openai.com/account/api-keys)
3. Cr√©dito en tu cuenta de OpenAI (hay planes gratuitos para empezar)

**Nota sobre costos**: Los modelos como `gpt-4o-mini` son muy econ√≥micos (menos de $0.01 por cada 1000 palabras procesadas).

## Configuraci√≥n del Entorno

Primero instalamos la librer√≠a de OpenAI y configuramos la autenticaci√≥n. Este c√≥digo detecta autom√°ticamente si est√°s en Google Colab o trabajando localmente, y carga la API key desde el lugar apropiado.

In [None]:
# Instalamos la librer√≠a oficial de OpenAI
!pip install --upgrade openai --quiet

import os
from openai import OpenAI

# Detectamos si estamos en Google Colab o en entorno local
IN_COLAB = False
try:
    import google.colab
    from google.colab import userdata
    IN_COLAB = True
except Exception:
    IN_COLAB = False

# Cargamos la API key seg√∫n el entorno
OPENAI_API_KEY = None
if IN_COLAB:
    # En Colab: usar secrets (icono de llave en la barra lateral)
    try:
        OPENAI_API_KEY = userdata.get('OPENAI_API_KEY')
    except Exception:
        OPENAI_API_KEY = os.getenv('OPENAI_API_KEY')
else:
    # En local: usar variable de entorno o archivo .env
    OPENAI_API_KEY = os.getenv('OPENAI_API_KEY')

if not OPENAI_API_KEY:
    raise ValueError(
        'OPENAI_API_KEY no encontrada.\n'
        'En Colab: agregala en Secrets (icono de llave)\n'
        'En local: agregala a tus variables de entorno o archivo .env'
    )

print(f"API key cargada correctamente. Entorno: {'Colab' if IN_COLAB else 'Local'}")

[?25l   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m0.0/1.0 MB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m[91m‚ï∏[0m[90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m0.2/1.0 MB[0m [31m6.4 MB/s[0m eta [36m0:00:01[0m[2K   [91m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m[91m‚ï∏[0m [32m1.0/1.0 MB[0m [31m13.8 MB/s[0m eta [36m0:00:01[0m[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m1.0/1.0 MB[0m [31m9.8 MB/s[0m eta [36m0:00:00[0m
[?25hAPI key cargada correctamente. Entorno: Colab


### Notas T√©cnicas: Configuraci√≥n de API Key

**En Google Colab**:
1. Clic en el icono de llave en la barra lateral izquierda
2. Agregar un nuevo secret con nombre `OPENAI_API_KEY`
3. Pegar tu API key como valor

**En entorno local**:
```bash
# Opci√≥n 1: Variable de entorno (Linux/Mac)
export OPENAI_API_KEY='tu-api-key-aqui'

# Opci√≥n 2: Archivo .env
# Crear archivo .env en la ra√≠z del proyecto:
OPENAI_API_KEY=tu-api-key-aqui
```

**Seguridad**: Nunca subas tu API key a GitHub o la compartas p√∫blicamente. Las API keys son como contrase√±as y dan acceso a tu cuenta (y cr√©dito) de OpenAI.

## Funci√≥n Auxiliar: get_completion()

Creamos una funci√≥n helper que simplifica el env√≠o de prompts a la API. Esta funci√≥n encapsula toda la l√≥gica de comunicaci√≥n y nos permite concentrarnos en el contenido de nuestros prompts.

### Par√°metros configurables:

- **prompt** (str): El texto que queremos enviar al modelo
- **model** (str): Qu√© modelo usar. Opciones comunes:
  - `gpt-4o-mini`: R√°pido, econ√≥mico, ideal para la mayor√≠a de tareas
  - `gpt-4o`: M√°s potente, mejor razonamiento, m√°s caro
  - `gpt-4-turbo`: Balance entre velocidad y capacidad
- **temperature** (float, 0-2): Controla la aleatoriedad de las respuestas
  - `0.0`: Determin√≠stico, siempre responde igual (ideal para extracci√≥n de datos)
  - `0.7`: Balance (bueno para texto general)
  - `1.5-2.0`: Creativo, m√°s variado (√∫til para generaci√≥n creativa)

**Recomendaci√≥n**: Para tareas de extracci√≥n y an√°lisis, us√° temperature=0. Para generaci√≥n creativa, prob√° con valores entre 0.7 y 1.0.

In [None]:
def get_completion(prompt, model="gpt-4o-mini", temperature=0):
    """
    Env√≠a un prompt a la API de OpenAI y devuelve la respuesta.

    Par√°metros:
    -----------
    prompt : str
        El texto que queremos enviar al modelo
    model : str, default="gpt-4o-mini"
        Modelo a utilizar (gpt-4o-mini es econ√≥mico y efectivo)
    temperature : float, default=0
        Grado de aleatoriedad (0 = determin√≠stico, 2 = muy creativo)

    Returns:
    --------
    str
        La respuesta generada por el modelo
    """
    # Creamos el cliente de OpenAI
    client = OpenAI(api_key=OPENAI_API_KEY)

    # Estructuramos el mensaje como conversaci√≥n
    messages = [{"role": "user", "content": prompt}]

    # Hacemos el request a la API
    response = client.chat.completions.create(
        model=model,
        messages=messages,
        temperature=temperature
    )

    # Extraemos y devolvemos solo el contenido de la respuesta
    return response.choices[0].message.content

## Ejemplo 1: An√°lisis de Sentimiento en Reviews

Vamos a analizar una review de MercadoLibre y extraer informaci√≥n estructurada. Este es un caso de uso muy com√∫n en comercio electr√≥nico.

**Objetivo**: Dado un comentario de un cliente, queremos extraer autom√°ticamente:
- El sentimiento general (positivo/negativo/neutro)
- Si el cliente est√° enojado
- Qu√© producto compr√≥
- Qu√© marca es

Esto permite procesar miles de reviews autom√°ticamente para detectar problemas, medir satisfacci√≥n, etc.

In [None]:
# Review real de un producto (simulada pero realista)
review_producto = """
Compr√© estos auriculares porque ten√≠an buenas rese√±as y el precio era razonable.
La verdad que llegaron r√°pido, en dos d√≠as ya los ten√≠a. El sonido es bastante bueno
para el precio, se escucha claro y los graves est√°n bien. Lo que no me gust√≥ es que
despu√©s de un mes de uso, el auricular derecho empez√≥ a sonar m√°s bajo que el izquierdo.
Contact√© al vendedor y me mandaron otro par sin problema. El servicio de atenci√≥n fue
excelente, respondieron al toque y resolvieron todo. En general estoy conforme, pero
esperaba que duraran m√°s antes de tener problemas.
"""

### Construcci√≥n del Prompt

Un buen prompt es espec√≠fico y claro sobre qu√© formato queremos en la respuesta. Ac√° aplicamos varias t√©cnicas:

1. **Instrucciones claras**: Describimos exactamente qu√© queremos extraer
2. **Formato estructurado**: Pedimos JSON para poder parsear program√°ticamente
3. **Manejo de casos edge**: Indicamos qu√© hacer si falta informaci√≥n
4. **Delimitadores**: Usamos triple comillas para delimitar el texto a analizar

In [None]:
prompt = f"""
Analiza la siguiente review de producto y extrae la informaci√≥n en formato JSON.

Informaci√≥n a extraer:
- Sentimiento: positivo, negativo o neutro
- Enojado: true o false (¬øel cliente expresa enojo?)
- Producto: qu√© producto compr√≥
- Problema: si hubo alg√∫n problema, cu√°l fue
- Calidad_atencion: c√≥mo fue el servicio al cliente

Si alguna informaci√≥n no est√° presente, us√° "no_especificado".
El campo "Enojado" debe ser booleano (true/false).

Review: ```{review_producto}```

Responde √∫nicamente con el JSON, sin texto adicional.
"""

respuesta = get_completion(prompt)
print("AN√ÅLISIS DE LA REVIEW:")
print(respuesta)

AN√ÅLISIS DE LA REVIEW:
```json
{
  "Sentimiento": "positivo",
  "Enojado": false,
  "Producto": "auriculares",
  "Problema": "el auricular derecho empez√≥ a sonar m√°s bajo que el izquierdo",
  "Calidad_atencion": "excelente"
}
```


### An√°lisis del Resultado

Observ√° que el modelo pudo:
1. Identificar que el sentimiento es mixto/neutro (hay aspectos positivos y negativos)
2. Detectar que no hay enojo expl√≠cito
3. Extraer el producto espec√≠fico
4. Identificar el problema t√©cnico
5. Valorar positivamente la atenci√≥n al cliente

Todo esto en formato JSON que podemos usar program√°ticamente:

```python
import json
datos = json.loads(respuesta)
print(datos['Sentimiento'])  # Acceso a los datos
```

## Ejemplo 2: An√°lisis de Noticias Period√≠sticas

Ahora vamos a trabajar con un texto period√≠stico y extraer informaci√≥n estructurada relevante. Este tipo de an√°lisis es √∫til para:
- Sistemas de monitoreo de medios
- Agregadores de noticias
- An√°lisis de cobertura medi√°tica
- Detecci√≥n de temas trending

In [None]:
# Nota period√≠stica simulada
noticia = """
BUENOS AIRES - El Ministerio de Cultura anunci√≥ ayer la apertura de tres nuevos
espacios culturales en barrios de la zona sur de la ciudad. Los centros culturales
se ubicar√°n en Parque Patricios, Pompeya y Nueva Pompeya, y comenzar√°n a funcionar
en marzo de 2024.

Seg√∫n inform√≥ la ministra de Cultura, Mar√≠a Rodr√≠guez, los espacios contar√°n con
talleres gratuitos de m√∫sica, teatro, danza y artes visuales. "Es fundamental
descentralizar la oferta cultural y llegar a todos los barrios de la ciudad",
afirm√≥ la funcionaria durante la conferencia de prensa.

La inversi√≥n total del proyecto asciende a $450 millones y se espera que beneficie
directamente a m√°s de 15.000 vecinos de la zona sur. Las inscripciones para los
talleres comenzar√°n en febrero a trav√©s de la web oficial del Ministerio.
"""

In [None]:
prompt_noticia = f"""
Analiza la siguiente noticia y extrae la informaci√≥n clave en formato JSON:

- Tema_principal: tema central de la noticia
- Ubicacion: d√≥nde ocurre el hecho
- Fecha_evento: cu√°ndo ocurrir√° o ocurri√≥
- Protagonistas: personas u organizaciones mencionadas
- Datos_numericos: cifras relevantes (monto, cantidad de personas, etc.)
- Categoria: clasific√° en pol√≠tica, econom√≠a, cultura, sociedad, deportes, tecnolog√≠a

Si no hay informaci√≥n, us√° "no_especificado".

Noticia: ```{noticia}```

Devuelve solo el JSON.
"""

analisis_noticia = get_completion(prompt_noticia)
print("AN√ÅLISIS DE LA NOTICIA:")
print(analisis_noticia)

AN√ÅLISIS DE LA NOTICIA:
```json
{
  "Tema_principal": "Apertura de nuevos espacios culturales",
  "Ubicacion": "Buenos Aires, zona sur",
  "Fecha_evento": "marzo de 2024",
  "Protagonistas": ["Ministerio de Cultura", "Mar√≠a Rodr√≠guez"],
  "Datos_numericos": {
    "inversion": 450000000,
    "beneficiarios": 15000
  },
  "Categoria": "cultura"
}
```


## Ejemplo 3: Clasificaci√≥n de Comentarios de Redes Sociales

Las redes sociales generan millones de comentarios por d√≠a. Los LLMs pueden ayudarnos a clasificarlos autom√°ticamente seg√∫n diferentes criterios.

**Caso de uso**: Moderaci√≥n de contenido, an√°lisis de opini√≥n p√∫blica, detecci√≥n de toxicidad.

In [None]:
# Colecci√≥n de comentarios simulados
comentarios = [
    "Excelente la nueva temporada! La mejor serie que vi en a√±os üî•",
    "No entiendo por qu√© le dan tanto hype, es bastante meh",
    "Alguien sabe d√≥nde puedo conseguir las zapatillas que usa el prota?",
    "SPOILER: No puedo creer que mataron a ese personaje!!! üò≠",
    "Qu√© basura, perd√≠ 3 horas de mi vida viendo esto"
]

In [None]:
# Procesamos m√∫ltiples comentarios
print("CLASIFICACI√ìN DE COMENTARIOS:\n")

for i, comentario in enumerate(comentarios, 1):
    prompt_comentario = f"""
    Clasifica este comentario seg√∫n:
    - Sentimiento: positivo, negativo o neutral
    - Tipo: opinion, pregunta, spoiler, spam, otro
    - Toxicidad: baja, media, alta

    Comentario: ```{comentario}```

    Devuelve solo un JSON con esas tres claves.
    """

    resultado = get_completion(prompt_comentario)
    print(f"Comentario {i}: {comentario}")
    print(f"An√°lisis: {resultado}")
    print("-" * 80)

CLASIFICACI√ìN DE COMENTARIOS:

Comentario 1: Excelente la nueva temporada! La mejor serie que vi en a√±os üî•
An√°lisis: ```json
{
    "sentimiento": "positivo",
    "tipo": "opinion",
    "toxicidad": "baja"
}
```
--------------------------------------------------------------------------------
Comentario 2: No entiendo por qu√© le dan tanto hype, es bastante meh
An√°lisis: ```json
{
    "sentimiento": "negativo",
    "tipo": "opinion",
    "toxicidad": "baja"
}
```
--------------------------------------------------------------------------------
Comentario 3: Alguien sabe d√≥nde puedo conseguir las zapatillas que usa el prota?
An√°lisis: ```json
{
    "sentimiento": "neutral",
    "tipo": "pregunta",
    "toxicidad": "baja"
}
```
--------------------------------------------------------------------------------
Comentario 4: SPOILER: No puedo creer que mataron a ese personaje!!! üò≠
An√°lisis: ```json
{
    "sentimiento": "negativo",
    "tipo": "spoiler",
    "toxicidad": "baja"
}
``

## Experimentaci√≥n: Prob√° Modificar los Par√°metros

Esta secci√≥n est√° dise√±ada para que experimentes con diferentes configuraciones y veas c√≥mo cambian los resultados.

### Ejercicio 1: Efecto de la temperatura

Ejecut√° la siguiente celda varias veces cambiando el par√°metro `temperature` y observ√° c√≥mo var√≠an las respuestas.

In [None]:
# Zona de experimentaci√≥n - Modifica estos valores
TEMPERATURA = 0.0  # Prob√° con: 0.0, 0.5, 1.0, 1.5
MODELO = "gpt-4o-mini"  # Prob√° con: "gpt-4o-mini", "gpt-4o"

texto_ejemplo = "El partido estuvo incre√≠ble, se defini√≥ en el √∫ltimo minuto."

prompt_exp = f"""
Reescribe este texto de tres formas diferentes manteniendo el significado:
{texto_ejemplo}
"""

print(f"Usando temperatura={TEMPERATURA} y modelo={MODELO}")
print("\nResultado:")
print(get_completion(prompt_exp, model=MODELO, temperature=TEMPERATURA))

Usando temperatura=0.0 y modelo=gpt-4o-mini

Resultado:
1. El encuentro fue espectacular y se resolvi√≥ en el √∫ltimo instante.
2. El juego fue asombroso, y se decidi√≥ en el √∫ltimo minuto.
3. El partido fue impresionante, con un desenlace que lleg√≥ en el √∫ltimo segundo.


### Ejercicio 2: Tus propios ejemplos

Ahora prob√° con tus propios textos. Puede ser:
- Un comentario de YouTube
- Una review de un producto
- Un titular de noticia
- Un tweet
- Un fragmento de conversaci√≥n

Modific√° las variables y experiment√° con diferentes prompts.

In [None]:
# TU TURNO: Reemplaza este texto con el que quieras analizar
mi_texto = """
Ac√° pega tu texto para analizar...
"""

# Modifica este prompt seg√∫n lo que quieras hacer
mi_prompt = f"""
Analiza este texto y decime:
1. De qu√© se trata
2. Qu√© sentimiento expresa
3. Si hay algo interesante o relevante

Texto: ```{mi_texto}```
"""

print(get_completion(mi_prompt))

## Resumen y Conceptos Clave

### ¬øQu√© aprendimos?

1. **APIs de LLMs**: Interfaces que nos permiten acceder a modelos de lenguaje potentes sin necesidad de entrenarlos nosotros

2. **Configuraci√≥n segura**: C√≥mo manejar API keys sin exponerlas en el c√≥digo

3. **Funci√≥n wrapper**: `get_completion()` simplifica el uso de la API

4. **Par√°metros configurables**:
   - `model`: Qu√© modelo usar (calidad vs costo vs velocidad)
   - `temperature`: Control de creatividad/determinismo

5. **Prompting estructurado**: T√©cnicas para obtener respuestas en formato JSON √∫til

6. **Casos de uso reales**: Reviews, noticias, comentarios de redes sociales

### T√©cnicas de Prompting Aprendidas

- **Instrucciones claras**: Especificar exactamente qu√© queremos
- **Formato de salida**: Pedir JSON para procesar program√°ticamente
- **Manejo de casos edge**: Indicar qu√© hacer con informaci√≥n faltante
- **Delimitadores**: Usar ``` o """ para marcar el texto a procesar
- **Ejemplos espec√≠ficos**: Dar formato de respuesta esperada

### Pr√≥ximos pasos

En el siguiente cuaderno vamos a profundizar en:
- **System prompts**: C√≥mo definir el comportamiento del asistente
- **Conversaciones multi-turno**: Mantener contexto entre mensajes
- **Roles**: Diferencia entre system, user y assistant

## Glosario

**API (Application Programming Interface)**: Conjunto de definiciones y protocolos que permite que dos sistemas se comuniquen

**LLM (Large Language Model)**: Modelo de lenguaje entrenado con grandes cantidades de texto que puede generar, analizar y transformar texto

**Prompt**: Instrucci√≥n o pregunta que le damos al modelo de lenguaje

**Temperature**: Par√°metro que controla la aleatoriedad de las respuestas (0=determin√≠stico, 2=muy creativo)

**Token**: Unidad b√°sica de procesamiento de texto (aproximadamente 0.75 palabras en espa√±ol)

**JSON**: Formato de intercambio de datos estructurado, f√°cil de leer para humanos y m√°quinas

**Endpoint**: URL espec√≠fica de una API donde enviamos nuestros requests

**Request**: Petici√≥n que hacemos a la API con nuestro prompt

**Response**: Respuesta que recibimos de la API despu√©s de procesar nuestro request

## Preguntas Frecuentes

**P: ¬øPor qu√© usar temperature=0 en algunos casos?**

R: Cuando necesitamos respuestas consistentes y determin√≠sticas, especialmente para extracci√≥n de datos estructurados. Con temperature=0, el modelo siempre va a dar la misma respuesta para el mismo prompt.

---

**P: ¬øCu√°nto cuesta usar la API de OpenAI?**

R: Depende del modelo. GPT-4o-mini es el m√°s econ√≥mico (~$0.15 por mill√≥n de tokens de entrada). Para este curso, $5 USD es m√°s que suficiente.

---

**P: ¬øQu√© pasa si mi API key se vence o me quedo sin cr√©dito?**

R: La API va a devolver un error. Podes cargar m√°s cr√©dito en tu cuenta de OpenAI o esperar a que se renueve si ten√©s un plan de subscripci√≥n.

---

**P: ¬øPuedo usar estos modelos sin conexi√≥n a internet?**

R: No, la API de OpenAI requiere conexi√≥n. Sin embargo, en clases posteriores vamos a ver Ollama, que permite ejecutar modelos localmente.

---

**P: ¬øEl modelo tiene acceso a internet o a informaci√≥n actualizada?**

R: No, el modelo solo tiene conocimiento hasta su fecha de entrenamiento (t√≠picamente varios meses atr√°s). En el √∫ltimo cuaderno del m√≥dulo veremos c√≥mo darle acceso a informaci√≥n actualizada mediante b√∫squeda web.

## Referencias y Recursos Adicionales

**Documentaci√≥n oficial**:
- OpenAI API Documentation: https://platform.openai.com/docs
- Gu√≠a de modelos: https://platform.openai.com/docs/models
- Pricing: https://openai.com/pricing

**Recursos recomendados**:
- Curso de DeepLearning.AI sobre Prompt Engineering (gratuito)
- OpenAI Cookbook: Ejemplos pr√°cticos en GitHub
- Comunidad de OpenAI en Discord

**Papers relevantes**:
- "Language Models are Few-Shot Learners" (GPT-3)
- "Training language models to follow instructions" (InstructGPT)