# Uso de un modelo LLM

## LLM (tambi√©n conocidos como Modelos)
* Los LLM (Large Language Models, tambi√©n llamados "Modelos") pueden interpretar y generar texto como los humanos. Son lo suficientemente vers√°tiles como para escribir contenido, traducir idiomas, resumir y responder preguntas sin necesidad de entrenamiento especializado para cada tarea.

## ¬øQu√© m√°s pueden hacer los Modelos?
Adem√°s de la generaci√≥n de texto, muchos modelos soportan:
* **Llamadas a herramientas** - invocar herramientas externas (como consultas a bases de datos o llamadas API) y usar los resultados en sus respuestas.
* **Salida estructurada** - donde la respuesta del modelo est√° limitada a seguir un formato definido.
* **Multimodalidad** - procesar y devolver datos distintos al texto, como
    * im√°genes,
    * audio,
    * y v√≠deo.
* **Razonamiento** - los modelos realizan razonamiento en m√∫ltiples pasos para llegar a una conclusi√≥n.

## El papel de los Modelos en las aplicaciones LLM y agentes IA
Los modelos se pueden utilizar de dos formas:
* Con agentes - Los modelos pueden especificarse din√°micamente al crear un agente.
* De forma independiente - Los modelos se pueden llamar directamente (fuera del bucle del agente) para tareas como
    * generaci√≥n de texto,
    * clasificaci√≥n,
    * o extracci√≥n
    * sin necesidad de un framework de agentes.

La misma interfaz de modelo funciona en ambos contextos, lo que te da la flexibilidad de empezar de forma sencilla y escalar a flujos de trabajo m√°s complejos basados en agentes seg√∫n sea necesario.
* **Los modelos son el motor de razonamiento de las aplicaciones LLM y los agentes IA**. Impulsan el proceso de toma de decisiones del agente, determinando qu√© herramientas llamar, c√≥mo interpretar los resultados y cu√°ndo proporcionar una respuesta final.
* **La calidad y capacidades del modelo que elijas impactan directamente en la fiabilidad y rendimiento base de tu agente**. Diferentes modelos destacan en diferentes tareas - algunos son mejores siguiendo instrucciones complejas, otros en razonamiento estructurado, y algunos soportan ventanas de contexto m√°s grandes para manejar m√°s informaci√≥n.

## Recuerda, para usar un Modelo necesitar√°s cargar el archivo .env para asegurarte de que LangChain conoce la clave API del modelo que quieres usar
* Cargar√°s el archivo .env al inicio de tu ejercicio as√≠:

In [None]:
from dotenv import load_dotenv

load_dotenv()

## LangChain proporciona una forma estandarizada de usar Modelos
* Cada modelo tiene una API diferente. En lugar de tener que aprender cada una de estas APIs, con LangChain tienes una forma estandarizada de acceder y usar la mayor√≠a de modelos que existen.
* Para una lista completa de modelos soportados en LangChain, consulta la p√°gina de [integraciones](https://docs.langchain.com/oss/python/integrations/providers/overview).

## ¬øCu√°l es el mejor modelo LLM de OpenAI para usar en la clase de principiantes?
Para una clase de **principiantes** de LangChain en enero de 2026, elegiremos **gpt-4o-mini** como predeterminado.

### ¬øPor qu√© **gpt-4o-mini** es el mejor "valor predeterminado para ense√±anza" ahora?

* **Comportamiento predecible para agentes/llamadas a herramientas**: Los principiantes necesitan ejecuciones que "simplemente funcionen" para poder aprender *conceptos de LangChain* (mensajes, herramientas, memoria, salida estructurada) sin perseguir rarezas del modelo.
* **Coste muy bajo** mientras sigue siendo fuerte en seguimiento de instrucciones y ayuda b√°sica con c√≥digo.
* **Contexto abundante** para demostraciones de clase (contexto de 128k).

### Cu√°ndo usar **gpt-5-mini**

Usaremos **gpt-5-mini** cuando ense√±emos:

* **patrones ag√©nticos** m√°s complejos,
* **selecci√≥n/planificaci√≥n de herramientas** m√°s robusta,
* cadenas m√°s largas donde un poco m√°s de "inteligencia" ayuda a los estudiantes a ver menos fallos extra√±os.

Sigue siendo relativamente asequible comparado con los modelos insignia, pero notablemente m√°s caro que 4o-mini.

### Por qu√© *no* usar√≠amos **gpt-5-nano** como predeterminado (como hace a menudo el equipo de LangChain en la documentaci√≥n de LangChain)

* Se comercializa como la variante GPT-5 **m√°s r√°pida/m√°s barata** y es genial para **resumen/clasificaci√≥n**.
* Pero se han reportado **problemas de integraci√≥n reales con LangChain** donde `gpt-5-nano` puede devolver **contenido vac√≠o** sin errores obvios‚Äîexactamente el tipo de confusi√≥n "¬øpor qu√© no se imprimi√≥ nada?" que descarrila una clase de principiantes.

### Nuestra recomendaci√≥n pr√°ctica

* **Recomendaci√≥n predeterminada para todos los estudiantes:** **gpt-4o-mini**
* **Secci√≥n "avanzada / bonus":** cambiar a **gpt-5-mini**

## Conectar con el modelo LLM
* Para este ejercicio, nos conectaremos con el modelo gpt-5-nano de OpenAI.

In [None]:
from langchain.chat_models import init_chat_model

model = init_chat_model(
    model="gpt-4o-mini",
    temperature=0.0
)

## Qu√© hace este c√≥digo

```python
model = init_chat_model(
    model="gpt-4o-mini",
    temperature=0.0
)
```

Este c√≥digo **crea un modelo de IA basado en chat** con el que tu aplicaci√≥n de LangChain puede hablar.

Piensa en ello como **conectar un cerebro de IA a tu programa** y decidir *c√≥mo debe comportarse*.

---

#### 1. `init_chat_model(...)`

Esta es una **funci√≥n auxiliar de LangChain** que:

* Se conecta a un modelo de chat de OpenAI
* Lo envuelve en una interfaz compatible con LangChain
* Devuelve un objeto que puedes usar para enviar mensajes y recibir respuestas

En t√©rminos simples:

> "Configura un modelo de chat de IA para que mi c√≥digo pueda hablar con √©l."

---

#### 2. `model="gpt-4o-mini"`

Esto elige **qu√© modelo de IA** quieres usar.

* **gpt-4o-mini** es:

  * R√°pido ‚ö°
  * M√°s barato üí∏
  * A√∫n muy capaz para razonamiento, res√∫menes, clasificaci√≥n y redacci√≥n

Piensa en ello como:

> "Usa una versi√≥n ligera pero inteligente de GPT-4."

---

#### 3. `temperature=0.0`

Esto controla **cu√°n creativo vs. predecible** es el modelo.

* `temperature = 0.0` ‚Üí muy factual, consistente, aburrido
* `temperature = 1.0` ‚Üí m√°s creativo, variado, similar a humanos
* `temperature > 1.0` ‚Üí muy imaginativo, a veces ca√≥tico

As√≠ que aqu√≠:

> "Proporciona respuestas muy factuales y consistentes."


### Resumen en una frase

> Este c√≥digo configura un modelo de chat de nivel GPT-4 r√°pido con respuestas factuales para que tu aplicaci√≥n LangChain pueda hablar con una IA.

In [None]:
response = model.invoke("¬øQui√©n mat√≥ a JFK?")

print(response.content)

## .invoke vs. .stream para usar el Modelo en LangChain
.invoke y .stream son las formas m√°s frecuentes de usar un Modelo.
* .invoke generar√° respuestas en peque√±os fragmentos.
* .stream generar√° respuestas en un flujo continuo, como lo que puedes ver en chatGPT.

In [None]:
response = model.invoke("¬øCu√°l es la mejor cafeter√≠a de San Francisco?")
print(response.content)

In [None]:
for chunk in model.stream("¬øCu√°l es el mejor restaurante espa√±ol de San Francisco?"):
    print(chunk.text, end="|", flush=True)

#### Qu√© hacen `.invoke()` vs `.stream()`:

- **`.invoke()`**: Espera a la respuesta completa, luego te la da toda de una vez
- **`.stream()`**: Te da la respuesta pieza por pieza mientras se est√° generando (como ver escribir a ChatGPT en tiempo real)

#### Qu√© hace `end="|"` en el ejemplo de .stream():

Normalmente, la funci√≥n `print()` de Python a√±ade un **salto de l√≠nea** al final, as√≠ que cada impresi√≥n aparece en una nueva l√≠nea:
```
fragmento1
fragmento2
fragmento3
```

Al usar `end="|"`, le est√°s diciendo a Python: "En lugar de un salto de l√≠nea, pon un car√°cter de tuber√≠a `|` al final." Esto hace que todo se imprima en la **misma l√≠nea**, separado por tuber√≠as:
```
fragmento1|fragmento2|fragmento3|
```

#### ¬øPor qu√© usarlo en este ejemplo?

El `end="|"` es principalmente **con fines demostrativos** - te ayuda a **visualizar** que la respuesta est√° llegando en fragmentos separados en lugar de todo a la vez. Puedes ver literalmente d√≥nde empieza y termina cada pieza.

En una aplicaci√≥n real, normalmente usar√≠as `end=""` en su lugar (que significa "no a√±adas nada al final"), para que el texto fluya suavemente sin separadores - justo como ChatGPT se te muestra.

La parte `flush=True` asegura que cada fragmento se muestre inmediatamente en lugar de esperar en un b√∫fer.

## Mira c√≥mo funciona .stream en la mayor√≠a de los casos

In [None]:
for chunk in model.stream("¬øCu√°l es el mejor Meetup para expatriados europeos en San Francisco?"):
    print(chunk.text, end="", flush=True)

## Opciones avanzadas para streaming en LangChain 1.0
En LangChain 1.0 tenemos algunas opciones avanzadas con streaming:
* Transmitir progreso del agente ‚Äî obtener actualizaciones de estado despu√©s de cada paso del agente.
    * Esta opci√≥n es muy com√∫n en la mayor√≠a de agentes IA de nivel de producci√≥n.
* Transmitir tokens LLM ‚Äî transmitir tokens del modelo de lenguaje a medida que se generan.
* Transmitir actualizaciones personalizadas ‚Äî emitir se√±ales definidas por el usuario (ej., "Obtenidos 10/100 registros").
* Transmitir m√∫ltiples modos ‚Äî elegir entre actualizaciones (progreso del agente), mensajes (tokens LLM + metadatos) o personalizado (datos arbitrarios del usuario).

Puedes ver c√≥mo implementar estos enfoques avanzados en esta [p√°gina de documentaci√≥n de LangChain](https://docs.langchain.com/oss/python/langchain/streaming).

## Modelos alternativos

In [None]:
model2 = init_chat_model(model="claude-sonnet-4-5")

#### Algunos modelos como Gemini requieren importaciones personalizadas

In [None]:
from langchain_google_genai import ChatGoogleGenerativeAI

model3 = ChatGoogleGenerativeAI(model="gemini-3-pro-preview")

## C√≥mo ejecutar este c√≥digo desde Visual Studio Code
* Abre el Terminal.
* Aseg√∫rate de estar en la carpeta del proyecto.
* Aseg√∫rate de tener el entorno poetry activado.
* Introduce y ejecuta el siguiente comando:
    * `python 001-using-llm-model.py`