# Creando nuestro primer "Agente de IA" con LangChain 1.0
* Como verás más adelante, esto realmente no es un Agente de IA, aunque LangChain lo llame Agente.

In [None]:
from dotenv import load_dotenv

load_dotenv()

In [None]:
from langchain.agents import create_agent

system_prompt = "Eres un periodista de investigación."

agent = create_agent(
    model="gpt-4o-mini",
    system_prompt=system_prompt
)

from langchain.messages import HumanMessage

response = agent.invoke(
    {"messages": [HumanMessage(content="¿Quién mató realmente a JFK?")]}
)

print(response['messages'][-1].content)

#### Expliquemos el código anterior en términos sencillos
Vamos a repasarlo línea por línea y explicar qué hace cada parte en un lenguaje claro.

```python
from langchain.agents import create_agent
```

* Esto importa una función llamada `create_agent` de LangChain.
* Piensa en `create_agent` como un "ayudante" que construye un agente de IA por ti.

```python
system_prompt = "Eres un periodista de investigación."
```

* Esto crea una variable llamada `system_prompt`.
* El texto dentro de ella es una instrucción que establece el *rol/personalidad* de la IA.
* Aquí, le estás diciendo a la IA: "Actúa como un periodista de investigación."

```python
agent = create_agent(
    model="gpt-4o-mini",
    system_prompt=system_prompt
)
```

* Esto crea el agente y lo almacena en una variable llamada `agent`.
* `model="gpt-4o-mini"` le dice a LangChain qué modelo de IA usar.
* `system_prompt=system_prompt` le da al agente la instrucción que escribiste arriba.
* Después de esto, `agent` es básicamente tu "bot periodista" de IA listo para usar.

```python
from langchain.messages import HumanMessage
```

* Esto importa `HumanMessage`, que es una clase de LangChain que representa un mensaje escrito por un usuario humano.
* LangChain usa objetos de mensaje para estructurar conversaciones (mensajes de usuario, mensajes de IA, mensajes del sistema, etc.).

```python
response = agent.invoke(
    {"messages": [HumanMessage(content="¿Quién mató realmente a JFK?")]}
)
```

* Aquí es donde *ejecutas* el agente.
* `invoke(...)` significa: "Toma esta entrada, llama al modelo y devuélveme el resultado."
* Pasas un diccionario con una clave `"messages"`.
* El valor es una lista de mensajes — aquí es solo un `HumanMessage`.
* El `content` de ese mensaje es la pregunta del usuario: `"¿Quién mató realmente a JFK?"`
* El resultado se almacena en `response`.

```python
print(response['messages'][-1].content)
```

* `response` es un objeto estructurado (a menudo una estructura similar a un diccionario) que incluye una lista de mensajes.
* `response['messages']` obtiene los mensajes de conversación devueltos por el agente.
* `[-1]` significa "el último elemento de la lista" (normalmente la respuesta final del agente).
* `.content` obtiene el texto real de ese último mensaje.
* `print(...)` lo muestra en tu terminal.


#### Resumen general (en una frase)

Creas un agente de IA con un rol de "periodista", le envías una pregunta de usuario como un mensaje estructurado, y luego imprimes la respuesta final del agente.

## ¿Es esto realmente un Agente de IA?
**Este código no muestra realmente un comportamiento agéntico** - es simplemente un chatbot elegante, aunque LangChain lo llame "agente".

#### ¿Qué hace que una IA sea "Agéntica"?

Un verdadero agente de IA debería ser capaz de:

1. **Tomar decisiones de forma autónoma** - elegir qué hacer a continuación sin instrucciones humanas constantes
2. **Usar herramientas** - elegir y usar diferentes herramientas (motores de búsqueda, calculadoras, bases de datos) según sea necesario
3. **Planificar tareas de múltiples pasos** - dividir objetivos complejos en pasos más pequeños
4. **Iterar y adaptarse** - probar diferentes enfoques si algo no funciona

#### Lo que este código realmente hace

Este código solo:
- Recibe una pregunta
- Genera una respuesta
- Se detiene

Eso es un **chatbot**, no realmente un agente. Es como hacer una pregunta a alguien y obtener una respuesta - no hay toma de decisiones autónoma.

#### Dónde aparecería un verdadero comportamiento agéntico

Una versión de agente real se vería más así:

```python
agent = create_agent(
    model="gpt-4o-mini",
    tools=[web_search, calculator, database_query],  # ← Herramientas que puede usar
    system_prompt=system_prompt
)
```

Entonces, cuando preguntes "¿Quién mató a JFK?", el agente podría:
1. **Decidir** "Necesito información actualizada" 
2. **Usar** la herramienta web_search
3. **Analizar** los resultados
4. **Decidir** "También necesito registros históricos"
5. **Usar** la herramienta database_query
6. **Sintetizar** todo en una respuesta

**La diferencia clave:** Un agente elige su propio camino para resolver tu problema, usando las herramientas que cree necesarias. Este ejemplo simplemente responde directamente sin ningún uso autónomo de herramientas o toma de decisiones.

## Usando .stream en lugar de .invoke

In [None]:
for token, metadata in agent.stream(
    {"messages": [HumanMessage(content="De verdad, ¿quién mató realmente a JFK?")]},
    stream_mode="messages"
):
    
    if token.content:
        print(token.content, end="", flush=True)

## Expliquemos el código anterior en términos sencillos
**El streaming** es donde el comportamiento del agente empieza a *sentirse vivo*.

Lo explicaremos **línea por línea**, y luego te daremos la **idea general** al final.


#### Explicación línea por línea

```python
for token, metadata in agent.stream(
```

* Esto inicia un bucle `for`.
* En lugar de obtener **una respuesta final**, estás pidiendo al agente que **transmita su respuesta pieza por pieza**.
* Cada iteración del bucle te da:

  * `token` → un pequeño fragmento de la salida de la IA
  * `metadata` → información adicional sobre ese fragmento (a menudo ignorada a nivel principiante)

---

```python
    {"messages": [HumanMessage(content="De verdad, ¿quién mató realmente a JFK?")]},
```

* Esta es la entrada que envías al agente.
* Misma idea que antes:

  * Pasas una lista de mensajes
  * Aquí es un mensaje humano
* La pregunta es ligeramente diferente, pero la estructura es idéntica.

---

```python
    stream_mode="messages"
```

* Esto le dice a LangChain **cómo** quieres que se transmita la salida.
* `"messages"` significa:

  * "Transmite fragmentos de mensajes estructurados, no texto sin procesar"
* Cada `token` que recibas se comportará como un objeto de mensaje de IA parcial.

---

```python
):
```

* Esto cierra la llamada `agent.stream(...)`.
* En este punto, LangChain comienza a llamar al modelo y a generar fragmentos de salida.

---

```python
    if token.content:
```

* No todos los fragmentos transmitidos contienen texto.
* Algunos fragmentos pueden ser:

  * señales de control
  * vacíos
  * solo metadatos
* Esta línea comprueba:

  > "¿Este fragmento realmente contiene texto?"

---

```python
        print(token.content, end="", flush=True)
```

* Esto imprime el fragmento **inmediatamente**, sin un salto de línea.
* `end=""`:

  * Evita saltos de línea para que el texto aparezca continuamente.
* `flush=True`:

  * Obliga a Python a imprimir instantáneamente en lugar de almacenar en búfer.
* Resultado:

  * La respuesta aparece **palabra por palabra**, como si alguien estuviera escribiendo.

---

#### Lo que realmente está pasando por debajo

En lugar de esto:

```
[ el agente piensa ]
[ el agente termina ]
[ obtienes la respuesta completa ]
```

Ahora obtienes esto:

```
[ el agente comienza ]
"Bueno,"
" basado"
" en"
" la"
" evidencia"
" disponible"
...
```

Así que estás **viendo al agente hablar en tiempo real**.

---

#### Por qué esto es importante para los agentes (no es solo para una mejor Experiencia de Usuario)

El streaming no es solo un "efecto genial".

Permite:

* retroalimentación en tiempo real
* interrupción o cancelación
* encadenar agentes mientras uno todavía está hablando
* construir interfaces de chat, terminales o sistemas de voz

En sistemas de agentes, el streaming se usa a menudo para:

* observar el razonamiento
* canalizar salida parcial a otro agente
* reaccionar dinámicamente a lo que se está diciendo

---

#### Modelo mental para principiantes (muy útil)

Piénsalo así:

* `invoke()` → **Dame la respuesta terminada**
* `stream()` → **Déjame escuchar mientras hablas**

Mismo agente. Mismo rol. Modo de interacción diferente.

---

## Resumen en una frase

Este código pide al agente que responda una pregunta **de forma incremental**, e imprime cada pequeño fragmento de su respuesta tan pronto como se genera, creando una salida en streaming en vivo.

## Cómo ejecutar este código desde Visual Studio Code
* Abre el Terminal.
* Asegúrate de estar en la carpeta del proyecto.
* Asegúrate de tener el entorno poetry activado.
* Introduce y ejecuta el siguiente comando:
    * `python 002-creating-an-agent.py` 