# Opciones para formatear el Esquema de Estado: TypedDict, Dataclass y Pydantic

## Setup

#### After you download the code from the github repository in your computer
In terminal:
* cd project_name
* pyenv local 3.11.4
* poetry install
* poetry shell

#### To open the notebook with Jupyter Notebooks
In terminal:
* jupyter lab

Go to the folder of notebooks and open the right notebook.

#### To see the code in Virtual Studio Code or your editor of choice.
* open Virtual Studio Code or your editor of choice.
* open the project-folder
* open the 009-schema-with-pydantic.py file

## Create your .env file
* In the github repo we have included a file named .env.example
* Rename that file to .env file and here is where you will add your confidential api keys. Remember to include:
* OPENAI_API_KEY=your_openai_api_key
* LANGCHAIN_TRACING_V2=true
* LANGCHAIN_ENDPOINT=https://api.smith.langchain.com
* LANGCHAIN_API_KEY=your_langchain_api_key
* LANGCHAIN_PROJECT=your_project_name

## Track operations
From now on, we can track the operations **and the cost** of this project from LangSmith:
* [smith.langchain.com](https://smith.langchain.com)

## Connect with the .env file located in the same directory of this notebook

If you are using the pre-loaded poetry shell, you do not need to install the following package because it is already pre-loaded for you:

In [1]:
#pip install python-dotenv

In [2]:
import os
from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv())
openai_api_key = os.environ["OPENAI_API_KEY"]

#### Install LangChain

If you are using the pre-loaded poetry shell, you do not need to install the following package because it is already pre-loaded for you:

In [3]:
#!pip install langchain

## Connect with an LLM

If you are using the pre-loaded poetry shell, you do not need to install the following package because it is already pre-loaded for you:

In [4]:
#!pip install langchain-openai

In [5]:
from langchain_openai import ChatOpenAI

chatModel35 = ChatOpenAI(model="gpt-3.5-turbo-0125")
chatModel4o = ChatOpenAI(model="gpt-4o")

## State y State Schema en LangGraph  
* Usamos un schema para definir el formato de los datos del state. El schema representa la estructura y los tipos de datos que la aplicación (también llamada graph) utilizará.  
* Se espera que todos los nodos se comuniquen utilizando ese schema.  
* LangGraph ofrece flexibilidad en la definición del state schema, permitiendo el uso de varios tipos de Python y enfoques de validación.  
* Dos formas simples de definir el esquema de estado son:  
    * `TypedDict`.  
    * `Dataclass`.

#### Ejemplos de State Schema con `TypedDict`  
* `TypedDict` permite especificar keys y sus value types correspondientes, pero estos no se aplican estrictamente en el tiempo de ejecución (runtime).

In [6]:
from typing_extensions import TypedDict

class TypedDictState(TypedDict):
    foo: str
    bar: str

* Para restricciones de valor más específicas, puedes usar elementos como la type hint `Literal`. En el siguiente ejemplo, `mood` solo puede ser "happy" o "sad".

In [7]:
from typing import Literal

class TypedDictState(TypedDict):
    name: str
    mood: Literal["happy","sad"]

#### Ejemplos de State Schema con Dataclass

In [8]:
from dataclasses import dataclass

@dataclass
class DataclassState:
    name: str
    mood: Literal["happy","sad"]

#### `TypedDict` vs. `Dataclass`  

La principal diferencia entre `TypedDict` y `Dataclass` radica en **la estructura que crean** y **cómo se usan**. Aquí tienes una explicación sencilla de cada uno:  

### 1. **`TypedDict` (`TypedDictState`)**  
- **Qué es**: `TypedDict` es una forma de definir la estructura esperada de un diccionario en Python.  
- **Propósito**: Se usa principalmente para **verificación de tipos**, no para comportamiento en tiempo de ejecución. Ayuda a garantizar que el diccionario tenga las keys y los tipos de valores correctos.  
- **Comportamiento**: En tiempo de ejecución, sigue siendo solo un diccionario. Se pueden agregar o eliminar claves dinámicamente, incluso si esto rompe la estructura esperada.  

**Ejemplo de uso:**  
```python
state: TypedDictState = {"name": "Alice", "mood": "happy"}  # Funciona correctamente
state["age"] = 25  # No generará un error en tiempo de ejecución, pero fallará en la verificación de tipos.
```

---

### 2. **`Dataclass` (`DataclassState`)**  
- **Qué es**: Un `dataclass` es una plantilla para crear objetos en Python con campos predefinidos.  
- **Propósito**: Es una clase de Python con soporte automático para operaciones comunes como la creación de objetos, comparaciones y representación en cadena (`__str__`).  
- **Comportamiento**: A diferencia de un diccionario, tiene una estructura fija. No se pueden agregar ni eliminar atributos dinámicamente.  

**Ejemplo de uso:**  
```python
state = DataclassState(name="Alice", mood="happy")  # Funciona correctamente
state.name = "Bob"  # Permitido, ya que `name` es un atributo definido
state.age = 25  # Esto generará un error porque `age` no está definido en la clase.
```

---

### **Diferencias clave:**  

| Característica             | `TypedDictState`                  | `DataclassState`                |
|----------------------------|-----------------------------------|---------------------------------|
| **Tipo**                  | Diccionario                       | Clase de Python (objeto)       |
| **Uso principal**         | Verificación de tipos en diccionarios | Definir objetos estructurados  |
| **Atributos dinámicos**   | Permitidos en tiempo de ejecución | No permitidos sin definición   |
| **Estructura inmutable**  | No, se pueden agregar/eliminar claves | Sí, solo acepta campos predefinidos |
| **Características extra** | Ninguna                           | Métodos, valores por defecto, comparaciones |

---

### **¿Cuál usar?**  
- Usa **`TypedDict`** cuando trabajes con diccionarios pero necesites una verificación estricta de tipos.  
- Usa **`dataclass`** cuando necesites objetos más estructurados, reutilizables y con más funcionalidades.

* Las opciones anteriores no son lo suficientemente sólidas para aplicaciones a nivel de producción, ya que a veces no detectan errores de validación. Debido a esto, la forma más común de definir el esquema de estado en aplicaciones profesionales de LangGraph es:  
    * **Pydantic**.

#### Ejemplos de State Schema con Pydantic

In [9]:
from pydantic import BaseModel, field_validator, ValidationError

class PydanticState(BaseModel):
    name: str
    mood: str # "happy" or "sad" 

    @field_validator('mood')
    @classmethod
    def validate_mood(cls, value):
        # Ensure the mood is either "happy" or "sad"
        if value not in ["happy", "sad"]:
            raise ValueError("Each mood must be either 'happy' or 'sad'")
        return value

try:
    state = PydanticState(name="John Doe", mood="mad")
except ValidationError as e:
    print("Validation Error:", e)

Validation Error: 1 validation error for PydanticState
mood
  Value error, Each mood must be either 'happy' or 'sad' [type=value_error, input_value='mad', input_type=str]
    For further information visit https://errors.pydantic.dev/2.10/v/value_error


#### Pydantic vs. Typedict y Dataclass  
Pydantic introduce **validación de datos en tiempo de ejecución**, lo cual ni `TypedDict` ni `dataclass` proporcionan por sí mismos. En términos simples:

**Características clave de `PydanticState`:**  
1. **Basado en `BaseModel`**:  
   - `PydanticState` no es un diccionario simple ni una clase básica. Es un **modelo** que valida sus datos cuando se crea un objeto.  
   - Si los datos son inválidos, lanza un **`ValidationError`** de inmediato, garantizando que los datos sean correctos.  

2. **Validación en tiempo de ejecución**:  
   - En el ejemplo, el `@field_validator` garantiza que `mood` solo pueda ser `"happy"` o `"sad"`. Si intentas establecer `mood` en cualquier otro valor, se generará un error en tiempo de ejecución.  

3. **Aplicación estricta de tipos**:  
   - Mientras que `TypedDict` y `dataclass` dependen de verificadores de tipos estáticos, `Pydantic` realmente aplica los tipos y restricciones **cuando el programa se está ejecutando**.  

4. **Mejor manejo de errores**:  
   - Si se proporcionan datos no válidos, `Pydantic` lanza un error detallado, lo que es muy útil para depuración o retroalimentación para el usuario.  

**Comparación con ejemplos anteriores:**  

| Característica               | `TypedDictState`              | `DataclassState`              | `PydanticState`                |
|------------------------------|------------------------------|------------------------------|--------------------------------|
| **Aplicación de tipos**       | Solo verificación con `mypy`  | Solo verificación con `mypy`  | Aplicado en tiempo de ejecución |
| **Reglas de validación**      | Ninguna                      | Ninguna                      | Totalmente soportadas y personalizables  |
| **Atributos dinámicos**       | Permitidos en tiempo de ejecución | No permitidos               | No permitidos                 |
| **Manejo de errores**         | Ninguno en tiempo de ejecución | Ninguno en tiempo de ejecución | Lanza `ValidationError`        |
| **Características extra**     | Ninguna                      | Comparaciones, métodos, etc. | Validación, serialización, etc. |
| **Dependencia de librería**   | Ninguna                      | Ninguna                      | Requiere `pydantic`           |

**Ejemplo de uso:**  

- **Entrada válida**:  
    ```python
    state = PydanticState(name="Alice", mood="happy")  # Funciona correctamente
    print(state)
    ```
    **Salida**:  
    ```
    name='Alice' mood='happy'
    ```

- **Entrada inválida**:  
    ```python
    state = PydanticState(name="Bob", mood="angry")  # Lanza ValidationError
    ```
    **Salida**:  
    ```
    Validation Error: 1 validation error for PydanticState
    mood
      Each mood must be either 'happy' or 'sad' (type=value_error)
    ```

**Cuándo usar cada uno:**  
- **`TypedDict`**: Cuando solo necesitas verificación de tipos para diccionarios sin validación en tiempo de ejecución.  
- **`dataclass`**: Cuando necesitas objetos estructurados y reutilizables pero no validación en tiempo de ejecución.  
- **`Pydantic`**: Cuando necesitas validación robusta en tiempo de ejecución, especialmente para **APIs, formularios de entrada o fuentes de datos externas**.

## Observa cómo TypedDict y Dataclass no detectan errores de validación

#### Ejemplo con TypedDict

In [24]:
import random
from IPython.display import Image, display
from langgraph.graph import StateGraph, START, END

def node_1(state):
    print("---Node 1---")
    return {"name": state['name'] + " is ... "}

def node_2(state):
    print("---Node 2---")
    return {"mood": "happy"}

def node_3(state):
    print("---Node 3---")
    return {"mood": "sad"}

def decide_mood(state) -> Literal["node_2", "node_3"]:
        
    # Here, let's just do a 50 / 50 split between nodes 2, 3
    if random.random() < 0.5:

        # 50% of the time, we return Node 2
        return "node_2"
    
    # 50% of the time, we return Node 3
    return "node_3"

# Build graph
builder = StateGraph(TypedDictState)
builder.add_node("node_1", node_1)
builder.add_node("node_2", node_2)
builder.add_node("node_3", node_3)

# Logic
builder.add_edge(START, "node_1")
builder.add_conditional_edges("node_1", decide_mood)
builder.add_edge("node_2", END)
builder.add_edge("node_3", END)

# Add
graph = builder.compile()

In [11]:
graph.invoke({"name":"Julio", "mood": "driven"})

---Node 1---
---Node 3---


{'name': 'Julio is ... ', 'mood': 'sad'}

* Como puedes ver, introdujimos un `mood` que no es válido, pero no obtuvimos ningún error de validación.

#### Ejemplo con Dataclass

In [23]:
def node_1(state):
    print("---Node 1---")
    return {"name": state.name + " is ... "}

# Build graph
builder = StateGraph(DataclassState)
builder.add_node("node_1", node_1)
builder.add_node("node_2", node_2)
builder.add_node("node_3", node_3)

# Logic
builder.add_edge(START, "node_1")
builder.add_conditional_edges("node_1", decide_mood)
builder.add_edge("node_2", END)
builder.add_edge("node_3", END)

# Add
graph = builder.compile()

In [13]:
graph.invoke(DataclassState(name="Julio",mood="driven"))

---Node 1---
---Node 3---


{'name': 'Julio is ... ', 'mood': 'sad'}

## Mira cómo Pydantic detecta validation errors

In [25]:
# Build graph
builder = StateGraph(PydanticState)
builder.add_node("node_1", node_1)
builder.add_node("node_2", node_2)
builder.add_node("node_3", node_3)

# Logic
builder.add_edge(START, "node_1")
builder.add_conditional_edges("node_1", decide_mood)
builder.add_edge("node_2", END)
builder.add_edge("node_3", END)

# Add
graph = builder.compile()

In [26]:
graph.invoke(PydanticState(name="Julio",mood="driven"))

ValidationError: 1 validation error for PydanticState
mood
  Value error, Each mood must be either 'happy' or 'sad' [type=value_error, input_value='driven', input_type=str]
    For further information visit https://errors.pydantic.dev/2.10/v/value_error

* Como puedes ver, introdujimos un `mood` que no es válido, pero **esta vez sí obtuvimos un error de validación**.

## Cómo ejecutar el código desde Visual Studio Code  
* En Visual Studio Code, busca el archivo `009-schema-with-pydantic.py`.  
* En la terminal, asegúrate de estar en el directorio del archivo y ejecuta:  
    * `python 009-schema-with-pydantic.py`