# Understanding Common Python Syntax Used in LangGraph

LangGraph là một framework mạnh mẽ cho phép bạn thiết kế các quy trình làm việc phức tạp cho mô hình ngôn ngữ bằng cấu trúc dựa trên đồ thị. Nó tăng cường tính mô-đun, khả năng mở rộng và hiệu quả trong việc xây dựng các ứng dụng dựa trên AI.

Hướng dẫn này giải thích các khái niệm Python quan trọng thường được sử dụng trong LangGraph, bao gồm `TypedDict`, `Annotated` và hàm `add_messages`. Chúng ta cũng sẽ so sánh các khái niệm này với các tính năng Python tiêu chuẩn để làm nổi bật lợi ích và các trường hợp sử dụng điển hình của chúng.



## TypedDict

`TypedDict`, một tính năng trong module `typing` của Python, cho phép các nhà phát triển định nghĩa các dictionary có cấu trúc cố định và các kiểu key-value rõ ràng. Điều này tăng cường tính an toàn kiểu và cải thiện khả năng đọc code.

### Sự khác biệt chính giữa `dict` và `TypedDict`

1. **Kiểm tra kiểu dữ liệu (Type Checking)**
- `dict`: Không cung cấp kiểm tra kiểu dữ liệu trong quá trình runtime và phát triển.
- `TypedDict`: Hỗ trợ kiểm tra kiểu dữ liệu tĩnh bằng các công cụ như `mypy` hoặc IDE có chức năng kiểm tra kiểu dữ liệu được bật.

2. **Đặc tả Key và Value**
- `dict`: Đặc tả các kiểu key-value chung (ví dụ: `Dict[str, str]`).
- `TypedDict`: Định nghĩa rõ ràng các key chính xác và các kiểu tương ứng của chúng.

3. **Tính linh hoạt (Flexibility)**
- `dict`: Cho phép thêm hoặc xóa các key trong quá trình runtime mà không bị hạn chế.
- `TypedDict`: Bắt buộc một cấu trúc được xác định trước, cấm các key bổ sung trừ khi được chỉ định cụ thể.

### Lợi ích của việc sử dụng `TypedDict`
- **An toàn kiểu dữ liệu (Type Safety)**: Gây ra lỗi trong quá trình phát triển.
- **Khả năng đọc (Readability)**: Cung cấp một lược đồ rõ ràng cho các dictionary.
- **Hỗ trợ IDE (IDE Support)**: Tăng cường tính năng tự động hoàn thành và tài liệu.
- **Tài liệu (Documentation)**: Phục vụ như code tự ghi chú.


In [8]:
from typing import Dict, TypedDict

# Standard python usage
sample_dict: Dict[str, str] = {
    "name": "Dino",
    "age": "30",
    "job": "Developper"
}

# Using TypeDict
class Person(TypedDict):
    name: str
    age: int
    job: str


typed_dict: Person = {
    "name": "Thai", 
    "age" : 33,
    "job": "AI Engineer"
}


In [9]:
# Behavior with a standard dictionary
sample_dict["age"] = 33

In [10]:
sample_dict

{'name': 'Dino', 'age': 33, 'job': 'Developper'}

In [14]:
# Behavior with TypedDict
typed_dict["age"] = 35  # Correct usage
typed_dict["age"] = "35"  # Error: Type mismatch detected by type checker
typed_dict["new_field"] = "Additional Info"  # Error: Key not defined in TypedDict

Những lợi ích của `TypedDict` được làm nổi bật khi được sử dụng cùng với các công cụ kiểm tra kiểu dữ liệu tĩnh như `mypy`, và trở nên rõ ràng trên các IDE như PyCharm hoặc VS Code, nơi tính năng kiểm tra kiểu dữ liệu được bật. Các công cụ này phát hiện các sự không nhất quán về kiểu dữ liệu và các key không xác định trong quá trình phát triển, cung cấp phản hồi vô giá để ngăn chặn các lỗi runtime.


## Annotated

`Annotated`, cũng nằm trong module `typing` của Python, cho phép thêm metadata vào các gợi ý kiểu dữ liệu (type hints). Tính năng này hỗ trợ chức năng với ngữ cảnh bổ sung, cải thiện độ rõ ràng và khả năng sử dụng của code cho cả nhà phát triển và các công cụ phát triển. Ví dụ: metadata có thể đóng vai trò là tài liệu bổ sung cho người đọc hoặc truyền tải thông tin hữu ích cho các công cụ.

### Lợi ích của việc sử dụng `Annotated`

- **Ngữ cảnh bổ sung (Additional Context)**: Thêm metadata để làm phong phú các gợi ý kiểu dữ liệu, cải thiện độ rõ ràng cho cả nhà phát triển và công cụ.

- **Tài liệu nâng cao (Enhanced Documentation)**: Đóng vai trò là tài liệu tự chứa có thể làm rõ mục đích và các ràng buộc của biến.

- **Xác thực (Validation)**: Tích hợp với các thư viện như Pydantic để thực thi xác thực dữ liệu dựa trên metadata được annotated.

- **Hành vi dành riêng cho Framework (Framework-Specific Behavior)**: Cho phép các tính năng nâng cao trong các framework như LangGraph bằng cách định nghĩa các hoạt động chuyên biệt.

### Cú pháp

- Type: Định nghĩa kiểu dữ liệu của biến (ví dụ: `int`, `str`, `List[str]`, v.v.).
- Metadata: Thêm thông tin mô tả về biến (ví dụ: `"unit: cm"`, `"range: 0-100"`).


In [15]:
from typing import Annotated

name: Annotated[str, "User name"]
age: Annotated[int, "User's age (0-150)"]

In [18]:
# Example with pydantic
from typing import Annotated, List
from pydantic import Field, BaseModel, ValidationError

class Employee(BaseModel):
    id: Annotated[int, Field(..., description="Employee ID")]
    name: Annotated[str, Field(..., min_length=3, max_length=50, description="Name")]
    age: Annotated[int, Field(gt=18, lt=64, description="Age (19-64)")]
    salary: Annotated[float, Field(gt=0, lt=10_000, description="Salary (in units of 10,000, up to 10 billion)")]
    skills: Annotated[List[str], Field(description="Skills (1-10 items)", min_length=1, max_length=10)]

In [24]:
# Example of valid data
try:
    valid_employee = Employee(
        id=1,
        name="Dino",
        age=333,
        salary=10000,
        skills=['Langchain', 'Langgraph']
    )
except ValidationError as e:
    print("ValidationError: ")
    for error in e.errors():
        print(f"- {error['loc'][0]}: {error['msg']}")

ValidationError: 
- age: Input should be less than 64
- salary: Input should be less than 10000


## add_messages

Hàm reducer `add_messages`, được tham chiếu bởi khóa `messages`, hướng dẫn LangGraph thêm các tin nhắn mới vào danh sách hiện có.

Trong các trường hợp mà các khóa trạng thái không có chú thích (annotations), mỗi lần cập nhật sẽ ghi đè giá trị trước đó, chỉ giữ lại dữ liệu gần đây nhất.

Hàm `add_messages` hợp nhất hai đầu vào (`left` và `right`) thành một danh sách tin nhắn được hợp nhất.

### Các Tính Năng Chính

-   **Hợp Nhất Danh Sách Tin Nhắn (Message Lists Merging)**: Kết hợp hai danh sách tin nhắn riêng biệt thành một danh sách thống nhất.
-   **Duy Trì Trạng Thái Chỉ Thêm (Append-Only State Maintenance)**: Đảm bảo các tin nhắn mới được thêm vào trong khi vẫn giữ nguyên các tin nhắn hiện có.
-   **Tin Nhắn Có ID Trùng Khớp (Messages with Matching IDs)**: Nếu một tin nhắn đến trong `right` có ID trùng với một tin nhắn hiện có trong `left`, nó sẽ thay thế tin nhắn hiện có. Tất cả các tin nhắn còn lại từ `right` sẽ được thêm vào `left`.

### Tham Số:

-   `left` (Messages): Danh sách tin nhắn ban đầu.
-   `right` (Messages): Danh sách các tin nhắn mới để hợp nhất hoặc một tin nhắn đơn lẻ để thêm vào.

### Đầu Ra:

-   `Messages`: Trả về một danh sách tin nhắn mới với các thay thế như mô tả ở trên, hợp nhất `right` vào `left`.


Note: 

`add_messages` hợp nhất các danh sách tin nhắn bằng cách thêm các tin nhắn mới khi ID khác nhau và thay thế các tin nhắn hiện có nếu ID trùng khớp.



In [26]:
from unittest import result
from langchain_core.messages import AIMessage, HumanMessage
from langgraph.graph.message import add_messages

# Example 1: Merging two message lists
# `msgs1` and `msgs2` are combined into a single list without overlapping IDs.

msgs1: list = [HumanMessage(content="Hello!!!", id="1")]
msgs2: list = [AIMessage(content="nice to meet you", id="2")]

result1 = add_messages(msgs1, msgs2)
print(result1)

[HumanMessage(content='Hello!!!', additional_kwargs={}, response_metadata={}, id='1'), AIMessage(content='nice to meet you', additional_kwargs={}, response_metadata={}, id='2')]


In [27]:
# Example 2: Replacing messages with the same ID
# If `msgs2` contains a message with the same ID as one in `msgs1`,
# the message in `msgs2` replaces the corresponding message in `msgs1`.
msgs1: list = [HumanMessage(content="Hello!!!", id="1")]
msgs2: list = [AIMessage(content="nice to meet you", id="1")]

result2 = add_messages(msgs1, msgs2)
print(result2)

[AIMessage(content='nice to meet you', additional_kwargs={}, response_metadata={}, id='1')]
