# CommaSeparatedListOutputParser

```CommaSeparatedListOutputParser``` là một trình phân tích đầu ra (output parser) chuyên biệt trong LangChain, được thiết kế để tạo ra các đầu ra có cấu trúc dưới dạng danh sách phân tách bằng dấu phẩy (comma-separated lists).

Nó đơn giản hóa quá trình trích xuất và trình bày dữ liệu dưới dạng danh sách rõ ràng và ngắn gọn, đặc biệt hữu ích cho việc tổ chức thông tin như các điểm dữ liệu (data points), tên, mục (items) hoặc các giá trị có cấu trúc khác. Bằng cách tận dụng trình phân tích này, người dùng có thể nâng cao độ rõ ràng của dữ liệu, đảm bảo định dạng nhất quán và cải thiện hiệu quả quy trình làm việc, đặc biệt trong các ứng dụng mà đầu ra có cấu trúc là cần thiết.

Hướng dẫn này trình bày cách sử dụng ```CommaSeparatedListOutputParser``` để:

1.  Thiết lập và khởi tạo trình phân tích để tạo danh sách phân tách bằng dấu phẩy.
2.  Tích hợp nó với một mẫu nhắc (prompt template) và mô hình ngôn ngữ (language model).
3.  Xử lý các đầu ra có cấu trúc một cách lặp đi lặp lại bằng cách sử dụng cơ chế truyền trực tuyến (streaming mechanisms).


In [1]:
# Setup environment
import os
from dotenv import load_dotenv
from langchain_openai import ChatOpenAI

load_dotenv(override=True, dotenv_path="../.env")

llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0.0)


## Implementing the ```CommaSeparatedListOutputParser```

If you need to generate outputs in the form of a comma-separated list, the ```CommaSeparatedListOutputParser``` from LangChain simplifies the process. Below is a step-by-step implementation:

In [2]:
from langchain_core.output_parsers import CommaSeparatedListOutputParser

output_parser = CommaSeparatedListOutputParser()
format_instructions = output_parser.get_format_instructions()
print(format_instructions)

Your response should be a list of comma separated values, eg: `foo, bar, baz` or `foo,bar,baz`


### 2. Creating the Prompt Template

In [3]:
from langchain_core.prompts import PromptTemplate

prompt = PromptTemplate(
  template="List five {subject}.\n{format_instructions}",
  input_variables=["subject"],
  partial_variables={
    "format_instructions": format_instructions
  }
)
print(prompt)

input_variables=['subject'] input_types={} partial_variables={'format_instructions': 'Your response should be a list of comma separated values, eg: `foo, bar, baz` or `foo,bar,baz`'} template='List five {subject}.\n{format_instructions}'


### 3. Integrating with ```ChatOpenAI``` and Running the Chain

In [4]:
from langchain_openai import ChatOpenAI

model = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0.0)

chain = prompt | model | output_parser

result = chain.invoke({"subject": "famous landmarks in South Korea"})
print(result)

['Gyeongbokgung Palace', 'N Seoul Tower', 'Bukchon Hanok Village', 'Seongsan Ilchulbong Peak', 'Haeundae Beach']


### 4. Accessing Data with Python Indexing
Since the ```CommaSeparatedListOutputParser``` automatically formats the output as a Python list, you can easily access individual elements using indexing.

In [5]:
# Accessing specific elements using Python indexing
print("First Landmark:", result[0])
print("Second Landmark:", result[1])
print("Last Landmark:", result[-1])

First Landmark: Gyeongbokgung Palace
Second Landmark: N Seoul Tower
Last Landmark: Haeundae Beach


## Using Streamed Outputs
For larger outputs or real-time feedback, you can process the results using the ```stream``` method. This allows you to handle data piece by piece as it is generated.

In [6]:
# Iterate through the streamed output for a subject
for output in chain.stream({"subject": "famous landmarks in South Korea"}):
    print(output)

['Gyeongbokgung Palace']
['N Seoul Tower']
['Bukchon Hanok Village']
['Seongsan Ilchulbong Peak']
['Haeundae Beach']
