## 自定义 OutputParser

1. 继承`BaseOutputParser`类
2. 实现`parse`方法：将文本转换为目标格式
3. （可选）实现`get_format_instructions`方法：生成提示词中的格式说明

In [None]:
import os
from dotenv import load_dotenv
load_dotenv()

In [1]:

from langchain.schema import BaseOutputParser
from typing import List, Dict

class CSVOutputParser(BaseOutputParser[List[Dict[str, str]]]):
    # 定义列名
    columns: List[str] = ["name", "age", "city"]
    
    def parse(self, text: str) -> List[Dict[str, str]]:
        """将CSV文本解析为字典列表"""
        rows = []
        for line in text.strip().split('\n'):
            values = line.strip().split(',')
            if len(values) == len(self.columns):
                rows.append(dict(zip(self.columns, values)))
        return rows
    
    def get_format_instructions(self) -> str:
        """返回格式说明，用于提示词"""
        return f"""
        请以CSV格式返回数据，列名顺序为：{', '.join(self.columns)}。
        例如：
        张三,30,北京
        李四,25,上海
        """

# 调用
parser = CSVOutputParser()

# 模拟LLM输出
llm_output = """
张三,30,北京
李四,25,上海
"""

result = parser.parse(llm_output)
print(result)
# 输出：
# [{'name': '张三', 'age': '30', 'city': '北京'},
#  {'name': '李四', 'age': '25', 'city': '上海'}]

[{'name': '张三', 'age': '30', 'city': '北京'}, {'name': '李四', 'age': '25', 'city': '上海'}]
