# 模型，提示和输出解释器

### 目录

 - 获取你的智谱 API Key
 - 直接调用智谱的API
 - 通过LangChain进行的API调用：
    - 提示（Prompts）
    - 模型（Models)
    - 输出解析器（Output parsers）

In [1]:
from langchain_community.chat_models import ChatZhipuAI
from dotenv import load_dotenv,find_dotenv
import os 

### 获取你的智谱 API Key
在当前文件下创建一个.env文件，将api-key复制进去，如ZHIPUAI_API_KEY = "api-key"

In [2]:
_ = load_dotenv(find_dotenv())
# 这里我们将参数temperature设置为0.0，从而减少生成答案的随机性。
# 如果你想要每次得到不一样的有新意的答案，可以尝试调整该参数。
chat = ChatZhipuAI(
    model="glm-4",
    temperature=0.5
)

### 提示模板
langchain提供了接口方便快速的构造和使用提示。现在我们来看看如何使用langchain来构造提示。  

我们构造一个提示模版字符串：template_string

In [3]:
template_string = """用{style}格式,翻译一下这个用三个反引号分隔的文本 .
```{orginal_txt}```
"""

### 构造LangChain提示模版

我们调用ChatPromptTemplatee.from_template()函数将上面的提示模版字符template_string转换为提示模版prompt_template

In [4]:
from langchain.prompts import ChatPromptTemplate

In [5]:
prompt_template = ChatPromptTemplate.from_template(template_string)

In [6]:
prompt_template.messages[0].prompt

PromptTemplate(input_variables=['orginal_txt', 'style'], template='用{style}格式,翻译一下这个用三个反引号分隔的文本 .\n```{orginal_txt}```\n')

从上面的输出可以看出，prompt_template 有两个输入变量： style 和 orginal_txt。

In [7]:
prompt_template.messages[0].prompt.input_variables

['orginal_txt', 'style']

### 使用模版得到客户消息提示

langchain提示模版prompt_template需要两个输入变量： style 和 text。 这里分别对应

 - style: 我们想要的语言风格
 - orginal_txt: 用户的原始文本。

In [8]:
style = """
中国大陆普通话 \
日常口语 \
平常和礼貌的语气
"""

In [9]:
orginal_txt = """
 ぺ畱ぅ很9的頭發能ゐ尒説剪就剪，愛ぅ很9的尒也能説忘就忘。
"""

对于给定的style和orginal_txt, 我们可以使用提示模版prompt_template的format_messages方法生成想要的客户消息customer_messages。

In [10]:
customer_messages = prompt_template.format_messages(style=style,orginal_txt=orginal_txt)

In [11]:
type(customer_messages)

list

In [12]:
type(customer_messages[0])

langchain_core.messages.human.HumanMessage

In [13]:
customer_messages[0]

HumanMessage(content='用\n中国大陆普通话 日常口语 平常和礼貌的语气\n格式,翻译一下这个用三个反引号分隔的文本 .\n```\n ぺ畱ぅ很9的頭發能ゐ尒説剪就剪，愛ぅ很9的尒也能説忘就忘。\n```\n')

可以看出customer_messages变量类型为列表(list)，  
而列表里的元素变量类型为langchain自定义消息(langchain.schema.HumanMessage)。

### 调用chat模型转换客户消息风格

In [14]:
customer_resp = chat.invoke(customer_messages)

In [15]:
customer_resp

AIMessage(content='这段日文文本用中国大陆普通话的日常口语表达，并以礼貌的语气翻译如下：\n\n“留着那么久的头发你说剪就剪了，那么深爱的你也能说忘就忘。” \n\n（注意：原文中的“很9”可能是输入错误或网络用语，这里我假设它是指“很久”。）', response_metadata={'token_usage': {'completion_tokens': 68, 'prompt_tokens': 75, 'total_tokens': 143}, 'model_name': 'glm-4', 'finish_reason': 'stop'}, id='run-d2d75963-c6b1-4e29-83c4-48f04120d5bc-0')

In [16]:
customer_resp.content

'这段日文文本用中国大陆普通话的日常口语表达，并以礼貌的语气翻译如下：\n\n“留着那么久的头发你说剪就剪了，那么深爱的你也能说忘就忘。” \n\n（注意：原文中的“很9”可能是输入错误或网络用语，这里我假设它是指“很久”。）'

### 使用模版得到回复消息提示

接下来，我们更进一步，将客服人员回复的消息，转换为港剧的语言风格。

这里，我们可以继续使用之前构造的langchain提示模版，来获得我们回复消息提示。

In [17]:
style = """
香港TVB台词风格的粤语 \
日常口语俚语 
"""
orginal_txt = """
 没什么大不了的事，看开一点吧
"""
customer_messages = prompt_template.format_messages(style=style,orginal_txt=orginal_txt)
customer_resp = chat.invoke(customer_messages)
customer_resp.content

'```\n咪嘥心机啦，放開D啦嘛！\n``` \n\n这里的“咪嘥心机”相当于“不要费心”，“放開D”即“放松一点”。这种表达方式带有典型的香港TVB台词风格，轻松而且口语化。'

### 对于给定的评价customer_review, 我们希望提取信息，并按JSON格式输出：

```
{
    "key":value,
    "key2":value2,
}
```

In [18]:
constomer_review = """\
犯罪不分大人小孩，都是坏人。\
单身父亲李长峰（王千源 饰）在女儿被几名未成年人凌虐死亡后，绝望地踏上了复仇之路，他似乎想用自己的方式让少年恶魔们付出应有的代价。面对李长峰和警方的追踪，这群少年犯会得到何种惩罚？\
影片根据东野圭吾同名小说改编。\
"""

review_template = """\
请根据下面的文本，提取信息：

演员:出演这部电影的演员
剧情:电影的剧情，故事情节
原著:是改编自哪一部电影或者图书

将输出的文本转成JSON格式,按下面的键值：
演员
剧情
原著

text:{text}
"""

In [19]:
prompt_template = ChatPromptTemplate.from_template(review_template)
prompt_template

ChatPromptTemplate(input_variables=['text'], messages=[HumanMessagePromptTemplate(prompt=PromptTemplate(input_variables=['text'], template='请根据下面的文本，提取信息：\n\n演员:出演这部电影的演员\n剧情:电影的剧情，故事情节\n原著:是改编自哪一部电影或者图书\n\n将输出的文本转成JSON格式,按下面的键值：\n演员\n剧情\n原著\n\ntext:{text}\n'))])

In [20]:
messages = prompt_template.format_messages(text=constomer_review)
customer_resp = chat.invoke(messages)
print(customer_resp.content)

以下是提取的信息，按照您提供的键值以JSON格式呈现：

```json
{
  "演员": "王千源",
  "剧情": "犯罪不分大人小孩，都是坏人。单身父亲李长峰在女儿被几名未成年人凌虐死亡后，绝望地踏上了复仇之路，他似乎想用自己的方式让少年恶魔们付出应有的代价。面对李长峰和警方的追踪，这群少年犯会得到何种惩罚？",
  "原著": "东野圭吾同名小说"
}
```

请注意，原著字段中只提到了作者和小说的同名性质，未提供具体的书名，因此按照原文信息进行了呈现。如果需要具体的原著名称，需要进一步的信息来确认。


In [21]:
type(customer_resp.content)

str

customer_resp.content类型为字符串（str），而并非字典(dict), 直接使用get方法会报错。因此，我们需要输出解释器。

### LangChain输出解析器

In [22]:
from langchain.output_parsers import ResponseSchema,StructuredOutputParser

构造输出解析器

In [23]:
actor_schema = ResponseSchema(name="演员",description="出演这部电影的演员")
story_schema = ResponseSchema(name="剧情",description="电影的剧情，故事情节")
ref_schema = ResponseSchema(name="原著",description="是改编自哪一部电影或者图书")

response_schemas = [actor_schema,story_schema,ref_schema]
output_parser = StructuredOutputParser.from_response_schemas(response_schemas)

In [24]:
format_instructions = output_parser.get_format_instructions()
print(format_instructions)

The output should be a markdown code snippet formatted in the following schema, including the leading and trailing "```json" and "```":

```json
{
	"演员": string  // 出演这部电影的演员
	"剧情": string  // 电影的剧情，故事情节
	"原著": string  // 是改编自哪一部电影或者图书
}
```


构造提示模版字符串

In [25]:
review_template_2 = """\
请根据下面的文本，提取信息：

演员:出演这部电影的演员
剧情:电影的剧情，故事情节
原著:是改编自哪一部电影或者图书

text:{text}

{format_instructions}
"""

构造langchain提示模版

In [26]:
prompt_template2 = ChatPromptTemplate.from_template(review_template_2)
prompt_template2

ChatPromptTemplate(input_variables=['format_instructions', 'text'], messages=[HumanMessagePromptTemplate(prompt=PromptTemplate(input_variables=['format_instructions', 'text'], template='请根据下面的文本，提取信息：\n\n演员:出演这部电影的演员\n剧情:电影的剧情，故事情节\n原著:是改编自哪一部电影或者图书\n\ntext:{text}\n\n{format_instructions}\n'))])

In [27]:
messages = prompt_template.format_messages(text=constomer_review,format_instructions=format_instructions)
customer_resp = chat.invoke(messages)
print(customer_resp.content)

以下是提取的信息，以JSON格式表示：

```json
{
  "演员": "王千源",
  "剧情": "犯罪不分大人小孩，都是坏人。单身父亲李长峰在女儿被几名未成年人凌虐死亡后，绝望地踏上了复仇之路，他似乎想用自己的方式让少年恶魔们付出应有的代价。面对李长峰和警方的追踪，这群少年犯会得到何种惩罚？",
  "原著": "东野圭吾同名小说"
}
```

请注意，原著字段只包含了作者和作品类型（小说），未包含具体的小说名称，因为原始文本没有提供具体的书名。如果需要书名，请提供完整的书名以便更准确地填充该字段。


In [28]:
output_dict = output_parser.parse(customer_resp.content)
output_dict

{'演员': '王千源',
 '剧情': '犯罪不分大人小孩，都是坏人。单身父亲李长峰在女儿被几名未成年人凌虐死亡后，绝望地踏上了复仇之路，他似乎想用自己的方式让少年恶魔们付出应有的代价。面对李长峰和警方的追踪，这群少年犯会得到何种惩罚？',
 '原著': '东野圭吾同名小说'}

In [29]:
output_dict.get("演员")

'王千源'

In [30]:
output_dict.get("剧情")

'犯罪不分大人小孩，都是坏人。单身父亲李长峰在女儿被几名未成年人凌虐死亡后，绝望地踏上了复仇之路，他似乎想用自己的方式让少年恶魔们付出应有的代价。面对李长峰和警方的追踪，这群少年犯会得到何种惩罚？'