In [1]:
import requests
import json
from IPython.display import Markdown

In [2]:
def get_completion(prompt):
    headers = {'Content-Type': 'application/json'}
    data = {"prompt": prompt, "history": []}
    response = requests.post(url='http://127.0.0.1:8000', headers=headers, data=json.dumps(data))
    return response.json()['response']

get_completion("你好")

'你好👋!我是人工智能助手 ChatGLM-6B,很高兴见到你,欢迎问我任何问题。'

# 单一文本概括Prompt实验

这里我们举了个商品评论的例子。对于电商平台来说，网站上往往存在着海量的商品评论，这些评论反映了所有客户的想法。如果我们拥有一个工具去概括这些海量、冗长的评论，便能够快速地浏览更多评论，洞悉客户的偏好，从而指导平台与商家提供更优质的服务。

In [3]:
prod_review_zh = """
这个熊猫公仔是我给女儿的生日礼物，她很喜欢，去哪都带着。
公仔很软，超级可爱，面部表情也很和善。但是相比于价钱来说，
它有点小，我感觉在别的地方用同样的价钱能买到更大的。
快递比预期提前了一天到货，所以在送给女儿之前，我自己玩了会。
"""

# 限制输出文本长度

我们尝试限制文本长度为最多30词。 

In [5]:
prompt = f"""
你的任务是从电子商务网站上生成一个产品评论的简短摘要。

请对三个反引号之间的评论文本进行概括，最多30个字。

评论: ```{prod_review_zh}```
"""

response = get_completion(prompt)
print(response)

这个熊猫公仔很适合女儿,软、可爱,面部表情友善。但相对于价格而言,它有点小。快递送到提前了一天,可以玩一下。


In [6]:
len(response)

54

注：实测chatglm无法理解词的数量，只能通过字的数量来稍加限制。 

# 关键角度侧重

有时，针对不同的业务，我们对文本的侧重会有所不同。例如对于商品评论文本，物流会更关心运输时效，商家更加关心价格与商品质量，平台更关心整体服务体验。

我们可以通过增加Prompt提示，来体现对于某个特定角度的侧重。

**侧重于运输**

In [8]:
prompt = f"""
你的任务是从电子商务网站上生成一个产品评论的简短摘要。

请对三个反引号之间的评论文本进行概括，最多30个词汇，并且聚焦在产品运输上。

评论: ```{prod_review_zh}```
"""

response = get_completion(prompt)
print(response)

评论: 送给女儿的生日礼物,她喜欢公仔,软可爱,但小,感觉在别的地方用同样的价钱能买到更大的。快递比预期提前一天到货,自己玩了会。


注：在chatgpt的回答中，**快递提前一天到货**放在了最前面。但chatglm的回答似乎更侧重于**用同样的价钱能买到最大的**

**侧重于价格与质量**

In [11]:
prompt = f"""
你的任务是从电子商务网站上生成一个产品评论的简短摘要。

请对三个反引号之间的评论文本进行概括，最多30个词汇，并且聚焦在产品价格和质量上。

评论: ```{prod_review_zh}```
"""

response = get_completion(prompt)
print(response)

评论: 给女儿的生日礼物,她喜欢公仔,软可爱,表情友善。但小,感觉在其他地方用同样的价钱能买到更大。快递比预期早一天到,自己玩了会。


注：emmmmmmm,怎么跟上个回答没啥区别。但chatgpt的回答就聚焦在**同样的价钱能买到更大的**

# 关键信息提取

虽然我们通过添加关键角度侧重的Prompt，使得文本摘要更侧重于某一特定方面，但是可以发现，结果中也会保留一些其他信息，如价格与质量角度的概括中仍保留了“快递提前到货”的信息。有时这些信息是有帮助的，但如果我们只想要提取某一角度的信息，并过滤掉其他所有信息，则可以要求LLM进行“文本提取(Extract)”而非“文本概括(Summarize)”。

In [10]:
prompt = f"""
你的任务是从电子商务网站上的产品评论中提取相关信息。

请从以下三个反引号之间的评论文本中提取产品运输相关的信息，最多30个词汇。

评论: ```{prod_review_zh}```
"""

response = get_completion(prompt)
print(response)

产品评论: 
- 熊猫公仔作为生日礼物,女儿很喜欢。 
- 公仔软,可爱,面部表情和善。 
- 快递比预期提前了一天到货,但比预期小。 
- 自己玩了会,但可以考虑在其他地方购买更大一些的公仔。


注：完全没有例会prompt中**产品运输**的重点信息

# 总结

还得是chatgpt，chatglm被薄纱