# ChatGPT与ChatGLM对比

&emsp;&emsp;国产大模型有很多，比如文心一言、通义千问、星火、MOSS和ChatGLM等等，但现在明确可以部署在本地并且开放api的只有MOOS和ChatGLM。MOOS由于需要的GPU显存过大（不量化的情况下需要80GB，多轮对话还是会爆显存），但ChatGLM可以在笔记本电脑部署（int4版本只需要6GB显存即可）。所以本文采用ChatGLM与ChatGPT做对比，看看国产模型的优点和缺点。

&emsp;&emsp;会在选取本教程的各个方面进行对比，最后会总结ChatGPT与ChatGLM各自的优缺点。

## ChatGLM环境配置

&emsp;&emsp;ChatGLM环境配置可以参考DataWhale的这篇文章：[ChatGLM-6B 本地部署指南！](https://mp.weixin.qq.com/s/545Z4DTB78q_sLqBq6dC1A)

&emsp;&emsp;部署好了之后，运行项目中的`api.py`文件即可。下面是使用ChatGLM的api封装的类似chatgpt一样的`get_completion`函数，只需要传进去prompt参数即可。

In [1]:
import requests
import json

In [2]:
def get_completion_glm(prompt):
    headers = {'Content-Type': 'application/json'}
    data = {"prompt": prompt, "history": []}
    response = requests.post(url='http://127.0.0.1:8000', headers=headers, data=json.dumps(data))
    return response.json()['response']

get_completion_glm("你好")

'你好👋!我是人工智能助手 ChatGLM-6B,很高兴见到你,欢迎问我任何问题。'

## ChatGPT环境配置

&emsp;&emsp;本教程使用 OpenAI 所开放的 ChatGPT API，因此你需要首先拥有一个 ChatGPT 的 API_KEY（也可以直接访问官方网址在线测试），然后需要安装 openai 的第三方库

&emsp;&emsp;首先需要安装所需第三方库：

```
    openai：

    pip install openai
    dotenv:

    pip install -U python-dotenv
```

In [None]:
# 将自己的 API-KEY 导入系统环境变量
!export OPENAI_API_KEY='api-key'

In [None]:
import openai
import os
from dotenv import load_dotenv, find_dotenv
# 导入第三方库

_ = load_dotenv(find_dotenv())
# 读取系统中的环境变量

openai.api_key  = os.getenv('OPENAI_API_KEY')
# 设置 API_KEY

封装一个函数

In [2]:
def get_completion_gpt(prompt, model="gpt-3.5-turbo", temperature=0): 
    messages = [{"role": "user", "content": prompt}]
    response = openai.ChatCompletion.create(
        model=model,
        messages=messages,
        temperature=temperature, # 值越低则输出文本随机性越低
    )
    return response.choices[0].message["content"]

get_completion_gpt('你好')

'你好！有什么我可以帮助你的吗？'

## 文本理解

有步骤的文本

In [4]:
# 有步骤的文本
text_1 = f"""
泡一杯茶很容易。首先，需要把水烧开。\
在等待期间，拿一个杯子并把茶包放进去。\
一旦水足够热，就把它倒在茶包上。\
等待一会儿，让茶叶浸泡。几分钟后，取出茶包。\
如果你愿意，可以加一些糖或牛奶调味。\
就这样，你可以享受一杯美味的茶了。
"""
prompt = f"""
您将获得由三个引号括起来的文本。\
如果它包含一系列的指令，则需要按照以下格式重新编写这些指令：

第一步 - ...
第二步 - …
…
第N步 - …

如果文本中不包含一系列的指令，则直接写“未提供步骤”。"
\"\"\"{text_1}\"\"\"
"""

In [5]:
get_completion_glm(prompt)

'第一步: 把水烧开\n第二步: 等待期间,拿一个杯子并把茶包放进去\n第三步: 一旦水足够热,就把它倒在茶包上\n第四步: 等待一会儿,让茶叶浸泡\n第五步: 几分钟后,取出茶包\n第六步: 如果你愿意,可以加一些糖或牛奶调味\n\n未提供步骤'

In [11]:
get_completion_gpt(prompt)

'第一步 - 把水烧开。\n第二步 - 拿一个杯子并把茶包放进去。\n第三步 - 把烧开的水倒在茶包上。\n第四步 - 等待几分钟，让茶叶浸泡。\n第五步 - 取出茶包。\n第六步 - 如果你愿意，可以加一些糖或牛奶调味。\n第七步 - 就这样，你可以享受一杯美味的茶了。'

**注**：这里可以看出，提供的文本是有步骤的文本。chatglm给出了步骤，但在最后说了`未提供步骤`。但chatgpt给出步骤，而且步骤要比chatglm的完整，而且回答正确。

无步骤文本

In [8]:
# 无步骤的文本
text_2 = f"""
今天阳光明媚，鸟儿在歌唱。\
这是一个去公园散步的美好日子。\
鲜花盛开，树枝在微风中轻轻摇曳。\
人们外出享受着这美好的天气，有些人在野餐，有些人在玩游戏或者在草地上放松。\
这是一个完美的日子，可以在户外度过并欣赏大自然的美景。
"""
prompt = f"""
您将获得由三个引号括起来的文本。\
如果它包含一系列的指令，则需要按照以下格式重新编写这些指令：

第一步 - ...
第二步 - …
…
第N步 - …

如果文本中不包含一系列的指令，则直接写“未提供步骤”。"
\"\"\"{text_2}\"\"\"
"""

In [9]:
get_completion_glm(prompt)

'第一步: 阳光明媚,鸟儿在歌唱。\n第二步: 去公园散步,欣赏鲜花和树枝。\n第三步: 享受野餐、玩游戏或放松在草地上。\n第四步: 看到有人在户外度过美好的日子。\n\n未提供步骤。'

In [13]:
get_completion_gpt(prompt)

'未提供步骤。'

**注：** 提供的是一个无步骤文本，但cgatglm回答了一个步骤，在最后说了无步骤，这跟上面的有步骤文本回答几乎一样。chatgpt则是直接给出`未提供步骤`的回答。

提供少量示例的文本

In [11]:
prompt = f"""
你的任务是以一致的风格回答问题。

<孩子>: 教我耐心。

<祖父母>: 挖出最深峡谷的河流源于一处不起眼的泉眼；最宏伟的交响乐从单一的音符开始；最复杂的挂毯以一根孤独的线开始编织。

<孩子>: 教我韧性。
"""

In [12]:
get_completion_glm(prompt)

'韧性是一种能够在压力和挑战中保持弹性和稳定性的品质。以下是一些培养韧性的方法:\n\n1. 练习接受失败:韧性的培养需要通过不断地接受失败和尝试新的事物来实现。在失败中学习并继续前进,是成长和发展的关键。\n\n2. 坚持锻炼:韧性的培养需要坚持进行一些有益身心的活动,如跑步、游泳、瑜伽等。这些活动能够帮助身体和心理不断地适应变化和压力。\n\n3. 学会放松:当我们处于压力和紧张的状态时,我们需要学会放松自己。可以通过冥想、深呼吸、瑜伽等方式来缓解紧张和焦虑。\n\n4. 学习沟通:沟通是人际关系中非常重要的一环。学会有效地表达自己的想法和感受,倾听他人的意见和想法,能够更好地建立良好的人际关系,提高韧性。\n\n5. 保持积极心态:积极的心态能够帮助我们应对挑战和困难。要学会看到问题背后的机遇和可能性,而不是陷入消极情绪中。\n\n通过以上方法,我们可以培养自己的韧性,让自己在压力和挑战中保持弹性和稳定性。'

In [15]:
get_completion_gpt(prompt)

'<祖父母>: 韧性就像是一棵树，它需要经历风吹雨打、日晒风干，才能成长得更加坚强。所以，当你遇到挫折和困难时，不要轻易放弃，要坚持下去，相信自己的能力和潜力，最终你会成为一棵茁壮成长的大树。'

**注：** 让你模仿，没让你超越啊！可以看出cgatglm的回答与提供的少量示例文本几乎毫无关系，而chatgpt则是按照提供的示例模型续写。chatgpt薄纱chatglm。

关注点侧重

In [13]:
prod_review_zh = """
这个熊猫公仔是我给女儿的生日礼物，她很喜欢，去哪都带着。
公仔很软，超级可爱，面部表情也很和善。但是相比于价钱来说，
它有点小，我感觉在别的地方用同样的价钱能买到更大的。
快递比预期提前了一天到货，所以在送给女儿之前，我自己玩了会。
"""
# 侧重运输
prompt = f"""
你的任务是从电子商务网站上生成一个产品评论的简短摘要。

请对三个反引号之间的评论文本进行概括，最多30个词汇，并且聚焦在产品运输上。

评论: ```{prod_review_zh}```
"""

In [14]:
get_completion_glm(prompt)

'评论: 送给女儿的生日礼物,她喜欢公仔,软,可爱,和善。但小,感觉在其他地方用同样的价钱能买到更大的。快递比预期提前了一天到货,自己玩了会。'

In [11]:
get_completion_gpt(prompt)

'快递提前到货，熊猫公仔软可爱，但有点小，价钱不太划算。'

**注：**  让它侧重运输，chatglm甚至把运输的内容放在了回答的最后，chatgpt倒是把运输的部分放到了最前，表示侧重。

关键信息提取

In [12]:
prompt = f"""
你的任务是从电子商务网站上的产品评论中提取相关信息。

请从以下三个反引号之间的评论文本中提取产品运输相关的信息，最多30个词汇。

评论: ```{prod_review_zh}```
"""

In [15]:
get_completion_glm(prompt)

'评论: 熊猫公仔是给女儿的生日礼物,她很喜欢,公仔很软、可爱,面部表情和善。但小,感觉在别的地方用同样的价钱能买到更大的。快递比预期提前了一天到货,自己玩了会。'

In [13]:
get_completion_gpt(prompt)

'快递比预期提前了一天到货。'

**注：** 想再给chatglm一次机会，但没把握住啊。提取运输的关键信息，chatglm全说了一遍，回答与提问基本没啥关系。chatgpt回答符合我的要求。

### 总结

- 文本理解方面，chatglm与chatgpt的差距有点大。首先是步骤文本，无论提供的文本是否有步骤，chatglm都给出了步骤。而chatgpt则是有步骤给步骤，没步骤就不给。

- 示例文本续写方面，chatglm本着模仿就要超越的原则，直接舍弃提供的少量示例，放飞自我。chatgpt则是按照提供的少量示例给出了答案。

- 关键信息提取，chatglm表现差强人意，不太行。chatgpt倒是符合我的要求。

## 结构化输出

In [33]:
text = f"""
在一个迷人的村庄里，兄妹杰克和吉尔出发去一个山顶井里打水。\
他们一边唱着欢乐的歌，一边往上爬，\
然而不幸降临——杰克绊了一块石头，从山上滚了下来，吉尔紧随其后。\
虽然略有些摔伤，但他们还是回到了温馨的家中。\
尽管出了这样的意外，他们的冒险精神依然没有减弱，继续充满愉悦地探索。
"""
# example 
prompt = f"""
1-用一句话概括下面用<>括起来的文本。
2-将摘要翻译成英语。
3-在英语摘要中列出每个名称。
4-输出一个 JSON 对象，其中包含以下键：English_summary，num_names。

请使用以下格式：
文本：<要总结的文本>
摘要：<摘要>
翻译：<摘要的翻译>
名称：<英语摘要中的名称列表>
输出 JSON：<带有 English_summary 和 num_names 的 JSON>

Text: <{text}>
"""

In [16]:
get_completion_glm(prompt)

'这段评论是关于在电子商务网站上购买的一个熊猫公仔的。评论者给女儿了一个生日礼物,她非常喜欢这个公仔,因此公仔的大小并不是问题。评论者认为公仔很可爱,面部表情也很和善,但是相比于价钱来说,公仔有点小,因此感觉在其他地方用同样的价钱能买到更大的。快递比预期提前了一天到货,评论者自己在之前玩了一会儿。'

In [35]:
get_completion_gpt(prompt)

'摘要：兄妹杰克和吉尔在迷人的村庄里冒险，不幸摔伤后回到家中，但仍然充满冒险精神。\n翻译：In a charming village, siblings Jack and Jill set out to fetch water from a mountaintop well. While climbing and singing, Jack trips on a stone and tumbles down the mountain, with Jill following closely behind. Despite some bruises, they make it back home safely. Their adventurous spirit remains undiminished as they continue to explore with joy.\n名称：Jack，Jill\n输出 JSON：{"English_summary": "In a charming village, siblings Jack and Jill set out to fetch water from a mountaintop well. While climbing and singing, Jack trips on a stone and tumbles down the mountain, with Jill following closely behind. Despite some bruises, they make it back home safely. Their adventurous spirit remains undiminished as they continue to explore with joy.", "num_names": 2}'

**注：** 可以看出，chatglm完全忽略了prompt中的`输出json对象`。chatgpt的回答是符合要求的。

从客户的评论中提取结构化信息

In [17]:
# 中文
lamp_review_zh = """
我需要一盏漂亮的卧室灯，这款灯具有额外的储物功能，价格也不算太高。\
我很快就收到了它。在运输过程中，我们的灯绳断了，但是公司很乐意寄送了一个新的。\
几天后就收到了。这款灯很容易组装。我发现少了一个零件，于是联系了他们的客服，他们很快就给我寄来了缺失的零件！\
在我看来，Lumina 是一家非常关心顾客和产品的优秀公司！
"""
# 中文
prompt = f"""
从评论文本中识别以下项目：
- 评论者购买的物品
- 制造该物品的公司

评论文本用三个反引号分隔。将你的响应格式化为以 “物品” 和 “品牌” 为键的 JSON 对象。
如果信息不存在，请使用 “未知” 作为值。
让你的回应尽可能简短。
  
评论文本: ```{lamp_review_zh}```
"""

In [18]:
get_completion_glm(prompt)

'物品:卧室灯\n品牌:Lumina'

In [15]:
get_completion_gpt(prompt)

'{\n  "物品": "卧室灯",\n  "品牌": "Lumina"\n}'

**注：** chatglm提取信息成功！口头表扬一次，但是并没有按照json对象输出，口头批评一次。chatgpt做的很好，表扬一次。

一次提取多条信息

In [19]:
# 中文
prompt = f"""
从评论文本中识别以下项目：
- 情绪（正面或负面）
- 审稿人是否表达了愤怒？（是或否）
- 评论者购买的物品
- 制造该物品的公司

评论用三个反引号分隔。将您的响应格式化为 JSON 对象，以 “Sentiment”、“Anger”、“Item” 和 “Brand” 作为键。
如果信息不存在，请使用 “未知” 作为值。
让你的回应尽可能简短。
将 Anger 值格式化为布尔值。

评论文本: ```{lamp_review_zh}```
"""

In [22]:
get_completion_glm(prompt)

'Sentiment: 正面\nAnger: 否\nItem: 卧室灯\nBrand:mina'

In [17]:
get_completion_gpt(prompt)

'{\n  "Sentiment": "正面",\n  "Anger": false,\n  "Item": "卧室灯",\n  "Brand": "Lumina"\n}'

**注：** chatglm提取信息确实是提取的没问题，但是吧，还是没有转化为json对象输出。并且`Anger`没有给出布尔值，扣分项。

### 总结

提取信息+结构化输出，chatglm基本只能做到提取信息，并没有实现输出json对象。能力有待加强，不知道chatglm-130B的版本如何？希望能更好些，加油~

## 翻译

多语种翻译

In [23]:
prompt = f"""
请将以下文本分别翻译成中文、英文、法语和西班牙语: 
```I want to order a basketball.```
"""

In [25]:
get_completion_glm(prompt)

'``` 我想订购一支篮球。```\n\n中文:我想订购一支篮球。\n\n英文:I want to order a basketball.\n\n法语:Je veux orderir une ballon.\n\n西班牙语:Yo quiero orderar una ballon.'

In [19]:
get_completion_gpt(prompt)

'中文：我想订购一个篮球。\n英文：I want to order a basketball.\n法语：Je veux commander un ballon de basket.\n西班牙语：Quiero pedir una pelota de baloncesto.'

**注：** 本人知识浅薄，法语和西班牙语翻译是用有道翻译检验。chatglm和chatgpt的翻译都正确。大胜利！

翻译+正式语气

In [27]:
prompt = f"""
请将以下文本翻译成中文，分别展示成正式与非正式两种语气: 
```Would you like to order a pillow?```
"""

In [28]:
get_completion_glm(prompt)

'```正式语气```\n请问您想订购一张枕头吗?\n\n```非正式语气```\n哇,要订购枕头耶!不知道哪种款式适合你呢?'

In [21]:
get_completion_gpt(prompt)

'正式语气：请问您需要订购枕头吗？\n非正式语气：你要不要订一个枕头？'

**注：** 非常语气的回答中，chatglm非常的卡哇伊，而chatgpt的回答和正式语气相比，只是去掉了敬语。chatglm大胜利，加一分。

### 总结

在翻译这块，chatglm做的和chatgpt相差无几，甚至可以说有些超越。换个角度想想，本地部署一个chatglm-int4专门用来翻译也不错啊，起码本地部署的api不收费！

## 逻辑推理

In [29]:
prompt = f"""
请判断学生的解决方案是否正确，请通过如下步骤解决这个问题：

步骤：

    首先，自己解决问题。
    然后将你的解决方案与学生的解决方案进行比较，并评估学生的解决方案是否正确。在自己完成问题之前，请勿决定学生的解决方案是否正确。

使用以下格式：

    问题：问题文本
    学生的解决方案：学生的解决方案文本
    实际解决方案和步骤：实际解决方案和步骤文本
    学生的解决方案和实际解决方案是否相同：是或否
    学生的成绩：正确或不正确

问题：

    我正在建造一个太阳能发电站，需要帮助计算财务。 
    - 土地费用为每平方英尺100美元
    - 我可以以每平方英尺250美元的价格购买太阳能电池板
    - 我已经谈判好了维护合同，每年需要支付固定的10万美元，并额外支付每平方英尺10美元
    作为平方英尺数的函数，首年运营的总费用是多少。

学生的解决方案：

    设x为发电站的大小，单位为平方英尺。
    费用：
    1. 土地费用：100x
    2. 太阳能电池板费用：250x
    3. 维护费用：100,000+100x
    总费用：100x+250x+100,000+100x=450x+100,000

实际解决方案和步骤：
"""

In [30]:
get_completion_glm(prompt)

'学生的解决方案是正确的。\n\n实际解决方案和步骤:\n\n1. 计算土地费用:根据题意,土地费用为每平方英尺100美元,因此土地费用为100 x = 100,000美元。\n\n2. 计算太阳能电池板费用:根据题意,我可以以每平方英尺250美元的价格购买太阳能电池板,因此太阳能电池板费用为250 x = 250,000美元。\n\n3. 计算维护费用:根据题意,我已经谈判好了维护合同,每年需要支付固定的10万美元,并额外支付每平方英尺10美元,因此维护费用为100,000 + 100 x = 101,000美元。\n\n4. 计算总费用:根据学生的解决方案,总费用为100 x + 250 x + 100,000 + 100 x = 450 x + 100,000美元。\n\n因此,首年运营的总费用为450,000美元 + 100,000美元 + 101,000美元 = 601,000美元。'

In [19]:
get_completion_gpt(prompt)

'正确的解决方案和步骤：\n    1. 计算土地费用：100美元/平方英尺 * x平方英尺 = 100x美元\n    2. 计算太阳能电池板费用：250美元/平方英尺 * x平方英尺 = 250x美元\n    3. 计算维护费用：10万美元 + 10美元/平方英尺 * x平方英尺 = 10万美元 + 10x美元\n    4. 计算总费用：100x美元 + 250x美元 + 10万美元 + 10x美元 = 360x + 10万美元\n\n学生的解决方案和实际解决方案是否相同：否\n\n学生的成绩：不正确'

**注：** 实际上学生的解决方案是不正确的，维护费用每平方英尺是10美元，在学生的解答中错误的将其写成了100美元，但chatglm并没有发现这个错误。相反chatgpt发现了错误，并给出了正确解法。