In [1]:
import os
import re
import json
from tqdm import tqdm, trange
from openai import OpenAI

In [2]:
client = OpenAI(
    base_url="https://open.bigmodel.cn/api/paas/v4/",
    api_key=os.environ["API_KEY"],
)

def stream_chat(prompt: str, system: str = "You are a helpful assistant.", show_log: bool = False):
    """
    流式对话，让你看到过程，然后将结果返回
    """
    messages = [{"role": "system", "content": system}]
    messages.append({"role": "user", "content": prompt})
    response = client.chat.completions.create(
        model="GLM-4-Plus",
        messages=messages,
        top_p=0.5,
        temperature=1,
        n=1,
        max_tokens=4096,
        stream=True,
    )
    response_text = ""
    for event in response:
        # print(event)
        event_text = event.choices[0].delta.content  # extract the text
        if event_text is None:
            event_text = ""
        response_text += event_text
        if show_log:
            print(event_text, end='', flush=True)
    if show_log:
        print("")
    return response_text

In [3]:
def remove_number_dot(text):
    # 正则表达式匹配以数字和点号开头的模式
    pattern = r'^\d+\.\s*'
    # 使用re.sub替换匹配到的内容为空字符串
    result = re.sub(pattern, '', text)
    return result

In [4]:
prompt1_1 = """
模拟用户对话。
生成一些关于查询电脑电池状态的问题，大概50条左右。例如：帮我看看电池还有多少电？
对话语气需要模拟用户说话。
只返回生成后的结果，不要多余回答。生成内容尽量不要重复。
"""
prompt1_2 = """
生成一些关于查询电脑电池状态的指令，大概50条左右。例如：查询电池状态
只返回生成后的结果，不要多余回答。生成内容尽量不要重复。
"""

In [5]:
result_text1 = ""
for i in trange(5):
    temp_text = stream_chat(prompt1_1, system="你是一个电脑助手", show_log=False)
    result_text1 += "\n" + temp_text
for i in trange(5):
    temp_text = stream_chat(prompt1_2, system="你是一个电脑助手", show_log=True)
    result_text1 += "\n" + temp_text

100%|██████████████████████████████████████████████████████████████████████| 5/5 [01:27<00:00, 17.54s/it]
  0%|                                                                              | 0/5 [00:00<?, ?it/s]

1. 查看电池状态
2. 检查电脑电池
3. 电池状态查询
4. 获取电池信息
5. 查询电池电量
6. 检测电池健康
7. 查看电池电量
8. 电池状态检测
9. 查询电池状况
10. 检查电池电量
11. 查看电池健康
12. 电池信息查询
13. 检测电池状态
14. 获取电池电量
15. 查询电池性能
16. 检查电池健康
17. 查看电池详情
18. 电池电量查询
19. 检测电池电量
20. 查询电池寿命
21. 检查电池状况
22. 查看电池状态信息
23. 电池健康查询
24. 获取电池状态
25. 查询电池使用情况
26. 检测电池性能
27. 查看电池电量状态
28. 电池状况查询
29. 检查电池详情
30. 查询电池健康状态
31. 获取电池电量信息
32. 查看电池使用状态
33. 电池状态信息查询
34. 检测电池健康状况
35. 查询电池电量详情
36. 检查电池使用情况
37. 查看电池性能状态
38. 电池电量信息查询
39. 获取电池健康状况
40. 查询电池性能详情
41. 检测电池电量状态
42. 查看电池寿命状态
43. 电池使用情况查询
44. 检查电池电量信息
45. 查询电池健康详情
46. 获取电池性能状态
47. 查看电池电量使用情况
48. 电池状态详细信息查询
49. 检测电池寿命状况
50. 查询电池电量健康状况

 20%|██████████████                                                        | 1/5 [00:10<00:40, 10.23s/it]


1. 查看电池状态
2. 检查电脑电池
3. 电池状态查询
4. 获取电池信息
5. 查询电池电量
6. 检测电池状况
7. 电池状态检查
8. 查看电池电量
9. 检查电池电量
10. 查询电池健康状态
11. 获取电池状态
12. 查看电池使用情况
13. 检测电池电量
14. 查询电池性能
15. 检查电池健康
16. 查看电池寿命
17. 获取电池电量
18. 查询电池充电状态
19. 检测电池状态
20. 查看电池充电情况
21. 检查电池充电
22. 查询电池使用时间
23. 获取电池充电状态
24. 查看电池健康状况
25. 检测电池健康
26. 查询电池剩余电量
27. 检查电池寿命
28. 查看电池充电速度
29. 获取电池使用情况
30. 查询电池充电时间
31. 检测电池充电情况
32. 查看电池放电状态
33. 检查电池放电
34. 查询电池循环次数
35. 获取电池放电状态
36. 查看电池充电次数
37. 检测电池循环
38. 查询电池温度
39. 检查电池温度
40. 查看电池热状态
41. 获取电池温度
42. 查询电池电压
43. 检测电池电压
44. 查看电池电压状态
45. 检查电池电压情况
46. 查询电池容量
47. 获取电池容量
48. 查看电池容量状态
49. 检测电池容量
50. 查询电池充放电状态

 40%|████████████████████████████                                          | 2/5 [00:20<00:30, 10.25s/it]


1. 查看电池状态
2. 检查电脑电池
3. 电池状态查询
4. 获取电池信息
5. 查询电池电量
6. 检测电池状况
7. 电池状态检查
8. 查看电池电量
9. 电池信息查询
10. 检查电池电量
11. 查询电池健康状态
12. 获取电池状态
13. 检测电池电量
14. 查看电池健康状况
15. 电池电量查询
16. 检查电池健康
17. 查询电池使用情况
18. 获取电池电量
19. 检测电池状态
20. 查看电池使用状态
21. 电池健康查询
22. 检查电池使用情况
23. 查询电池寿命
24. 获取电池健康状态
25. 检测电池健康
26. 查看电池寿命
27. 电池使用情况查询
28. 检查电池寿命
29. 查询电池充电状态
30. 获取电池使用情况
31. 检测电池充电状态
32. 查看电池充电情况
33. 电池充电状态查询
34. 检查电池充电情况
35. 查询电池剩余电量
36. 获取电池充电状态
37. 检测电池剩余电量
38. 查看电池剩余电量
39. 电池剩余电量查询
40. 检查电池剩余电量
41. 查询电池性能状态
42. 获取电池剩余电量
43. 检测电池性能状态
44. 查看电池性能状态
45. 电池性能状态查询
46. 检查电池性能
47. 查询电池充放电次数
48. 获取电池性能状态
49. 检测电池充放电次数
50. 查看电池充放电次数
51. 电池充放电次数查询
52. 检查电池充放电情况
53. 查询电池温度
54. 获取电池充放电次数
55. 检测电池温度
56. 查看电池温度
57. 电池温度查询
58. 检查电池温度状况
59. 查询电池电压
60. 获取电池温度
61. 检测电池电压
62. 查看电池电压
63. 电池电压查询
64. 检查电池电压状态
65. 查询电池充电速度
66. 获取电池电压
67. 检测电池充电速度
68. 查看电池充电速度
69. 电池充电速度查询
70. 检查电池充电效率
71. 查询电池放电速度
72. 获取电池充电速度
73. 检测电池放电速度
74. 查看电池放电速度
75. 电池放电速度查询
76. 检查电池放电效率
77. 查询电池循环次数
78. 获取电池放电速度
79. 检测电池循环次数
80. 查看电池循环次数
81. 电池循环次数查询
82. 检查电池循环寿命


 60%|██████████████████████████████████████████                            | 3/5 [00:40<00:29, 14.71s/it]


1. 查看电池状态
2. 检查电脑电池
3. 电池状态查询
4. 获取电池信息
5. 查询电池电量
6. 检测电池状况
7. 电池状态检查
8. 查看电池电量
9. 电池信息查询
10. 检查电池电量
11. 查询电池健康状态
12. 获取电池状态
13. 检测电池电量
14. 查看电池健康
15. 电池电量查询
16. 检查电池健康
17. 查询电池使用情况
18. 获取电池电量
19. 检测电池状态
20. 查看电池使用情况
21. 电池状况查询
22. 检查电池使用情况
23. 查询电池寿命
24. 获取电池健康状态
25. 检测电池健康
26. 查看电池寿命
27. 电池电量检查
28. 检查电池寿命
29. 查询电池充电状态
30. 获取电池使用情况
31. 检测电池充电状态
32. 查看电池充电状态
33. 电池健康查询
34. 检查电池充电情况
35. 查询电池剩余电量
36. 获取电池寿命
37. 检测电池剩余电量
38. 查看电池剩余电量
39. 电池充电状态查询
40. 检查电池剩余电量
41. 查询电池性能
42. 获取电池充电状态
43. 检测电池性能
44. 查看电池性能
45. 电池寿命查询
46. 检查电池性能
47. 查询电池充放电次数
48. 获取电池剩余电量
49. 检测电池充放电次数
50. 查看电池充放电次数

 80%|████████████████████████████████████████████████████████              | 4/5 [00:49<00:12, 12.63s/it]


1. 查看电池状态
2. 检查电脑电池
3. 电池状况查询
4. 获取电池信息
5. 电脑电池检测
6. 查询电池电量
7. 电池状态检查
8. 电池使用情况
9. 查看电池电量
10. 电池健康状态
11. 检测电池性能
12. 电池状态报告
13. 查询电池寿命
14. 电池状态监控
15. 查看电池详情
16. 电池电量查询
17. 检查电池健康
18. 电池状态查询
19. 获取电池状态
20. 查看电池性能
21. 电池状况检查
22. 查询电池使用
23. 电池电量检测
24. 检测电池状态
25. 查看电池健康
26. 电池信息查询
27. 查询电池性能
28. 电池状态查看
29. 检查电池电量
30. 电池使用查询
31. 查看电池寿命
32. 电池健康查询
33. 检测电池寿命
34. 查询电池状况
35. 电池电量查看
36. 检查电池状况
37. 电池状态分析
38. 查询电池健康
39. 电池性能检测
40. 查看电池状态
41. 电池电量检查
42. 检测电池电量
43. 查询电池详情
44. 电池状况分析
45. 查看电池使用
46. 电池健康检查
47. 检测电池健康
48. 查询电池电量
49. 电池状态评估
50. 查看电池状况

100%|██████████████████████████████████████████████████████████████████████| 5/5 [00:59<00:00, 11.96s/it]







In [6]:
text_list = [remove_number_dot(text) for text in result_text1.split()]
text_list = [text.strip() for text in text_list]
text_list = [text for text in text_list if len(text) > 0]
text_list = list(set(text_list))
print(f"初步生成的指令有：{len(text_list)}条")

初步生成的指令有：363条


In [7]:
text_list

['查询电池循环次数',
 '获取电池温度',
 '电脑电量还剩多少百分比？急！',
 '帮我检查一下电池电量，谢谢！',
 '电池状态详细信息查询',
 '电池还剩多少电啊？快告诉我。',
 '电池还有多少电量？帮忙看看！',
 '查看电池寿命状态',
 '哎呀，能帮我查一下电脑电池还剩多少电吗？',
 '电池还剩多少电？',
 '检查电池放电',
 '查看电池循环次数',
 '电池充电状态查询',
 '电池状况分析',
 '检测电池电压',
 '电池使用查询',
 '查看电池状况',
 '电池还剩多少电量？赶紧查一下。',
 '电脑电池还够用吗？帮我确认一下。',
 '帮我看看电脑电池还剩多少电？',
 '帮我看看电池电量，快快快！',
 '电池电量现在怎么样了，能查一下吗？',
 '电脑电池还够撑多久啊？',
 '帮我看看，电池电量还够用不？',
 '查询电池充电时间',
 '电池还剩多少电？快帮我瞅瞅。',
 '检查电池电压状态',
 '电池状态分析',
 '哎呀，电脑电池还剩多少电量啊？',
 '哎，帮我看看电脑电池还剩多少电量吧！',
 '能帮我看看电脑电池状态吗？',
 '电池电量还剩多少，麻烦帮我查一下？',
 '查看电池剩余电量',
 '检测电池充电状态',
 '电池还有多少电，快帮我看看！',
 '查询电池充放电次数',
 '查询电池电量健康状况',
 '获取电池剩余电量',
 '能帮我确认一下电脑电池状态吗？',
 '帮我查查电脑电池还剩多少电量？',
 '电池电量还剩多少？急！',
 '帮我查查电脑电池电量还剩多少？',
 '电脑电池状态怎么样了？快告诉我。',
 '查询电池续航能力',
 '电池状态检查',
 '查看电池充电情况',
 '帮忙瞅瞅，电脑电量咋样了？',
 '电脑电池检测',
 '电脑电池还剩多少电？麻烦一下。',
 '电池状态信息查询',
 '获取电池充电时间',
 '查看电池电量',
 '查询电池温度',
 '帮我看看电池还有多少电？',
 '检测电池充放电次数',
 '查询电池放电速度',
 '哎，帮我看看电脑电池还剩多少电吧！',
 '帮我查一下电池电量，快快快！',
 '获取电池电量信息',
 '查询电池健康',
 '哎，电池还剩多少电啊？快查一下。',
 '检查电池充电时长',
 '能不能帮我检查一下电脑电池的电量

In [8]:
data_list = [{"text": text} for text in text_list ]

In [9]:
len(data_list)

363

In [10]:
### 保存结果
import os
dataset_dir = "dataset"
if not os.path.exists(dataset_dir):
    os.mkdir(dataset_dir)

In [11]:
result_json_path = os.path.join(dataset_dir, "battery.json")
with open(result_json_path, "wt", encoding="utf-8") as f1:
    json.dump(data_list, f1, indent=4, ensure_ascii=False)