In [1]:
import os
import re
import json
from tqdm import tqdm, trange
from openai import OpenAI

In [2]:
client = OpenAI(
    base_url="https://open.bigmodel.cn/api/paas/v4/",
    api_key=os.environ["API_KEY"],
)

def stream_chat(prompt: str, system: str = "You are a helpful assistant.", show_log: bool = False):
    """
    流式对话，让你看到过程，然后将结果返回
    """
    messages = [{"role": "system", "content": system}]
    messages.append({"role": "user", "content": prompt})
    response = client.chat.completions.create(
        model="GLM-4-Plus",
        messages=messages,
        top_p=0.5,
        temperature=1,
        n=1,
        max_tokens=4096,
        stream=True,
    )
    response_text = ""
    for event in response:
        # print(event)
        event_text = event.choices[0].delta.content  # extract the text
        if event_text is None:
            event_text = ""
        response_text += event_text
        if show_log:
            print(event_text, end='', flush=True)
    if show_log:
        print("")
    return response_text

In [3]:
def remove_number_dot(text):
    # 正则表达式匹配以数字和点号开头的模式
    pattern = r'^\d+\.\s*'
    # 使用re.sub替换匹配到的内容为空字符串
    result = re.sub(pattern, '', text)
    return result

In [4]:
prompt1_1 = """
模拟用户对话。
生成一些关于获取当前系统信息的指令，大概50条左右。例如：1. 帮我看看当前系统信息。
一般能获取到的信息格式如下：
```text
CPU信息:核心数: {cpu_count}个,当前使用率: {cpu_percent}%,当前频率: {round(cpu_freq.current, 2)} MHz
        内存信息:已用内存: {used_memory} GB,可用内存: {available_memory} GB,内存使用率: {memory_percent}%
```
基于这个返回来生成系统信息，不要超出返回内容的范围。
只返回生成后的结果，不要多余回答。生成内容尽量不要重复。
"""
prompt1_2 = """
生成一些关于获取当前系统信息的指令，大概50条左右。例如：1. 获取当前系统信息。
一般能获取到的信息格式如下：
```text
CPU信息:核心数: {cpu_count}个,当前使用率: {cpu_percent}%,当前频率: {round(cpu_freq.current, 2)} MHz
        内存信息:已用内存: {used_memory} GB,可用内存: {available_memory} GB,内存使用率: {memory_percent}%
```
基于这个返回来生成系统信息，不要超出返回内容的范围。
只返回生成后的结果，不要多余回答。生成内容尽量不要重复。
"""

In [5]:
result_text1 = ""
for i in trange(5):
    temp_text = stream_chat(prompt1_1, system="你是一个电脑助手", show_log=False)
    result_text1 += "\n" + temp_text
for i in trange(5):
    temp_text = stream_chat(prompt1_2, system="你是一个电脑助手", show_log=True)
    result_text1 += "\n" + temp_text

100%|██████████████████████████████████████████████████████████████████████| 5/5 [01:22<00:00, 16.41s/it]
  0%|                                                                              | 0/5 [00:00<?, ?it/s]

1. 获取当前CPU核心数。
2. 查询当前CPU使用率。
3. 获取当前CPU频率。
4. 显示已用内存量。
5. 查看可用内存量。
6. 获取内存使用率。
7. 获取CPU和内存的综合信息。
8. 检查CPU核心数和使用率。
9. 查询CPU当前频率和内存使用情况。
10. 获取系统CPU和内存的详细信息。
11. 显示CPU核心数及当前使用率。
12. 查看CPU频率和内存使用率。
13. 获取当前系统CPU信息。
14. 查询当前系统内存信息。
15. 显示CPU使用率和内存使用率。
16. 获取CPU核心数和当前频率。
17. 查看已用内存和可用内存。
18. 获取内存使用率和CPU使用率。
19. 显示CPU核心数及频率。
20. 查询内存使用情况和CPU使用率。
21. 获取CPU频率和内存信息。
22. 显示CPU使用率和当前频率。
23. 查看内存使用率和CPU核心数。
24. 获取CPU核心数和内存使用率。
25. 查询CPU频率和内存使用情况。
26. 显示CPU和内存的综合信息。
27. 获取当前CPU使用率和频率。
28. 查看CPU核心数和内存使用率。
29. 显示内存使用情况和CPU频率。
30. 获取CPU核心数和内存详细信息。
31. 查询CPU使用率和内存使用率。
32. 显示CPU频率和核心数。
33. 获取内存使用情况和CPU信息。
34. 查看CPU使用率和内存详细信息。
35. 显示CPU核心数和使用率。
36. 获取CPU频率和内存使用率。
37. 查询CPU核心数和内存使用情况。
38. 显示内存使用率和CPU频率。
39. 获取CPU使用率和内存详细信息。
40. 查看CPU频率和核心数。
41. 显示CPU和内存的详细信息。
42. 获取CPU核心数和使用率。
43. 查询内存使用率和CPU频率。
44. 显示CPU频率和内存使用率。
45. 获取CPU使用率和核心数。
46. 查看内存使用情况和CPU详细信息。
47. 显示CPU核心数和频率。
48. 获取内存使用率和CPU使用率。
49. 查询CPU频率和核心数。
50. 显示CPU和内存的综合使用情况。

 20%|██████████████                                                        | 1/5 [00:14<00:59, 14.94s/it]


1. 获取当前CPU核心数。
2. 查询当前CPU使用率。
3. 获取当前CPU频率。
4. 获取已用内存量。
5. 查询可用内存量。
6. 获取内存使用率。
7. 显示CPU核心数及使用率。
8. 显示CPU频率及使用率。
9. 显示已用内存及内存使用率。
10. 显示可用内存及内存使用率。
11. 获取CPU详细信息。
12. 获取内存详细信息。
13. 显示系统CPU和内存概览。
14. 查询CPU当前频率及使用率。
15. 查询内存已用及可用量。
16. 获取CPU核心数和当前频率。
17. 获取内存使用率和可用内存。
18. 显示CPU核心数及当前频率。
19. 显示内存已用及使用率。
20. 查询系统CPU信息。
21. 查询系统内存信息。
22. 获取CPU使用率和核心数。
23. 获取内存可用量和使用率。
24. 显示CPU频率及核心数。
25. 显示内存已用及可用量。
26. 查询CPU核心数及使用率。
27. 查询内存使用率及可用量。
28. 获取CPU当前频率及核心数。
29. 获取内存已用及使用率。
30. 显示CPU详细信息及内存概览。
31. 显示内存详细信息及CPU概览。
32. 查询CPU频率及核心数。
33. 查询内存已用及使用率。
34. 获取CPU使用率及当前频率。
35. 获取内存可用量及使用率。
36. 显示CPU核心数及内存使用率。
37. 显示内存可用量及CPU频率。
38. 查询系统CPU及内存信息。
39. 获取CPU核心数及内存使用率。
40. 获取内存可用量及CPU频率。
41. 显示CPU使用率及内存已用。
42. 显示内存可用量及CPU核心数。
43. 查询CPU频率及内存使用率。
44. 查询内存已用及CPU核心数。
45. 获取CPU当前频率及内存可用量。
46. 获取内存使用率及CPU核心数。
47. 显示CPU核心数及内存已用。
48. 显示内存使用率及CPU频率。
49. 查询CPU使用率及内存可用量。
50. 查询内存已用及CPU频率。

 40%|████████████████████████████                                          | 2/5 [00:29<00:43, 14.45s/it]


1. 获取当前CPU核心数。
2. 查询当前CPU使用率。
3. 获取当前CPU频率。
4. 获取已用内存量。
5. 查询可用内存量。
6. 获取内存使用率。
7. 显示CPU详细信息。
8. 显示内存详细信息。
9. 获取系统CPU核心数。
10. 查询系统CPU使用率。
11. 获取系统CPU当前频率。
12. 获取系统已用内存。
13. 查询系统可用内存。
14. 获取系统内存使用率。
15. 显示当前CPU状态。
16. 显示当前内存状态。
17. 获取CPU核心数量。
18. 查询CPU当前使用率。
19. 获取CPU当前运行频率。
20. 获取内存已用量。
21. 查询内存可用量。
22. 获取内存当前使用率。
23. 显示系统CPU信息。
24. 显示系统内存信息。
25. 获取当前CPU使用详情。
26. 获取当前内存使用详情。
27. 查询CPU核心数。
28. 查询CPU使用百分比。
29. 获取CPU当前频率值。
30. 获取内存使用量。
31. 查询内存可用空间。
32. 获取内存使用百分比。
33. 显示CPU当前信息。
34. 显示内存当前信息。
35. 获取系统CPU核心详细信息。
36. 查询系统CPU使用百分比。
37. 获取系统CPU当前频率。
38. 获取系统内存已用量。
39. 查询系统内存可用量。
40. 获取系统内存使用百分比。
41. 显示当前系统CPU状态。
42. 显示当前系统内存状态。
43. 获取CPU核心数及使用率。
44. 查询CPU频率及使用率。
45. 获取内存使用量及可用量。
46. 查询内存使用率及可用率。
47. 显示CPU核心数及当前频率。
48. 显示内存已用及可用量。
49. 获取CPU及内存使用详情。
50. 查询系统CPU及内存状态。

 60%|██████████████████████████████████████████                            | 3/5 [00:40<00:26, 13.20s/it]


1. 获取当前CPU核心数。
2. 查询当前CPU使用率。
3. 获取当前CPU频率。
4. 获取已用内存量。
5. 查询可用内存量。
6. 获取内存使用率。
7. 显示CPU详细信息。
8. 显示内存详细信息。
9. 获取系统CPU核心数。
10. 查询系统CPU使用率。
11. 获取系统CPU当前频率。
12. 获取系统已用内存。
13. 查询系统可用内存。
14. 获取系统内存使用率。
15. 显示当前CPU状态。
16. 显示当前内存状态。
17. 获取CPU核心数量。
18. 查询CPU当前使用率。
19. 获取CPU当前运行频率。
20. 获取内存已用量。
21. 查询内存可用量。
22. 获取内存当前使用率。
23. 显示系统CPU信息。
24. 显示系统内存信息。
25. 获取当前CPU使用详情。
26. 获取当前内存使用详情。
27. 查询CPU核心数。
28. 查询CPU使用百分比。
29. 获取CPU当前频率值。
30. 获取内存使用量。
31. 查询内存可用空间。
32. 获取内存使用百分比。
33. 显示CPU当前信息。
34. 显示内存当前信息。
35. 获取系统CPU核心详细信息。
36. 查询系统CPU使用百分比。
37. 获取系统CPU当前频率。
38. 获取系统内存已用量。
39. 查询系统内存可用量。
40. 获取系统内存使用百分比。
41. 显示当前系统CPU状态。
42. 显示当前系统内存状态。
43. 获取CPU核心数及使用率。
44. 查询CPU频率及使用率。
45. 获取内存使用量及可用量。
46. 查询内存使用率及可用率。
47. 显示CPU核心数及当前频率。
48. 显示内存已用及可用量。
49. 获取CPU及内存使用详情。
50. 查询系统CPU及内存状态。

 80%|████████████████████████████████████████████████████████              | 4/5 [00:52<00:12, 12.60s/it]


1. 获取当前CPU核心数。
2. 查询当前CPU使用率。
3. 获取当前CPU频率。
4. 获取已用内存量。
5. 查询可用内存量。
6. 获取内存使用率。
7. 显示CPU详细信息。
8. 显示内存详细信息。
9. 获取系统CPU和内存信息。
10. 查询CPU核心数和使用率。
11. 获取CPU频率和内存使用情况。
12. 查看当前CPU使用率和频率。
13. 获取内存已用和可用量。
14. 查询内存使用率和CPU核心数。
15. 显示CPU当前频率和内存信息。
16. 获取CPU核心数和当前频率。
17. 查询内存已用和可用情况。
18. 显示CPU使用率和内存使用率。
19. 获取CPU和内存的详细信息。
20. 查询CPU频率和内存使用率。
21. 显示当前CPU核心数和频率。
22. 获取内存使用情况和CPU使用率。
23. 查询CPU核心数和内存已用量。
24. 显示CPU频率和内存可用量。
25. 获取CPU使用率和内存详细信息。
26. 查询内存使用率和CPU频率。
27. 显示CPU核心数和内存使用率。
28. 获取CPU频率和内存已用量。
29. 查询内存可用量和CPU使用率。
30. 显示CPU详细信息和使用率。
31. 获取内存详细信息和使用率。
32. 查询CPU核心数和内存可用量。
33. 显示CPU频率和内存使用情况。
34. 获取CPU使用率和内存频率。
35. 查询内存已用量和CPU核心数。
36. 显示内存使用率和CPU详细信息。
37. 获取CPU核心数和内存使用率。
38. 查询CPU频率和内存已用量。
39. 显示内存可用量和CPU使用情况。
40. 获取CPU详细信息和使用率。
41. 查询内存使用率和CPU核心数。
42. 显示CPU频率和内存详细信息。
43. 获取CPU核心数和内存可用量。
44. 查询内存已用量和CPU使用率。
45. 显示CPU使用情况和内存使用率。
46. 获取CPU频率和内存详细信息。
47. 查询内存可用量和CPU核心数。
48. 显示CPU详细信息和使用情况。
49. 获取内存使用率和CPU频率。
50. 查询CPU核心数和内存使用情况。

100%|██████████████████████████████████████████████████████████████████████| 5/5 [01:06<00:00, 13.29s/it]







In [6]:
text_list = [remove_number_dot(text) for text in result_text1.split()]
text_list = [text.strip() for text in text_list]
text_list = [text for text in text_list if len(text) > 0]
text_list = list(set(text_list))
print(f"初步生成的指令有：{len(text_list)}条")

初步生成的指令有：381条


In [7]:
text_list

['获取当前CPU使用详情。',
 '获取CPU核心数量。',
 '显示系统内存信息。',
 '显示CPU的频率信息。',
 '帮我看看内存的已用容量和使用率。',
 '获取CPU详细信息和使用率。',
 '查询内存已用和可用情况。',
 '显示CPU当前频率和内存信息。',
 '请显示内存的已用容量。',
 '获取内存使用情况和CPU使用率。',
 '获取当前系统CPU信息。',
 '查看当前CPU的使用率和内存详细信息。',
 '查看当前CPU的频率和内存的可用容量。',
 '显示当前CPU的使用率和频率。',
 '获取当前CPU核心数。',
 '获取CPU核心数和内存可用量。',
 '帮我获取系统的CPU和内存状态。',
 '显示内存可用量和CPU使用情况。',
 '能告诉我现在的CPU频率吗？',
 '当前CPU的频率信息是多少？',
 '请提供当前内存的详细信息。',
 '显示CPU的当前频率和内存的已用容量。',
 '查询系统CPU信息。',
 '获取当前CPU的使用率和频率。',
 '显示当前CPU的使用情况和内存状态。',
 '显示当前CPU的使用率和内存占用。',
 '显示当前系统的内存使用情况和CPU状态。',
 '请提供内存的可用容量和CPU的核心数。',
 '查询CPU核心数。',
 '显示CPU频率及使用率。',
 '获取已用内存量。',
 '获取CPU频率和内存信息。',
 '显示CPU频率和核心数。',
 '获取系统已用内存。',
 '请展示CPU的频率和内存的使用情况。',
 '查看CPU频率和内存使用率。',
 '显示已用内存和可用内存。',
 '显示内存详细信息及CPU概览。',
 '请提供当前CPU和内存的使用情况。',
 '显示内存的可用内存和内存使用率。',
 '查询内存使用率和CPU核心数。',
 '帮我获取CPU的使用率和核心数。',
 '能否告诉我CPU的核心数和使用率？',
 '获取内存使用率。',
 '帮我查看系统的CPU和内存状态。',
 '获取当前内存的已用和可用容量。',
 '查询系统CPU及内存信息。',
 '查询CPU当前频率及使用率。',
 '显示当前CPU的使用率。',
 '请告诉我当前CPU的使用率。',
 '查看已用内存和可用内存。',
 '查询CPU核心数和内存可用量。',
 '获取CPU和内存

In [8]:
data_list = [{"text": text} for text in text_list ]

In [9]:
len(data_list)

381

In [10]:
### 保存结果
import os
dataset_dir = "dataset"
if not os.path.exists(dataset_dir):
    os.mkdir(dataset_dir)

In [11]:
result_json_path = os.path.join(dataset_dir, "system_info.json")
with open(result_json_path, "wt", encoding="utf-8") as f1:
    json.dump(data_list, f1, indent=4, ensure_ascii=False)