In [1]:
import os
import re
import json
from tqdm import tqdm, trange
from openai import OpenAI

In [2]:
client = OpenAI(
    base_url="https://open.bigmodel.cn/api/paas/v4/",
    api_key=os.environ["API_KEY"],
)

def stream_chat(prompt: str, system: str = "You are a helpful assistant.", show_log: bool = False):
    """
    流式对话，让你看到过程，然后将结果返回
    """
    messages = [{"role": "system", "content": system}]
    messages.append({"role": "user", "content": prompt})
    response = client.chat.completions.create(
        model="GLM-4-Plus",
        messages=messages,
        top_p=0.5,
        temperature=1,
        n=1,
        max_tokens=4096,
        stream=True,
    )
    response_text = ""
    for event in response:
        # print(event)
        event_text = event.choices[0].delta.content  # extract the text
        if event_text is None:
            event_text = ""
        response_text += event_text
        if show_log:
            print(event_text, end='', flush=True)
    if show_log:
        print("")
    return response_text

In [3]:
def remove_number_dot(text):
    # 正则表达式匹配以数字和点号开头的模式
    pattern = r'^\d+\.\s*'
    # 使用re.sub替换匹配到的内容为空字符串
    result = re.sub(pattern, '', text)
    return result

In [4]:
prompt1_1 = """
模拟用户对话。
生成一些关于执行截图操作的指令，大概50条左右。例如：帮我截一下图。
对话语气需要模拟用户说话。
只返回生成后的结果，不要多余回答。生成内容尽量不要重复。
"""
prompt1_2 = """
生成一些关于执行截图操作的指令，大概50条左右。例如：1. 执行截图操作。2. 请截图
只返回生成后的结果，不要多余回答。生成内容尽量不要重复。
"""

In [5]:
result_text1 = ""
for i in trange(5):
    temp_text = stream_chat(prompt1_1, system="你是一个电脑助手", show_log=False)
    result_text1 += "\n" + temp_text
for i in trange(5):
    temp_text = stream_chat(prompt1_2, system="你是一个电脑助手", show_log=True)
    result_text1 += "\n" + temp_text

100%|██████████████████████████████████████████████████████████████████████| 5/5 [01:11<00:00, 14.22s/it]
  0%|                                                                              | 0/5 [00:00<?, ?it/s]

1. 执行截图操作。
2. 请截图。
3. 进行屏幕截图。
4. 截取当前屏幕。
5. 捕获屏幕图像。
6. 截图当前界面。
7. 请截取屏幕。
8. 执行屏幕捕获。
9. 截取屏幕画面。
10. 拍摄屏幕截图。
11. 截图当前显示。
12. 请进行截图。
13. 捕获当前屏幕。
14. 截取当前视图。
15. 执行截图任务。
16. 截图当前窗口。
17. 请截取当前屏幕。
18. 捕获屏幕快照。
19. 截取屏幕内容。
20. 执行屏幕截图。
21. 请捕获屏幕。
22. 截图当前页面。
23. 捕获当前视图。
24. 截取屏幕影像。
25. 执行截图命令。
26. 请截取界面。
27. 捕获屏幕截图。
28. 截取当前屏幕画面。
29. 执行屏幕捕获操作。
30. 请拍摄屏幕。
31. 截图当前屏幕显示。
32. 捕获屏幕图像。
33. 截取当前屏幕内容。
34. 执行截图功能。
35. 请截取当前视图。
36. 捕获屏幕画面。
37. 截取屏幕快照。
38. 执行屏幕捕获任务。
39. 请截取当前窗口。
40. 捕获当前屏幕显示。
41. 截取屏幕影像。
42. 执行截图操作指令。
43. 请截取当前页面。
44. 捕获屏幕内容。
45. 截取当前屏幕影像。
46. 执行屏幕捕获功能。
47. 请截取当前屏幕画面。
48. 捕获当前屏幕内容。
49. 截取屏幕显示。
50. 执行截图任务指令。

 20%|██████████████                                                        | 1/5 [00:09<00:39,  9.99s/it]


1. 执行截图操作。
2. 请截图。
3. 进行屏幕截图。
4. 截取当前屏幕。
5. 捕获屏幕图像。
6. 截图当前界面。
7. 请截取屏幕。
8. 执行屏幕捕获。
9. 截取屏幕画面。
10. 拍摄屏幕截图。
11. 截取当前视图。
12. 请进行截图。
13. 捕获当前屏幕。
14. 截图当前窗口。
15. 执行屏幕截取。
16. 截取屏幕内容。
17. 请捕获屏幕。
18. 截图当前显示。
19. 捕获屏幕快照。
20. 截取屏幕瞬间。
21. 请截取当前屏幕。
22. 执行屏幕快照。
23. 截取当前画面。
24. 捕获屏幕图像。
25. 请截图当前界面。
26. 截取屏幕截图。
27. 执行屏幕捕获操作。
28. 捕获当前视图。
29. 请截取屏幕画面。
30. 截图当前屏幕内容。
31. 执行屏幕拍摄。
32. 捕获屏幕瞬间。
33. 请截取当前显示。
34. 截取屏幕快照。
35. 执行屏幕图像捕获。
36. 捕获当前窗口。
37. 请截图当前视图。
38. 截取屏幕内容截图。
39. 执行屏幕画面捕获。
40. 捕获当前屏幕显示。
41. 请截取屏幕瞬间。
42. 截图当前屏幕快照。
43. 执行屏幕内容捕获。
44. 捕获当前屏幕图像。
45. 请截图当前窗口。
46. 截取屏幕视图截图。
47. 执行屏幕显示捕获。
48. 捕获当前屏幕画面。
49. 请截取屏幕内容。
50. 截图当前屏幕瞬间。

 40%|████████████████████████████                                          | 2/5 [00:20<00:31, 10.43s/it]


1. 执行截图操作。
2. 请截图。
3. 进行屏幕截图。
4. 截取当前屏幕。
5. 捕获屏幕图像。
6. 截图当前界面。
7. 实施截图功能。
8. 请截取屏幕。
9. 执行屏幕截取。
10. 截图当前屏幕内容。
11. 拍摄屏幕截图。
12. 请进行截图。
13. 截取当前页面。
14. 执行截图命令。
15. 捕获当前屏幕。
16. 截图当前视图。
17. 请截取当前屏幕。
18. 执行屏幕捕获。
19. 截图当前窗口。
20. 捕获屏幕画面。
21. 请截图当前界面。
22. 执行屏幕快照。
23. 截图当前显示。
24. 捕获当前屏幕图像。
25. 请截取当前页面。
26. 执行屏幕截图操作。
27. 截图当前屏幕状态。
28. 捕获当前屏幕画面。
29. 请截图当前窗口。
30. 执行屏幕捕获操作。
31. 截图当前屏幕视图。
32. 捕获当前屏幕显示。
33. 请截取当前视图。
34. 执行屏幕快照操作。
35. 截图当前屏幕内容。
36. 捕获当前屏幕状态。
37. 请截图当前显示。
38. 执行屏幕图像捕获。
39. 截图当前屏幕画面。
40. 捕获当前屏幕内容。
41. 请截取当前窗口。
42. 执行屏幕画面捕获。
43. 截图当前屏幕状态。
44. 捕获当前屏幕视图。
45. 请截图当前状态。
46. 执行屏幕显示捕获。
47. 截图当前屏幕页面。
48. 捕获当前屏幕窗口。
49. 请截取当前显示。
50. 执行屏幕内容捕获。

 60%|██████████████████████████████████████████                            | 3/5 [00:30<00:20, 10.14s/it]


1. 执行截图操作。
2. 请截图。
3. 截取当前屏幕。
4. 进行屏幕截图。
5. 捕获当前屏幕图像。
6. 截图当前界面。
7. 请进行截图操作。
8. 截取屏幕画面。
9. 执行屏幕捕获。
10. 请截取当前屏幕。
11. 截图当前显示内容。
12. 捕获屏幕图像。
13. 请截取屏幕画面。
14. 执行界面截图。
15. 截取当前视图。
16. 请捕获屏幕图像。
17. 截图当前窗口。
18. 执行屏幕截图操作。
19. 请截取当前界面。
20. 截取屏幕当前状态。
21. 捕获当前屏幕画面。
22. 请执行截图。
23. 截图当前屏幕内容。
24. 执行屏幕捕获操作。
25. 请截取当前视图。
26. 截取当前屏幕图像。
27. 捕获当前界面。
28. 请截图当前窗口。
29. 截取当前屏幕状态。
30. 执行屏幕图像捕获。
31. 请截取当前屏幕内容。
32. 截图当前显示界面。
33. 捕获当前屏幕状态。
34. 请执行屏幕截图。
35. 截取当前屏幕画面。
36. 执行界面捕获。
37. 请截取当前屏幕图像。
38. 截图当前屏幕视图。
39. 捕获当前显示内容。
40. 请执行屏幕捕获。
41. 截取当前屏幕窗口。
42. 执行屏幕画面捕获。
43. 请截取当前显示界面。
44. 截图当前屏幕状态。
45. 捕获当前屏幕视图。
46. 请执行界面截图。
47. 截取当前屏幕内容。
48. 执行屏幕状态捕获。
49. 请截取当前屏幕画面。
50. 截图当前屏幕显示。

 80%|████████████████████████████████████████████████████████              | 4/5 [00:40<00:10, 10.19s/it]


1. 执行截图操作。
2. 请截图。
3. 进行屏幕截图。
4. 截取当前屏幕。
5. 捕获屏幕图像。
6. 截图当前界面。
7. 请截取屏幕。
8. 执行屏幕捕获。
9. 截取屏幕画面。
10. 拍摄屏幕截图。
11. 截图当前显示。
12. 请进行截图。
13. 捕获当前屏幕。
14. 截取当前视图。
15. 执行截图任务。
16. 截图当前窗口。
17. 请截取当前屏幕。
18. 捕获屏幕快照。
19. 截取屏幕内容。
20. 执行屏幕快照。
21. 请捕获屏幕。
22. 截图当前页面。
23. 捕获当前视图。
24. 截取屏幕影像。
25. 执行屏幕截图操作。
26. 请截取界面。
27. 捕获当前窗口。
28. 截图当前屏幕画面。
29. 请拍摄屏幕。
30. 捕获屏幕图像。
31. 截取当前屏幕内容。
32. 执行屏幕捕获操作。
33. 请截取当前视图。
34. 捕获屏幕画面。
35. 截图当前显示内容。
36. 请执行截图。
37. 捕获当前屏幕画面。
38. 截取屏幕快照。
39. 执行屏幕截图任务。
40. 请捕获当前屏幕。
41. 截图当前屏幕影像。
42. 捕获当前页面。
43. 截取屏幕显示。
44. 请截取当前窗口。
45. 捕获屏幕内容。
46. 截图当前屏幕视图。
47. 执行屏幕捕获任务。
48. 请拍摄当前屏幕。
49. 捕获屏幕快照。
50. 截取当前屏幕影像。

100%|██████████████████████████████████████████████████████████████████████| 5/5 [00:51<00:00, 10.34s/it]







In [6]:
text_list = [remove_number_dot(text) for text in result_text1.split()]
text_list = [text.strip() for text in text_list]
text_list = [text for text in text_list if len(text) > 0]
text_list = list(set(text_list))
print(f"初步生成的指令有：{len(text_list)}条")

初步生成的指令有：300条


In [7]:
text_list

['截个图保存一下。',
 '拍摄屏幕截图。',
 '执行屏幕捕获任务。',
 '捕获当前屏幕视图。',
 '帮我截个全屏的截图。',
 '能截个屏幕图给我吗？',
 '帮我截一下这个页面的屏幕图。',
 '帮我截个当前界面。',
 '请帮我截个当前页面的图。',
 '请截取当前显示界面。',
 '能不能截个图？',
 '帮我截个图，急用。',
 '帮我截个全屏。',
 '截个图，快点帮个忙。',
 '帮我截个当前页面的截图。',
 '快截个图。',
 '请截取屏幕瞬间。',
 '快速帮我截个图。',
 '帮我截个屏幕快照图。',
 '帮忙截个图，急急急。',
 '帮我截个屏幕的图片。',
 '截取当前视图。',
 '截图当前屏幕视图。',
 '帮我截个图，快点。',
 '截个图，麻烦了。',
 '能不能帮我截图一下？',
 '截个屏幕给我。',
 '捕获当前屏幕内容。',
 '截取屏幕画面。',
 '能截个屏幕图吗？',
 '执行截图任务。',
 '能帮我截个窗口的图吗？',
 '截个图，马上给我。',
 '帮我截个窗口的图。',
 '帮我截一下这个页面的图。',
 '捕获当前界面。',
 '截个图，谢谢！',
 '我需要截图，帮个忙。',
 '捕获当前屏幕画面。',
 '截取屏幕截图。',
 '帮我截个图，谢谢！',
 '能截个图给我吗？',
 '截个图给我看看。',
 '截个图，快点好吗？',
 '请截取屏幕画面。',
 '帮我截一下这个界面。',
 '帮我截个图，急用！',
 '截图当前窗口。',
 '截个图，麻烦你了。',
 '截个图，看一下。',
 '帮我截个全屏的图。',
 '执行屏幕内容捕获。',
 '捕获屏幕画面。',
 '请截取当前页面。',
 '执行屏幕画面捕获。',
 '帮我截个图呗。',
 '帮我截个图，拜托。',
 '帮我截个屏幕截图。',
 '快点截个图给我。',
 '请进行截图。',
 '执行屏幕捕获操作。',
 '帮我截个部分截图。',
 '快速帮我截个屏幕图。',
 '帮我截个屏幕快照看看。',
 '捕获当前显示内容。',
 '截个图，谢谢帮忙。',
 '帮我截个桌面截图。',
 '截个图，发到邮箱。',
 '我要截个图，帮一下。',
 '截个图，谢谢。',
 '请帮我截个桌面的图。',
 '捕获当前页面。',
 '截个图，麻烦一

In [8]:
data_list = [{"text": text} for text in text_list ]

In [9]:
len(data_list)

300

In [10]:
### 保存结果
import os
dataset_dir = "dataset"
if not os.path.exists(dataset_dir):
    os.mkdir(dataset_dir)

In [11]:
result_json_path = os.path.join(dataset_dir, "screenshot.json")
with open(result_json_path, "wt", encoding="utf-8") as f1:
    json.dump(data_list, f1, indent=4, ensure_ascii=False)