In [1]:
import os
import re
import json
from tqdm import tqdm, trange
from openai import OpenAI

In [2]:
client = OpenAI(
    base_url="https://open.bigmodel.cn/api/paas/v4/",
    api_key=os.environ["API_KEY"],
)

def stream_chat(prompt: str, system: str = "You are a helpful assistant.", show_log: bool = False):
    """
    流式对话，让你看到过程，然后将结果返回
    """
    messages = [{"role": "system", "content": system}]
    messages.append({"role": "user", "content": prompt})
    response = client.chat.completions.create(
        model="GLM-4-Plus",
        messages=messages,
        top_p=0.5,
        temperature=1,
        n=1,
        max_tokens=4096,
        stream=True,
    )
    response_text = ""
    for event in response:
        # print(event)
        event_text = event.choices[0].delta.content  # extract the text
        if event_text is None:
            event_text = ""
        response_text += event_text
        if show_log:
            print(event_text, end='', flush=True)
    if show_log:
        print("")
    return response_text

In [3]:
def remove_number_dot(text):
    # 正则表达式匹配以数字和点号开头的模式
    pattern = r'^\d+\.\s*'
    # 使用re.sub替换匹配到的内容为空字符串
    result = re.sub(pattern, '', text)
    return result

In [4]:
prompt1_1 = """
模拟用户对话。
生成一些打开或者关闭电脑摄像头的指令，大概50条左右。例如：1. 帮我打开摄像头 2. 帮我关掉摄像头
开启和关闭的对话尽量1：1，对话过程需要提到摄像头这个关键词。
并且对话语气需要模拟用户说话。
只返回生成后的结果，不要多余回答。生成内容尽量不要重复。
"""
prompt1_2 = """
生成一些打开或者关闭电脑摄像头的指令，大概50条左右。例如：1. 打开摄像头 2. 关闭摄像头
开启和关闭的对话尽量1：1，对话过程需要提到任务管理器这个关键词。
只返回生成后的结果，不要多余回答。生成内容尽量不要重复。
"""

In [5]:
result_text1 = ""
for i in trange(5):
    temp_text = stream_chat(prompt1_1, system="你是一个电脑助手", show_log=False)
    result_text1 += "\n" + temp_text
for i in trange(5):
    temp_text = stream_chat(prompt1_2, system="你是一个电脑助手", show_log=True)
    result_text1 += "\n" + temp_text

100%|██████████████████████████████████████████████████████████████████████| 5/5 [00:55<00:00, 11.09s/it]
  0%|                                                                              | 0/5 [00:00<?, ?it/s]

1. 打开摄像头
2. 关闭摄像头
3. 通过任务管理器打开摄像头
4. 使用任务管理器关闭摄像头
5. 启动摄像头功能
6. 停止摄像头功能
7. 在任务管理器中启用摄像头
8. 在任务管理器中禁用摄像头
9. 打开电脑摄像头
10. 关闭电脑摄像头
11. 任务管理器中打开摄像头进程
12. 任务管理器中结束摄像头进程
13. 启用摄像头设备
14. 禁用摄像头设备
15. 通过任务管理器启动摄像头
16. 通过任务管理器停止摄像头
17. 打开摄像头应用
18. 关闭摄像头应用
19. 任务管理器中激活摄像头
20. 任务管理器中关闭摄像头
21. 开启摄像头服务
22. 关闭摄像头服务
23. 在任务管理器中开启摄像头服务
24. 在任务管理器中关闭摄像头服务
25. 打开摄像头硬件
26. 关闭摄像头硬件
27. 任务管理器中启动摄像头硬件
28. 任务管理器中停止摄像头硬件
29. 启用摄像头功能
30. 禁用摄像头功能
31. 通过任务管理器启用摄像头
32. 通过任务管理器禁用摄像头
33. 打开摄像头设备
34. 关闭摄像头设备
35. 任务管理器中打开摄像头设备
36. 任务管理器中关闭摄像头设备
37. 启动摄像头进程
38. 结束摄像头进程
39. 在任务管理器中启动摄像头进程
40. 在任务管理器中结束摄像头进程
41. 打开摄像头驱动
42. 关闭摄像头驱动
43. 任务管理器中启用摄像头驱动
44. 任务管理器中禁用摄像头驱动
45. 启用摄像头模块
46. 禁用摄像头模块
47. 通过任务管理器启用摄像头模块
48. 通过任务管理器禁用摄像头模块
49. 打开摄像头接口
50. 关闭摄像头接口

 20%|██████████████                                                        | 1/5 [00:09<00:38,  9.59s/it]


1. 打开摄像头
2. 关闭摄像头
3. 请在任务管理器中开启摄像头
4. 通过任务管理器关闭摄像头
5. 启动摄像头功能
6. 停止摄像头运行
7. 在任务管理器里激活摄像头
8. 利用任务管理器禁用摄像头
9. 打开电脑的摄像头设备
10. 关闭电脑的摄像头设备
11. 任务管理器中找到摄像头并开启
12. 任务管理器中找到摄像头并关闭
13. 启用摄像头服务
14. 禁用摄像头服务
15. 打开摄像头进行视频通话
16. 关闭摄像头停止视频通话
17. 任务管理器里启动摄像头进程
18. 任务管理器里结束摄像头进程
19. 开启摄像头进行视频录制
20. 关闭摄像头停止视频录制
21. 请在任务管理器中打开摄像头
22. 请在任务管理器中关闭摄像头
23. 启动摄像头以进行直播
24. 关闭摄像头结束直播
25. 任务管理器中开启摄像头功能
26. 任务管理器中关闭摄像头功能
27. 打开摄像头进行远程会议
28. 关闭摄像头退出远程会议
29. 任务管理器里激活摄像头服务
30. 任务管理器里停止摄像头服务
31. 启用摄像头进行拍照
32. 禁用摄像头停止拍照
33. 打开摄像头进行面部识别
34. 关闭摄像头停止面部识别
35. 任务管理器中启动摄像头应用
36. 任务管理器中关闭摄像头应用
37. 开启摄像头进行视频监控
38. 关闭摄像头停止视频监控
39. 任务管理器里打开摄像头设备
40. 任务管理器里关闭摄像头设备
41. 启动摄像头进行视频聊天
42. 关闭摄像头结束视频聊天
43. 任务管理器中启用摄像头进程
44. 任务管理器中禁用摄像头进程
45. 打开摄像头进行视频会议
46. 关闭摄像头退出视频会议
47. 任务管理器里开启摄像头服务
48. 任务管理器里关闭摄像头服务
49. 启用摄像头进行视频录制
50. 禁用摄像头停止视频录制

 40%|████████████████████████████                                          | 2/5 [00:20<00:31, 10.54s/it]


1. 打开摄像头
2. 关闭摄像头
3. 请在任务管理器中启动摄像头
4. 通过任务管理器关闭摄像头
5. 打开摄像头功能
6. 关闭摄像头功能
7. 任务管理器中开启摄像头
8. 任务管理器中禁用摄像头
9. 启动电脑摄像头
10. 关闭电脑摄像头
11. 在任务管理器里打开摄像头
12. 在任务管理器里关闭摄像头
13. 打开摄像头设备
14. 关闭摄像头设备
15. 任务管理器启动摄像头服务
16. 任务管理器停止摄像头服务
17. 打开摄像头应用
18. 关闭摄像头应用
19. 任务管理器中激活摄像头
20. 任务管理器中停用摄像头
21. 打开摄像头驱动
22. 关闭摄像头驱动
23. 任务管理器中开启摄像头进程
24. 任务管理器中结束摄像头进程
25. 打开摄像头硬件
26. 关闭摄像头硬件
27. 任务管理器中恢复摄像头功能
28. 任务管理器中暂停摄像头功能
29. 打开摄像头软件
30. 关闭摄像头软件
31. 任务管理器中重启摄像头服务
32. 任务管理器中终止摄像头服务
33. 打开摄像头接口
34. 关闭摄像头接口
35. 任务管理器中查找并打开摄像头
36. 任务管理器中查找并关闭摄像头
37. 打开摄像头模块
38. 关闭摄像头模块
39. 任务管理器中启用摄像头设备
40. 任务管理器中禁用摄像头设备
41. 打开摄像头系统
42. 关闭摄像头系统
43. 任务管理器中监控摄像头状态并开启
44. 任务管理器中监控摄像头状态并关闭
45. 打开摄像头工具
46. 关闭摄像头工具
47. 任务管理器中刷新并打开摄像头
48. 任务管理器中刷新并关闭摄像头
49. 打开摄像头控制
50. 关闭摄像头控制

 60%|██████████████████████████████████████████                            | 3/5 [00:31<00:21, 10.54s/it]


1. 打开摄像头
2. 关闭摄像头
3. 在任务管理器中启动摄像头
4. 通过任务管理器关闭摄像头
5. 打开摄像头并检查任务管理器
6. 关闭摄像头并确认任务管理器
7. 任务管理器中打开摄像头进程
8. 任务管理器中结束摄像头进程
9. 启动摄像头并监控任务管理器
10. 关闭摄像头并刷新任务管理器
11. 打开摄像头，查看任务管理器状态
12. 关闭摄像头，检查任务管理器
13. 任务管理器中激活摄像头
14. 任务管理器中禁用摄像头
15. 打开摄像头，任务管理器确认
16. 关闭摄像头，任务管理器验证
17. 任务管理器中开启摄像头服务
18. 任务管理器中停止摄像头服务
19. 打开摄像头，任务管理器监控
20. 关闭摄像头，任务管理器更新
21. 任务管理器中启动摄像头应用
22. 任务管理器中关闭摄像头应用
23. 打开摄像头，任务管理器检查
24. 关闭摄像头，任务管理器确认
25. 任务管理器中恢复摄像头功能
26. 任务管理器中暂停摄像头功能
27. 打开摄像头，任务管理器验证
28. 关闭摄像头，任务管理器检查
29. 任务管理器中重启摄像头进程
30. 任务管理器中终止摄像头进程
31. 打开摄像头，任务管理器刷新
32. 关闭摄像头，任务管理器监控
33. 任务管理器中开启摄像头设备
34. 任务管理器中关闭摄像头设备
35. 打开摄像头，任务管理器确认状态
36. 关闭摄像头，任务管理器验证状态
37. 任务管理器中激活摄像头进程
38. 任务管理器中禁用摄像头进程
39. 打开摄像头，任务管理器检查进程
40. 关闭摄像头，任务管理器确认进程
41. 任务管理器中启动摄像头服务
42. 任务管理器中停止摄像头服务
43. 打开摄像头，任务管理器监控服务
44. 关闭摄像头，任务管理器更新服务
45. 任务管理器中恢复摄像头应用
46. 任务管理器中暂停摄像头应用
47. 打开摄像头，任务管理器验证应用
48. 关闭摄像头，任务管理器检查应用
49. 任务管理器中重启摄像头功能
50. 任务管理器中终止摄像头功能

 80%|████████████████████████████████████████████████████████              | 4/5 [00:43<00:10, 10.99s/it]


1. 打开摄像头
2. 关闭摄像头
3. 请在任务管理器中启动摄像头
4. 通过任务管理器关闭摄像头
5. 启用摄像头功能
6. 禁用摄像头功能
7. 在任务管理器中找到摄像头并打开
8. 在任务管理器中结束摄像头进程
9. 打开摄像头设备
10. 关闭摄像头设备
11. 任务管理器中开启摄像头服务
12. 任务管理器中停止摄像头服务
13. 激活摄像头
14. 关闭摄像头应用
15. 任务管理器里启动摄像头进程
16. 任务管理器里终止摄像头进程
17. 打开摄像头以进行视频通话
18. 关闭摄像头以保护隐私
19. 任务管理器中恢复摄像头运行
20. 任务管理器中暂停摄像头运行
21. 启动摄像头进行录制
22. 关闭摄像头停止录制
23. 任务管理器中查找并打开摄像头
24. 任务管理器中关闭摄像头程序
25. 打开摄像头进行视频会议
26. 关闭摄像头结束视频会议
27. 任务管理器中重启摄像头服务
28. 任务管理器中关闭摄像头服务
29. 打开摄像头进行直播
30. 关闭摄像头结束直播
31. 任务管理器中激活摄像头功能
32. 任务管理器中禁用摄像头功能
33. 打开摄像头进行拍照
34. 关闭摄像头停止拍照
35. 任务管理器中开启摄像头设备
36. 任务管理器中关闭摄像头设备
37. 启动摄像头进行监控
38. 关闭摄像头停止监控
39. 任务管理器中查找摄像头并启动
40. 任务管理器中查找摄像头并关闭
41. 打开摄像头进行视频录制
42. 关闭摄像头停止视频录制
43. 任务管理器中恢复摄像头功能
44. 任务管理器中暂停摄像头功能
45. 启用摄像头进行远程会议
46. 禁用摄像头结束远程会议
47. 任务管理器中启动摄像头应用
48. 任务管理器中关闭摄像头应用
49. 打开摄像头进行视频聊天
50. 关闭摄像头结束视频聊天

100%|██████████████████████████████████████████████████████████████████████| 5/5 [00:54<00:00, 10.93s/it]







In [6]:
text_list1 = [remove_number_dot(text) for text in result_text1.split()]
text_list1 = [text.strip() for text in text_list1]
text_list1 = [text for text in text_list1 if len(text) > 0]
text_list1 = list(set(text_list1))
print(f"初步生成的指令有：{len(text_list1)}条")

初步生成的指令有：347条


In [7]:
text_list1

['打开摄像头，我要扫描。',
 '请帮忙关闭摄像头。',
 '打开摄像头，任务管理器刷新',
 '任务管理器中监控摄像头状态并开启',
 '任务管理器中恢复摄像头运行',
 '把摄像头关上，我不用了。',
 '摄像头可以关了吗？',
 '任务管理器中终止摄像头功能',
 '关掉摄像头，直播结束了。',
 '打开摄像头，任务管理器监控',
 '关闭摄像头，任务管理器检查应用',
 '通过任务管理器打开摄像头',
 '在任务管理器中找到摄像头并打开',
 '启动摄像头功能',
 '任务管理器中暂停摄像头应用',
 '我想用摄像头，打开一下。',
 '关闭摄像头，检查任务管理器',
 '关闭摄像头结束视频会议',
 '任务管理器里结束摄像头进程',
 '禁用摄像头结束远程会议',
 '任务管理器中监控摄像头状态并关闭',
 '关闭摄像头，请帮忙。',
 '关闭摄像头，我不用了。',
 '帮我关闭一下摄像头。',
 '关闭摄像头以保护隐私',
 '我要使用摄像头，打开。',
 '快点关闭摄像头。',
 '关闭摄像头并刷新任务管理器',
 '帮我关一下摄像头。',
 '把摄像头关闭，谢谢。',
 '启用摄像头设备',
 '启用摄像头功能',
 '关闭摄像头退出视频会议',
 '任务管理器中关闭摄像头功能',
 '任务管理器中启动摄像头硬件',
 '任务管理器中终止摄像头服务',
 '能打开摄像头吗？我要用。',
 '能帮我关闭摄像头吗？',
 '帮我打开一下摄像头。',
 '关闭摄像头并确认任务管理器',
 '帮我打开摄像头，谢谢。',
 '能帮我开摄像头吗？',
 '请把摄像头关上，谢谢。',
 '打开摄像头接口',
 '关闭摄像头，任务管理器确认进程',
 '请帮我关闭摄像头。',
 '我需要开启摄像头。',
 '打开摄像头，我要录视频。',
 '任务管理器里打开摄像头设备',
 '通过任务管理器禁用摄像头模块',
 '帮我关闭摄像头，谢谢。',
 '帮我开启摄像头功能。',
 '关闭摄像头停止监控',
 '关闭摄像头，任务管理器确认',
 '任务管理器停止摄像头服务',
 '打开摄像头进行拍照',
 '我要视频会议，打开摄像头。',
 '帮我关闭摄像头。',
 '请关掉摄像头，谢谢。',
 '请帮忙打开摄像头。',
 '帮我打开一下摄像头，谢谢。',
 '在任务管理器

In [8]:
text_list = text_list1

### 需要一个标注工人
- 帮我完成对应的实体标注，实体类别，开始位置，结束位置，原文字段

In [9]:
prompt3_1 = """
请帮我对下面提供的数据做实体标注，要求标注它的实体类型。
实体类别有两种，分别是`On`和`Off`
下面是一些例子：
这里我提供两个样本：
```text
关闭摄像头
打开摄像头
```
标注结果参考
```json
[
    {
        "text": "关闭摄像头",
        "entity": {"type": "Off", "raw": "关闭"}
    },
    {
        "text": "打开摄像头",
        "entity": {"type": "On", "raw": "打开"}
    }
]
```
"""

In [10]:
def find_entity(text, raw):
    s = text.rfind(raw)
    e = s + len(raw)
    return (s, e)

In [11]:
find_entity("将音量调至10%", "调至10%")

(3, 8)

In [12]:
def label_text(text: str):
    prompt3_2 = f"""
    下面是我提供给你的句子，请直接返回标注结果，不要多余返回。
    注意：生成的json必须合乎json语法规范，不要有多余空格
    ```text
    {text}
    ```
    """
    prompt3 = prompt3_1 + prompt3_2
    result_text = stream_chat(prompt3, system="你是一个标注员")
    response = result_text
    if result_text.startswith("```json"):
        result_text = result_text.lstrip("```json")
    if result_text.endswith("```"):
        result_text = result_text.rstrip("```")
    try:
        result_data = json.loads(result_text)
        data_list = []
        for data in result_data:
            start, end = find_entity(data["text"], data["entity"]["raw"])
            data["entity"]["start"] = start
            data["entity"]["end"] = end
            data_list.append(data)
    except:
        print("标注异常")
        print("text: ", text)
        print("response: ", response)
        data_list = []
    return data_list

In [13]:
data_list = []
for text in tqdm(text_list):
    temp_list = label_text(text)
    data_list.extend(temp_list)

100%|██████████████████████████████████████████████████████████████████| 347/347 [07:09<00:00,  1.24s/it]


In [14]:
len(data_list)

347

In [15]:
### 保存结果
import os
dataset_dir = "dataset"
if not os.path.exists(dataset_dir):
    os.mkdir(dataset_dir)

In [16]:
result_json_path = os.path.join(dataset_dir, "camera.json")
with open(result_json_path, "wt", encoding="utf-8") as f1:
    json.dump(data_list, f1, indent=4, ensure_ascii=False)