# 知识库/智能客服 代码实现
- 先安装包依赖

In [None]:
pip install openai chromadb==0.4.17

In [None]:
import openai

api_key = "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"
embedding_model = "text-embedding-ada-002"
chat_model = "gpt-3.5-turbo-1106"

# 与GPT交互的上下文
messages = []
client = openai.OpenAI(api_key=api_key)


# 用于定义知识库相关内容

In [None]:
from chromadb.utils.embedding_functions import OpenAIEmbeddingFunction
import chromadb
import openai

# 使用OpenAI Embedding的模型定义，ada-002是目前支持中文最好的模型

# 创建数据库
vector_db = chromadb.PersistentClient(path="./").get_or_create_collection(
    name='knowledge_db',
    embedding_function=OpenAIEmbeddingFunction(
        api_key=api_key,
        model_name=embedding_model,
    ),
)

# 测试数据
test_dataset = [
    {
        "id": 1001,
        "text": "公司上班时间，上午: 09:00 - 12:00，下午: 14:00 - 19:00",
    },
    {
        "id": 1002,
        "text": "公司请假流程：直属leader审批通过即可，请假一次不能超过10天",
    }
]

# 做embedding
embedding_input = []
for one in test_dataset:
  embedding_input.append(one["text"])

embeddings = client.embeddings.create(
    model="text-embedding-ada-002",
    input=embedding_input,
)

#存储到向量数据库中
insert_ids = []
insert_orgin_data = []
insert_embedding_data = []

for i in range(len(test_dataset)):
  insert_ids.append(str(test_dataset[i]["id"]))
  insert_orgin_data.append(test_dataset[i]["text"])
  insert_embedding_data.append(embeddings.data[0].embedding)


vector_db.add(ids=insert_ids, embeddings=insert_embedding_data, documents=insert_orgin_data)



# 用于定义核心主流程所需要的方法

In [None]:
import openai
import json
import copy

'''
用于分析用户的语义
比如
Q: 周杰伦是谁？
A: 周杰伦是著名歌手
Q: 他多大了？  ----- 这里的实际语义是：周杰伦多大了
'''
def analyze_semantics(user_prompt):
    # 对原始的上下文进行copy
    summarize_messages = copy.deepcopy(messages)

    # 放入语义分析prompt
    summarize_messages.append({
        "role":"user",
        "content": f"基于上下文，总结'''{user_prompt}'''这句话的真正问题是什么"
    })

    chat_completion = client.chat.completions.create(
        messages=summarize_messages,
        model=chat_model,
        temperature=0.2,
        stream=False
    )

    return chat_completion.choices[0].message.content


# 获取定义tools的结构
def get_tools():
    return [{
        "type": "function",
        "function": {
            "name": "tool_get_order",
            "description": "记录用户反馈的建议/意见",
            "parameters": {
                "type": "object",
                "properties": {
                    "order_id": {
                        "type": "string",
                        "description": "订单ID"
                    },
                },
                "required": ["order_id"]
            }
        }
    },{
        "type": "function",
        "function": {
            "name": "tool_record_sug",
            "description": "记录用户反馈的建议/意见",
            "parameters": {
                "type": "object",
                "properties": {
                    "sug": {
                        "type": "string",
                        "description": "用户建议/意见"
                    },
                },
                "required": ["sug"]
            }
        }
    }]

# 工具类，用于获取订单id，实际场景中可以从数据库/订单服务获取信息
def tool_get_order(order_id):
    print(order_id)
    return {
        "订单状态": "发货了",
        "订单价格": "10元",
    }

# 工具类，用于记录用户建议/意见，实际场景中可以插入数据库或多微服务进行处理
def tool_record_sug(sug):
    print(sug)
    return True


# 与GPT进行交互，并完成相关Tool的交互
def chat_with_gpt(user_prompt):
    chat_messages = copy.deepcopy(messages)
    chat_messages.append({
        "role" : "user",
        "content" : user_prompt
    })

    chat_completion = client.chat.completions.create(
        messages=chat_messages,
        model=chat_model,
        temperature=0.2,
        tools = get_tools(),
        tool_choice="auto",
        stream=False
    )

    response = chat_completion.choices[0].message

    # 处理Tool相关流程
    if response.tool_calls:
        chat_messages.append(response)

        for tool_call in response.tool_calls:
            func_name = tool_call.function.name
            func_args = json.loads(tool_call.function.arguments)
            func_response = ""

            if func_name == "tool_get_order":
                func_response = json.dumps(tool_get_order(order_id=func_args.get("order_id")))
            elif func_name == "tool_record_sug":
                func_response = json.dumps(tool_record_sug(sug=func_args.get("sug")))

            chat_messages.append({
                    "tool_call_id": tool_call.id,
                    "role": "tool",
                    "name": func_name,
                    "content": func_response,
            })


        second_chat_completion = client.chat.completions.create(
            model=chat_model,
            messages=chat_messages,
            temperature=0.2,
            stream=False
        )

        return second_chat_completion.choices[0].message
    else:
        return response


# 核心主流程实现

In [None]:
def core_flow(user_prompt):
    # 分析用户的语义
    user_semantics_prompt = analyze_semantics(user_prompt)

    # 查询向量数据库
    knowledge = vector_db.query(query_texts=user_semantics_prompt, n_results=1, include=['distances', 'documents'])

    response = chat_with_gpt(f"参考'''{knowledge}'''，回答'''{user_semantics_prompt}'''，如果不在参考范围内请回答不知道")

    # 将用户跟系统的答复记录到上下文中
    messages.append({
        "role" : "user",
        "content": user_prompt,
    })

    messages.append({
        "role": response.role,
        "content": response.content,
    })

    return response.content


# 模拟用户多次会话
print("-----------1-----------")
print(core_flow("公司的出勤政策是什么"))
print("-----------2-----------")
print(messages)


-----------1-----------
用户提供的参考内容与问题不匹配。
抱歉，我无法回答这个问题，因为提供的参考内容与您的问题不匹配。
-----------2-----------
[{'role': 'user', 'content': '公司的出勤政策是什么'}, {'role': 'assistant', 'content': '这句话的真正问题是关于公司的出勤政策的具体内容和规定是什么。'}, {'role': 'user', 'content': '公司的出勤政策是什么'}, {'role': 'assistant', 'content': '基于上下文，这句话的真正问题是关于公司的出勤政策的具体内容和规定是什么。'}, {'role': 'user', 'content': '公司的出勤政策是什么'}, {'role': 'assistant', 'content': '根据上下文，这句话的真正问题是要求了解公司的出勤政策的具体内容和规定。'}, {'role': 'user', 'content': '公司的出勤政策是什么'}, {'role': 'assistant', 'content': '这句话的真正问题是要求了解公司的出勤政策的具体内容和规定。'}, {'role': 'user', 'content': '公司的出勤政策是什么'}, {'role': 'assistant', 'content': '抱歉，我无法回答这个问题，因为提供的参考内容与您的问题不匹配。'}]
