In [1]:
import sys
import os

from neomodel import StructuredNode, StringProperty, RelationshipTo, config, db

import json
import jieba
import requests


config.DATABASE_URL = "bolt://neo4j:88888888@localhost:7687"


# 初始化实体识别字典
def init_entity_dict():
    # 从 dict.txt 加载自定义实体词典，每行包括实体及其类型，用制表符 \t 分隔。
    # 将实体名动态添加到 jieba 的分词词典中，便于分词时识别特定领域的实体。
    dict_path = "novel.txt"
    word_dict = [
        i.strip("\n") for i in open(dict_path, "r", encoding="utf-8").readlines()
    ]
    # print(word_dict)

    # 实体名称映射到实体类型
    entity2type = {}
    for word in word_dict:
        tmp_list = word.split("\t")
        # print(tmp_list)
        if len(tmp_list) == 2:
            # 将词典添加到jieba分词的自定义词典中
            jieba.add_word(tmp_list[0])
            entity2type[tmp_list[0]] = tmp_list[1]
    return entity2type


entity2type = init_entity_dict()
# print(entity2type)


# 通过自定义词典获取实体
def get_enyity(input_str):
    word_cut_dict = []
    # 对用户问句进行分词
    for word in jieba.cut(input_str.strip()):
        if word in entity2type:
            # print(word)
            word_cut_dict.append(word)
    return list(set(word_cut_dict))


# 提示词模板
PROMPT_TEMPLATE = """已知信息：
{context} 
根据上面提供的三元组信息，简洁和专业的来回答用户的问题。如果无法从中得到答案，请你根据你的理解回答用户问题。问题是：{question}"""


PROMPT_TEMPLATE1 = """请你用你的已有知识，简洁和专业的来回答用户的问题。如果无法从中得到答案，请你根据你的理解回答用户问题。问题是：{question}"""


# 获取提示词模板
def get_prompt(question, context):
    # 如果问题和neo4j查询到的上下文都不为空，则拼接出一个提示词，提交给大模型
    if len(question) and len(context) > 0:

        return PROMPT_TEMPLATE.format(context=context, question=question)
    # 如果neo4j查询到的数据为空，则提交问题给大模型
    else:
        return PROMPT_TEMPLATE1.format(question=question)


# 从neo4j查询三元组
def search_entity_from_neo4j(question, entities):
    triplet_list = []
    if not entities:
        return get_prompt(question=question, context="")

    # 查询三元组
    query = """
    MATCH (a:Entity)-[r]->(b:Entity)
    WHERE a.name IN $entity_names
    RETURN a.name AS start_node, type(r) AS relation, b.name AS end_node
    """
    params = {"entity_names": entities}
    results, meta = db.cypher_query(query, params)

    for start_node, relation, end_node in results:
        triplet_list.append(f"({start_node},{relation},{end_node})")

    triplet_list = list(set(triplet_list))  # 去重
    return get_prompt(question=question, context="\n".join(triplet_list)[:4096])

Building prefix dict from the default dictionary ...
Loading model from cache C:\Users\Lenovo\AppData\Local\Temp\jieba.cache
Loading model cost 0.407 seconds.
Prefix dict has been built successfully.


In [2]:
from openai import OpenAI


def chat_with_gpt(prompt):
    response = client.chat.completions.create(
        messages=[
            {"role": "system", "content": "You are a helpful assistant."},
            {"role": "user", "content": prompt},
        ],
        model="qwen-max",
    )
    return response.choices[0].message.content


# 单次问答尝试
def get_answer(input_str):
    input_str = input_str.replace(" ", "").strip()
    # 预测实体
    entitys = get_enyity(input_str)
    print(entitys)
    # 如果识别到实体
    if entitys:
        # 先查询实体相关的三元组，并拼接出提示词
        prompt = search_entity_from_neo4j(input_str, entitys)
        print(prompt)
        # 从大模型获取答案
        # 替换prompt的字符串，与GPT完成单次对话
        response = chat_with_gpt(prompt)
        print(response)
        return response
    else:
        print("未识别到实体，直接提交问题给大模型")
        prompt = PROMPT_TEMPLATE1.format(question=input_str)
        response = chat_with_gpt(prompt)
        print(response)
        return response

In [3]:
# 设置API
api_key = "sk-53b7201e936b457d8802a9f5ca3605b4"
base_url = "https://dashscope.aliyuncs.com/compatible-mode/v1"
os.environ["OPENAI_API_KEY"] = api_key
client = OpenAI(api_key=api_key, base_url=base_url)

# 单次对话尝试
# input_str = input("请输入一些文字: ")
# get_answer(input_str)

## 尝试多轮对话

In [None]:
class InteractiveChat:
    def __init__(self, client):
        self.client = client
        self.messages = [{"role": "system", "content": "You are a helpful assistant."}]

    def chat(self, input_str):
        input_str = input_str.replace(" ", "").strip()
        entitys = get_enyity(input_str)
        print("Entities:", entitys)

        if entitys:
            prompt = search_entity_from_neo4j(input_str, entitys)
            print(prompt)
        else:
            print("未识别到实体，直接提交问题给大模型")
            print(prompt)
            prompt = PROMPT_TEMPLATE1.format(question=input_str)

        self.messages.append({"role": "user", "content": prompt})
        response = self.client.chat.completions.create(
            messages=self.messages,
            model="qwen-max",
        )
        # print("response: ", response)
        return response

    def clear_history(self):
        self.messages = [{"role": "system", "content": "You are a helpful assistant."}]

In [None]:
# 启动交互式对话
print(
    "Chat with GPT. Type 'exit' to end the conversation. Type 'clear' to refresh chat history"
)
interactive_chat = InteractiveChat(client)
while True:
    input_str = input("请输入一些文字: ")
    if input_str.lower() == "exit":
        break
    if input_str.lower() == "clear":
        interactive_chat.clear_history()
        print("消息记录已清除.")
        continue
    response = interactive_chat.chat(input_str)
    print(f"GPT: {response}")

Chat with GPT. Type 'exit' to end the conversation. Type 'clear' to refresh chat history
Entities: ['贾宝玉']




请你用你的已有知识，简洁和专业的来回答用户的问题。如果无法从中得到答案，请你根据你的理解回答用户问题。问题是：贾宝玉的母亲是？
response:
 ChatCompletion(id='chatcmpl-a919eb5f-4995-92bf-821e-a61f71356599', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='贾宝玉的母亲是王夫人。在《红楼梦》中，王夫人是贾政的妻子，贾宝玉的生母。', refusal=None, role='assistant', audio=None, function_call=None, tool_calls=None))], created=1734194305, model='qwen-max', object='chat.completion', service_tier=None, system_fingerprint=None, usage=CompletionUsage(completion_tokens=26, prompt_tokens=54, total_tokens=80, completion_tokens_details=None, prompt_tokens_details=None))
GPT: ChatCompletion(id='chatcmpl-a919eb5f-4995-92bf-821e-a61f71356599', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='贾宝玉的母亲是王夫人。在《红楼梦》中，王夫人是贾政的妻子，贾宝玉的生母。', refusal=None, role='assistant', audio=None, function_call=None, tool_calls=None))], created=1734194305, model='qwen-max', object='chat.completion', service_tier=None, system_



Entities: ['贾宝玉', '林黛玉']
请你用你的已有知识，简洁和专业的来回答用户的问题。如果无法从中得到答案，请你根据你的理解回答用户问题。问题是：贾宝玉和林黛玉的关系是？
response:
 ChatCompletion(id='chatcmpl-ca7979a9-7b00-9f14-8496-51f0a319e972', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='贾宝玉的母亲是王夫人。\n\n贾宝玉和林黛玉的关系是表兄妹，同时他们也是《红楼梦》中的主要人物之一，彼此之间有着深厚的感情。在小说中，他们的关系还被描绘为一种超越了普通亲戚之情的情感纽带。', refusal=None, role='assistant', audio=None, function_call=None, tool_calls=None))], created=1734194348, model='qwen-max', object='chat.completion', service_tier=None, system_fingerprint=None, usage=CompletionUsage(completion_tokens=55, prompt_tokens=93, total_tokens=148, completion_tokens_details=None, prompt_tokens_details=None))
GPT: ChatCompletion(id='chatcmpl-ca7979a9-7b00-9f14-8496-51f0a319e972', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='贾宝玉的母亲是王夫人。\n\n贾宝玉和林黛玉的关系是表兄妹，同时他们也是《红楼梦》中的主要人物之一，彼此之间有着深厚的感情。在小说中，他们的关系还被描绘为一种超越了普通亲戚之情的情感纽带。', refusal=None, role='assistan

## 改为用 Langchain 实现

In [4]:
from langchain.chat_models import ChatOpenAI
from langchain_core.output_parsers import StrOutputParser

In [5]:
class InteractiveChat:
    def __init__(self, model):
        self.model = model
        self.messages = [{"role": "system", "content": "You are a helpful assistant."}]

    def chat(self, input_str):
        input_str = input_str.replace(" ", "").strip()
        entitys = get_enyity(input_str)
        print("识别到的实体: ", entitys)

        if entitys:
            prompt = search_entity_from_neo4j(input_str, entitys)
        else:
            print("未识别到实体，直接提交问题给大模型")
            prompt = PROMPT_TEMPLATE1.format(question=input_str)

        print("提示词:", prompt)
        chain = self.model | StrOutputParser()
        response = chain.invoke(prompt)
        self.messages.append({"role": "user", "content": prompt})
        self.messages.append({"role": "assistant", "content": response})
        print("消息记录: ", self.messages)
        return response

    def clear_history(self):
        self.messages = [{"role": "system", "content": "You are a helpful assistant."}]

In [None]:
llm = ChatOpenAI(api_key=api_key, base_url=base_url, model_name="qwen-max")

# 启动交互式对话
print(
    "Chat with GPT. Type 'exit' to end the conversation. Type 'clear' to refresh chat history"
)
interactive_chat = InteractiveChat(llm)
while True:
    input_str = input("请输入一些文字: ")
    if input_str.lower() == "exit":
        break
    if input_str.lower() == "clear":
        interactive_chat.clear_history()
        print("消息记录已清除.")
        continue
    response = interactive_chat.chat(input_str)
    print(f"GPT: {response}")

  llm = ChatOpenAI(api_key=api_key, base_url=base_url, model_name="qwen-max")


Chat with GPT. Type 'exit' to end the conversation. Type 'clear' to refresh chat history
识别到的实体:  ['贾宝玉']




提示词: 请你用你的已有知识，简洁和专业的来回答用户的问题。如果无法从中得到答案，请你根据你的理解回答用户问题。问题是：贾宝玉的母亲是？
消息记录:  [{'role': 'system', 'content': 'You are a helpful assistant.'}, {'role': 'user', 'content': '请你用你的已有知识，简洁和专业的来回答用户的问题。如果无法从中得到答案，请你根据你的理解回答用户问题。问题是：贾宝玉的母亲是？'}, {'role': 'assistant', 'content': '贾宝玉的母亲是王夫人。在《红楼梦》中，王夫人是贾政的妻子，也是贾宝玉的生母。'}]
GPT: 贾宝玉的母亲是王夫人。在《红楼梦》中，王夫人是贾政的妻子，也是贾宝玉的生母。




识别到的实体:  ['贾宝玉', '林黛玉']
提示词: 请你用你的已有知识，简洁和专业的来回答用户的问题。如果无法从中得到答案，请你根据你的理解回答用户问题。问题是：贾宝玉和林黛玉的关系是？
消息记录:  [{'role': 'system', 'content': 'You are a helpful assistant.'}, {'role': 'user', 'content': '请你用你的已有知识，简洁和专业的来回答用户的问题。如果无法从中得到答案，请你根据你的理解回答用户问题。问题是：贾宝玉的母亲是？'}, {'role': 'assistant', 'content': '贾宝玉的母亲是王夫人。在《红楼梦》中，王夫人是贾政的妻子，也是贾宝玉的生母。'}, {'role': 'user', 'content': '请你用你的已有知识，简洁和专业的来回答用户的问题。如果无法从中得到答案，请你根据你的理解回答用户问题。问题是：贾宝玉和林黛玉的关系是？'}, {'role': 'assistant', 'content': '贾宝玉和林黛玉是中国古典文学名著《红楼梦》中的主要人物。在小说中，他们之间有着深厚的感情，可以被描述为一种超越普通友情的亲密关系。两人自幼一起长大，情投意合，彼此间存在着浓厚的爱情成分。不过，在整个故事里，由于种种原因（包括家族利益、社会规范等），他们的感情最终没有得到圆满的结果。简而言之，《红楼梦》描绘了贾宝玉与林黛玉之间复杂而深刻的情感纽带。'}]
GPT: 贾宝玉和林黛玉是中国古典文学名著《红楼梦》中的主要人物。在小说中，他们之间有着深厚的感情，可以被描述为一种超越普通友情的亲密关系。两人自幼一起长大，情投意合，彼此间存在着浓厚的爱情成分。不过，在整个故事里，由于种种原因（包括家族利益、社会规范等），他们的感情最终没有得到圆满的结果。简而言之，《红楼梦》描绘了贾宝玉与林黛玉之间复杂而深刻的情感纽带。
