In [2]:
import sys
sys.path.append("../")

from zhipuai_embedding import ZhipuAIEmbeddings

from langchain.vectorstores.chroma import Chroma
from langchain_openai import ChatOpenAI
import os

zhipuai_api_key = os.environ['ZHIPUAI_API_KEY']
OPENAI_API_KEY = os.environ["OPENAI_API_KEY"]

embedding = ZhipuAIEmbeddings()

persist_directory = '../data_base/vector_db/chroma'

vectordb = Chroma(
    persist_directory=persist_directory,  
    embedding_function=embedding
)

llm = ChatOpenAI(model_name = "gpt-3.5-turbo", temperature = 0,openai_api_key=os.environ['OPENAI_API_KEY'],openai_api_base=os.environ['BASE_URL'])

In [3]:
from langchain.prompts import PromptTemplate
from langchain.chains import RetrievalQA

template_v1 = """使用以下上下文来回答最后的问题。如果你不知道答案，就说你不知道，不要试图编造答
案。最多使用三句话。尽量使答案简明扼要。总是在回答的最后说“谢谢你的提问！”。
{context}
问题: {question}
"""

QA_CHAIN_PROMPT = PromptTemplate(input_variables=["context","question"],
                                 template=template_v1)

qa_chain = RetrievalQA.from_chain_type(llm,
                                       retriever=vectordb.as_retriever(),
                                       return_source_documents=True,
                                       chain_type_kwargs={"prompt":QA_CHAIN_PROMPT})



In [4]:
question = "什么是南瓜书"
result = qa_chain({"query": question})
print(result["result"])


  result = qa_chain({"query": question})


南瓜书是一本解析《机器学习》（西瓜书）中难以理解公式的书籍。
谢谢你的提问！


In [6]:
template_v2 = """使用以下上下文来回答最后的问题。如果你不知道答案，就说你不知道，不要试图编造答
案。你应该使答案尽可能详细具体，但不要偏题。如果答案比较长，请酌情进行分段，以提高答案的阅读体验。
{context}
问题: {question}
有用的回答:"""

QA_CHAIN_PROMPT = PromptTemplate(input_variables=["context","question"],
                                 template=template_v2)
qa_chain = RetrievalQA.from_chain_type(llm,
                                       retriever=vectordb.as_retriever(),
                                       return_source_documents=True,
                                       chain_type_kwargs={"prompt":QA_CHAIN_PROMPT})

question = "什么是南瓜书"
result = qa_chain({"query": question})
print(result["result"])


南瓜书是一本机器学习领域的补充教材，旨在对《机器学习》（西瓜书）中难以理解的公式进行解析，并补充推导细节。它的内容是以西瓜书的内容为基础，提供了更详细的数学推导和解释，帮助读者更好地理解和掌握机器学习算法原理。在阅读南瓜书时，最佳的使用方法是将西瓜书作为主线，遇到推导困难或理解不清的公式时再来查阅南瓜书，以加深对机器学习理论的理解。


In [7]:
question = "使用大模型时，构造 Prompt 的原则有哪些"
result = qa_chain({"query": question})
print(result["result"])


构造 Prompt 时，使用大模型时的原则主要包括以下几点：

1. 确定明确的目标和任务：在构造 Prompt 时，需要明确定义任务的目标和内容，确保 Prompt 能够准确引导模型产生预期的输出。

2. 简洁明了的提示信息：Prompt 应该简洁明了，包含足够的关键信息，但不要过于复杂或含糊，以避免模型产生错误的理解或输出。

3. 规范化 Prompt 结构：在构造 Prompt 时，最好使用规范化的结构和语法，以便模型能够更好地理解和处理输入的信息。

4. 考虑语境和背景知识：根据任务的语境和需要的背景知识，设计相应的 Prompt，以提高模型对输入信息的理解和处理能力。

总之，构造 Prompt 时应该确保其清晰、简洁、规范化，并考虑任务的要求和背景知识，以帮助模型准确理解并产生正确的输出。


In [8]:
template_v3 = """使用以下上下文来回答最后的问题。如果你不知道答案，就说你不知道，不要试图编造答
案。你应该使答案尽可能详细具体，但不要偏题。如果答案比较长，请酌情进行分段，以提高答案的阅读体验。
如果答案有几点，你应该分点标号回答，让答案清晰具体
{context}
问题: {question}
有用的回答:"""

QA_CHAIN_PROMPT = PromptTemplate(input_variables=["context","question"],
                                 template=template_v3)
qa_chain = RetrievalQA.from_chain_type(llm,
                                       retriever=vectordb.as_retriever(),
                                       return_source_documents=True,
                                       chain_type_kwargs={"prompt":QA_CHAIN_PROMPT})

question = "使用大模型时，构造 Prompt 的原则有哪些"
result = qa_chain({"query": question})
print(result["result"])

对于问题使用大模型时构造Prompt的原则，可以参考以下几点原则：

1. 简洁明了：Prompt应该是简洁明了的，能够清晰地指导模型进行任务的解决，避免出现歧义或多余信息。
   
2. 相关性：Prompt应该与任务或问题直接相关，能够帮助模型理解并正确解决任务，不应包含无关或冗余信息。
   
3. 信息量：Prompt应该包含足够的信息量，能够准确指导模型完成任务，同时不应过于复杂或繁琐，以免混淆模型。
   
4. 正向引导：Prompt应该以正向的方式引导模型进行任务解决，避免模糊或否定性的表达，以提高模型理解和学习效果。

以上是构造Prompt时可以考虑的一些原则，通过合理设计Prompt可以有效提高模型的学习和表现效果。如果想要进一步了解构造Prompt的方法和技巧，可以参考相关的文献和实践经验。


In [10]:
#标明知识来源，提高可信度

#大模型存在幻觉问题，有时回答并非源于知识库内容，例如
question = "强化学习的定义是什么"
result = qa_chain({"query": question})
print(result["result"])


强化学习是一种机器学习的范式，其目标是通过代理与环境的交互来学习最优决策策略。在强化学习中，代理根据环境的反馈，通过试错的方式来学习如何采取行动以最大化累积奖励。强化学习与监督学习和无监督学习不同，它更注重在不断与环境的交互中学习并提升策略。强化学习通常涉及一个状态空间、一个动作空间、一个奖励信号和一个学习策略。

在强化学习中，一个关键概念是马尔可夫决策过程（MDP），它是一个描述强化学习环境的数学框架。MDP包括状态空间、动作空间、转移概率、奖励函数和折扣因子等要素。代理根据当前状态选择动作，并且根据环境的反馈获得奖励，学习如何在不同状态下选择最优的动作。强化学习的目标是找到一个最优策略，使得代理在长期累积奖励最大化。

在实际应用中，强化学习被广泛应用于许多领域，如游戏、机器人控制、金融交易等。通过强化学习，代理可以在复杂的环境中学习并逐渐改进策略，实现自主决策和优化目标。强化学习是机器智能领域的一个重要研究方向，为实现人工智能的智能体提供了强大的学习方法。


In [16]:
template_v4 = """使用以下上下文来回答最后的问题。如果你不知道答案，就说你不知道，不要试图编造答
案。你应该使答案尽可能详细具体，但不要偏题。如果答案比较长，请酌情进行分段，以提高答案的阅读体验。
如果答案有几点，你应该分点标号回答，让答案清晰具体。
请你附上回答的来源原文，以保证回答的正确性。
{context}
问题: {question}
有用的回答:"""

QA_CHAIN_PROMPT = PromptTemplate(input_variables=["context","question"],
                                 template=template_v4)
qa_chain = RetrievalQA.from_chain_type(llm,
                                       retriever=vectordb.as_retriever(),
                                       return_source_documents=True,
                                       chain_type_kwargs={"prompt":QA_CHAIN_PROMPT})

question = "强化学习的定义是什么"
result = qa_chain({"query": question})
print(result["result"])

强化学习是一种机器学习方法，其目标是通过与环境的交互来学习如何做出决策，以使某种累积奖励最大化。在强化学习中，代理根据环境的状态采取行动，并根据行动后获得的奖励来调整行为策略。强化学习与监督学习和无监督学习相比，更注重通过试错来学习最优决策。

来源：南瓜书，第3章，3.6小节。


In [17]:
#构造思维链
question = "我们应该如何去构造一个LLM项目"
result = qa_chain({"query": question})
print(result["result"])

根据提供的上下文信息来看，提到了模型评估与选择的内容，包括经验误差和过拟合、评估方法、性能度量等。而具体到构造一个LLM项目的内容并没有在给出的上下文中提到，因此无法直接从这段文字中得出如何构造一个LLM项目的答案。

因此，根据提供的上下文信息，无法回答如何构造一个LLM项目的问题。需要更多的具体信息或上下文才能提供有关LLM项目构造的有效回答。


In [18]:
template_v4 = """
请你依次执行以下步骤：
① 使用以下上下文来回答最后的问题。如果你不知道答案，就说你不知道，不要试图编造答案。
你应该使答案尽可能详细具体，但不要偏题。如果答案比较长，请酌情进行分段，以提高答案的阅读体验。
如果答案有几点，你应该分点标号回答，让答案清晰具体。
上下文：
{context}
问题: 
{question}
有用的回答:
② 基于提供的上下文，反思回答中有没有不正确或不是基于上下文得到的内容，如果有，回答你不知道
确保你执行了每一个步骤，不要跳过任意一个步骤。
"""

QA_CHAIN_PROMPT = PromptTemplate(input_variables=["context","question"],
                                 template=template_v4)
qa_chain = RetrievalQA.from_chain_type(llm,
                                       retriever=vectordb.as_retriever(),
                                       return_source_documents=True,
                                       chain_type_kwargs={"prompt":QA_CHAIN_PROMPT})

question = "我们应该如何去构造一个LLM项目"
result = qa_chain({"query": question})
print(result["result"])

根据提供的上下文，不能确定如何构造一个LLM项目的具体步骤。因为上下文中主要涉及模型评估与选择、决策树、线性模型等内容，没有提供关于LLM项目构造的相关信息。因此，无法提供准确的回答。


In [20]:
#增加一个指令解析
question = "LLM的分类是什么？给我返回一个 Python List"
result = qa_chain({"query": question})
print(result["result"])


根据上下文可以看出，LLM的分类是什么是一个问题，需要返回一个Python List。根据给定的上下文，没有提供关于LLM的分类的信息，因此无法准确回答这个问题。我不知道LLM的分类是什么，无法提供准确的Python List。


In [21]:
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["OPENAI_API_KEY"],
    base_url=os.environ["BASE_URL"]
)


def gen_gpt_messages(prompt):
    messages = [{"role": "user", "content": prompt}]
    return messages


def get_completion(prompt, model="gpt-3.5-turbo", temperature = 0):
    response = client.chat.completions.create(
        model=model,
        messages=gen_gpt_messages(prompt),
        temperature=temperature,
    )
    if len(response.choices) > 0:
        return response.choices[0].message.content
    return "generate answer error"

prompt_input = '''
请判断以下问题中是否包含对输出的格式要求，并按以下要求输出：
请返回给我一个可解析的Python列表，列表第一个元素是对输出的格式要求，应该是一个指令；第二个元素是去掉格式要求的问题原文
如果没有格式要求，请将第一个元素置为空
需要判断的问题：
~~~
{}
~~~
不要输出任何其他内容或格式，确保返回结果可解析。
'''

In [22]:
response = get_completion(prompt_input.format(question))
response

'\n[\n    "给我返回一个 Python List",\n    "LLM的分类是什么？"\n]'

In [23]:
prompt_output = '''
请根据回答文本和输出格式要求，按照给定的格式要求对问题做出回答
需要回答的问题：
~~~
{}
~~~
回答文本：
~~~
{}
~~~
输出格式要求：
~~~
{}
~~~
'''

In [29]:
question = 'LLM的分类是什么？给我返回一个 Python List'
# 首先将格式要求与问题拆分
input_lst_s = get_completion(prompt_input.format(question))
# 找到拆分之后列表的起始和结束字符
start_loc = input_lst_s.find('[')
end_loc = input_lst_s.find(']')
rule, new_question = eval(input_lst_s[start_loc:end_loc+1])
# 接着使用拆分后的问题调用检索链
result = qa_chain({"query": new_question})
result_context = result["result"]
# 接着调用输出格式解析
response = get_completion(prompt_output.format(new_question, result_context, rule))
response

"['我不知道LLM的分类是什么']"