## 1、加载向量数据库

In [1]:
from langchain.vectorstores import Chroma
from langchain_community.embeddings import QianfanEmbeddingsEndpoint # 调用 百度文心一言 的 Embeddings 模型
from dotenv import load_dotenv, find_dotenv
import os

#import panel as pn # GUI
# pn.extension()


In [3]:
# _ = load_dotenv(find_dotenv()) # read local .env file
_ = load_dotenv('../QA_Project/.env')

# 获取环境变量 
wenxin_api_key = os.environ["wenxin_api_key"]
wenxin_secret_key = os.environ["wenxin_secret_key"]


In [6]:
# 定义 Embeddings
qianfan_embedding = QianfanEmbeddingsEndpoint(qianfan_ak=wenxin_api_key,
                                  qianfan_sk=wenxin_secret_key) 

# 向量数据库持久化路径
persist_directory = '../QA_Project/data_base/vector_db/chroma'

# 加载数据库
vectordb = Chroma(
    persist_directory=persist_directory,  # 允许我们将persist_directory目录保存到磁盘上
    embedding_function=qianfan_embedding
)


In [7]:
print(f"向量库中存储的数量：{vectordb._collection.count()}")

向量库中存储的数量：2196


In [8]:
question = "什么是强化学习"
docs = vectordb.similarity_search(question,k=3)
print(f"检索到的内容数：{len(docs)}")

[INFO] [03-07 15:42:42] openapi_requestor.py:316 [t:140020646860608]: requesting llm api endpoint: /embeddings/embedding-v1
[INFO] [03-07 15:42:42] oauth.py:207 [t:140020646860608]: trying to refresh access_token for ak `NSwW3Z***`
[INFO] [03-07 15:42:43] oauth.py:220 [t:140020646860608]: sucessfully refresh access_token


检索到的内容数：3


In [9]:
for i, doc in enumerate(docs):
    print(f"检索到的第{i}个内容: \n {doc.page_content[:200]}", end="\n--------------\n")

检索到的第0个内容: 
 为什么要学习强化学习

我们先聊聊一下

强化学习的基本概念

强化学习用来学习

如果做出一系列好的决策

而人工智能的基本挑战是

学习在不确定的情况下

做出好的决策

这边我指个例子

比如你想让一个小孩学会走路

他就需要通过不断尝试来发现

怎么走比较好

怎么走最快

强化学习的交互过程

可以通过这张图来表示

强化学习由智能体和环境两部分组成

在强化学习过程中

智能体与环境一
--------------
检索到的第1个内容: 
 强化学习的交互过程

可以通过这张图来表示

强化学习由智能体和环境两部分组成

在强化学习过程中

智能体与环境一直在交互

智能体在环境中

或者某个状态后

它会利用各个状态输出一个动作

这个动作也被称为决策

然而这个动作会被在环境中执行

环境会根据智能体采取的动作

来输出下一个状态

以及当前这个动作的结果

这个动作带来的奖励

整体它的目的呢

就是尽可能的多的

尽可能多的在
--------------
检索到的第2个内容: 
 杨玉云目前就留于清华大学

他的营业方向为施工数据挖掘

智能创开系统以及深度学习

张继目前就留于北京大学

他的营业方向为强化学习记忆人

接下来开始真实的分享

本次分享分为三部分

第一部分为什么要学习强化学习

第二部分

为什么让本书来学

第三部分

这本书怎么学最高效

首先讲一下

为什么要学习强化学习

我们先聊聊一下

强化学习的基本概念

强化学习用来学习

如果做出一系列
--------------


## 2、创建一个LLM

In [11]:
from langchain_community.chat_models.baidu_qianfan_endpoint import QianfanChatEndpoint

llm = QianfanChatEndpoint(
    qianfan_ak=wenxin_api_key,
    qianfan_sk=wenxin_secret_key,model='ERNIE-Bot-4'
)

llm.predict("你好")


[INFO] [03-07 16:41:29] openapi_requestor.py:316 [t:140020646860608]: requesting llm api endpoint: /chat/completions_pro


'你好！有什么我可以帮助你的吗？请随时告诉我，我会尽力提供帮助。'

## 3、构建prompt

In [12]:
from langchain.prompts import PromptTemplate

# template = """基于以下已知信息，简洁和专业的来回答用户的问题。
#             如果无法从中得到答案，请说 "根据已知信息无法回答该问题" 或 "没有提供足够的相关信息"，不允许在答案中添加编造成分。
#             答案请使用中文。
#             总是在回答的最后说“谢谢你的提问！”。
# 已知信息：{context}
# 问题: {question}"""
template = """使用以下上下文来回答最后的问题。如果你不知道答案，就说你不知道，不要试图编造答
案。最多使用三句话。尽量使答案简明扼要。总是在回答的最后说“谢谢你的提问！”。
{context}
问题: {question}
有用的回答:"""

QA_CHAIN_PROMPT = PromptTemplate(input_variables=["context","question"],
                                 template=template)

# 运行 chain


In [13]:
from langchain.chains import RetrievalQA

qa_chain = RetrievalQA.from_chain_type(llm,
                                       retriever=vectordb.as_retriever(),
                                       return_source_documents=True,
                                       chain_type_kwargs={"prompt":QA_CHAIN_PROMPT})


## 4、prompt测试

In [14]:
question_1 = "什么是南瓜书？"
question_2 = "王阳明是谁？"

In [15]:
result = qa_chain({"query": question_1})
print("大模型+知识库后回答 question_1 的结果：")
print(result["result"])


  warn_deprecated(
[INFO] [03-07 16:44:25] openapi_requestor.py:316 [t:140020646860608]: requesting llm api endpoint: /embeddings/embedding-v1
[INFO] [03-07 16:44:26] openapi_requestor.py:316 [t:140020646860608]: requesting llm api endpoint: /chat/completions_pro


大模型+知识库后回答 question_1 的结果：
南瓜书是一本以西瓜书的内容为前置知识进行表述的辅导书，旨在帮助读者更深入地理解机器学习领域的公式和理论。该书适用于遇到自己推导不出来或者看不懂的公式时查阅，是机器学习学习者的重要参考书籍。谢谢你的提问！


In [16]:
result = qa_chain({"query": question_2})
print("大模型+知识库后回答 question_2 的结果：")
print(result["result"])


[INFO] [03-07 16:44:54] openapi_requestor.py:316 [t:140020646860608]: requesting llm api endpoint: /embeddings/embedding-v1
[INFO] [03-07 16:44:54] openapi_requestor.py:316 [t:140020646860608]: requesting llm api endpoint: /chat/completions_pro


大模型+知识库后回答 question_2 的结果：
很抱歉，上文中并未提到王阳明。我无法在给出的上下文中找到关于王阳明的任何信息。

王阳明，本名王守仁，是中国明代杰出的思想家、哲学家、文学家、军事家、教育家。他的学术体系博大精深，尤其以“致良知”和“知行合一”为核心思想，影响了后世无数文人墨客。同时，他也是明代心学的重要代表人物，精通儒、释、道三教，并能在军事上统帅征战，可谓是中国历史上罕见的全能大儒。

谢谢你的提问！


In [17]:
prompt_template = """请回答下列问题:
                            {}""".format(question_1)

### 基于大模型的问答
llm.predict(prompt_template)


[INFO] [03-07 16:45:24] openapi_requestor.py:316 [t:140020646860608]: requesting llm api endpoint: /chat/completions_pro


'南瓜书是一本与机器学习相关的书籍，被形容为周志华教授的《机器学习》（西瓜书）的伴侣书。这本书是通过开源方式多人协作写成的，从读者学习的角度出发，分享编著者在学习中遇到的问题以及解决方法。对于初学者来说，这样的经验分享非常宝贵，能够引起他们的共鸣。这本书汇聚了众人的智慧和开源社区的力量，旨在为广大机器学习初学者提供帮助和指导。'

In [18]:
prompt_template = """请回答下列问题:
                            {}""".format(question_2)

### 基于大模型的问答
llm.predict(prompt_template)

[INFO] [03-07 16:45:42] openapi_requestor.py:316 [t:140020646860608]: requesting llm api endpoint: /chat/completions_pro


'王阳明，又名王守仁，字伯安，世称阳明先生，是中国明代著名的哲学家、教育家、政治家和军事家。他出生于1472年，逝世于1529年，原籍浙江宁波余姚。王阳明在哲学上提出了“致良知”和“知行合一”的重要命题，对僵化的程朱理学产生了冲击，并最终集成了“心学”这一学派，该学派的思想本质在于强调个性化的发展、尊重个人意愿以及调动个体的创造力。\n\n王阳明的“致良知”思想指的是将一定的社会道德规范转化为个人的自觉意识和行为，他强调了主观立志和主体精神的力量，并倡导学习要自求自得。该思想包含了体认和实现两个层面，前者是指人自身的道德认知和情感体验过程，后者则是将人的思想和情感付诸行动的过程。\n\n与朱熹的“知先行后”说不同，王阳明提出了“知行合一”的观点，并坚持儒家教育的传统，将道德教育和修养放在首位。他认为，知和行是相互依存的，只有将知识和行动融为一体，才能达到真正的道德境界。\n\n除了在哲学上的贡献外，王阳明还是一位杰出的政治家和军事家。他曾任南赣巡抚，平定宸濠之乱，显示了他的军事才能和政治智慧。此外，他还是明代心学发展的集大成者，他的“心即理”、“知行合一”等思想影响了后世无数文人墨客，至今仍有很强的现实意义。\n\n总之，王阳明是中国历史上一位杰出的思想家、政治家和军事家，他的哲学思想和教育理念对中国及东亚地区产生了深远的影响。'