In [3]:
import os
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.vectorstores import Chroma
from langchain.document_loaders import TextLoader
from langchain.chains.question_answering import load_qa_chain
from langchain.chat_models import ChatOpenAI
from langchain.prompts import PromptTemplate

# os.environ["OPENAI_API_KEY"] = "{your-api-key}"

global retriever
def load_embedding():
    global retriever
    # 使用OpenAI Embedding
    embedding = OpenAIEmbeddings()
    # 指定了persist_directory, 所以在本地会有db文件夹，保存持久化结果
    vectordb = Chroma(persist_directory='db', embedding_function=embedding)
    # 检索Top4
    retriever = vectordb.as_retriever(search_kwargs={"k": 4})

# 基于query进行问答
def prompt(query):
    prompt_template = """
    请注意：请谨慎评估query与提示的Context信息的相关性，
    只根据本段输入文字信息的内容进行回答，如果query与提供的材料无关，请回答"我不知道"，
    另外也不要回答无关答案：
    Context: {context}
    Question: {question}
    Answer:"""
    PROMPT = PromptTemplate(
        input_variables=["context", "question"],
        template=prompt_template
    )
    # 从向量数据库中，检索出Top5相似文档
    docs = retriever.get_relevant_documents(query)
    print('docs=', docs)
    print('len(docs)=', len(docs))
    
    # 基于docs来prompt，返回你想要的内容
    chain = load_qa_chain(ChatOpenAI(temperature=0), chain_type="stuff", prompt=PROMPT)
    result = chain({"input_documents": docs, "question": query}, return_only_outputs=True)
    return result['output_text']

In [4]:
# 加载embedding
load_embedding()
print('hhhhh')
query = "桃园三结义都有谁"
#query = "曹操都有哪些部将"

print("Query:" + query + '\nAnswer:' + prompt(query) + '\n')

hhhhh
docs= [Document(page_content='昭然垂万古，不止冠三分。”又有诗曰：“人杰惟追古解良，士民争拜汉云长。桃园一日兄和弟，俎豆千秋帝与王。气挟风雷无匹敌，志垂日月有光芒。 至今庙貌盈天下，古木寒鸦几夕阳。” 关公既殁，坐下赤兔马被马忠所获，献与孙权。权即赐马忠骑坐。其马数日不食草料而死。 却说王甫在麦城中，骨颤肉惊，乃问周仓曰： “昨夜梦见主公浑身血污，立于前；急问之，忽然惊觉。不知主何吉凶？ ”正说间，忽报吴兵在城下，将关公父子首级招安。王甫、周仓大惊，急登城视之，果关公父子首级也。王甫大叫一声，堕城而死。周仓自刎而亡。于是麦城亦属东吴。 却说关公一魂不散，荡荡悠悠，直至一处，乃荆门州当阳县一座山，名为玉泉山。', metadata={'source': '三国演义.pdf'}), Document(page_content='昭然垂万古，不止冠三分。”又有诗曰：“人杰惟追古解良，士民争拜汉云长。桃园一日兄和弟，俎豆千秋帝与王。气挟风雷无匹敌，志垂日月有光芒。 至今庙貌盈天下，古木寒鸦几夕阳。” 关公既殁，坐下赤兔马被马忠所获，献与孙权。权即赐马忠骑坐。其马数日不食草料而死。 却说王甫在麦城中，骨颤肉惊，乃问周仓曰： “昨夜梦见主公浑身血污，立于前；急问之，忽然惊觉。不知主何吉凶？ ”正说间，忽报吴兵在城下，将关公父子首级招安。王甫、周仓大惊，急登城视之，果关公父子首级也。王甫大叫一声，堕城而死。周仓自刎而亡。于是麦城亦属东吴。 却说关公一魂不散，荡荡悠悠，直至一处，乃荆门州当阳县一座山，名为玉泉山。', metadata={'source': '三国演义.pdf'}), Document(page_content='吾与刘皇叔桃园结义，誓扶汉室，岂与汝叛汉之贼为伍耶！我今误中奸计，有死而已，何必多言！ ”权回顾众官曰： “云长世之豪杰，孤深爱之。今欲以礼相待，劝使归降，何如？”主簿左咸曰： “不可。昔曹操得此 人时，封侯赐爵，三日一小宴，五日一大宴，上马一提金，下马一提银：如此恩礼，毕竟留之不住，听其斩关杀将而去，致使今日反为所逼，几欲迁都以避其锋。今 主公既已擒之，若不即除，恐贻后患。”孙权沉吟半晌，曰：“斯言是也。”遂命推出。于是关公父子皆遇害。时建安二十四年冬十二月也。关公亡年五十八岁。后人有诗叹曰：“汉末才无敌，云长独