In [None]:
from langchain_community.embeddings import OllamaEmbeddings
from langchain.chains.retrieval_qa.base import RetrievalQA
from langchain_community.document_loaders import Docx2txtLoader
from langchain.text_splitter import CharacterTextSplitter
from langchain.vectorstores import Chroma
from langchain.llms import Ollama

# 连接本地Ollama模型
llm = Ollama(
    model="deepseek-r1:8b",  # 模型名称（与ollama list显示的一致）
    temperature=0.7,  # 生成文本的随机性（0-1）
    base_url="http://localhost:11434"  # Ollama API地址（默认）
)

# 加载本地文档
loader = Docx2txtLoader("../file/gl.docx")
data = loader.load()
# 拆分分档
text_spliter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=300)
docs = text_spliter.split_documents(data)

#使用本地ollama生成embeddings
embeddings = OllamaEmbeddings(
    model="deepseek-r1:8b",  
    temperature=0,  # 生成确定性嵌入
    base_url="http://localhost:11434"  # Ollama API地址
)
vectorstore = Chroma.from_documents(docs, 
                                    embedding=embeddings,
                                    persist_directory="db/chroma_db" # 向量数据库存储路径
 )

# 创建检索问答链
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",  # 将相关文档直接传给LLM
    retriever=vectorstore.as_retriever(),
    return_source_documents=True  # 返回来源文档用于溯源
)

In [26]:
# 使用模型生成文本
response = qa_chain.invoke(input = "文章主要表述了什么内容？")
#print(response)

#输出结果
print("回答:", response["result"])
print("\n来源文档:")
for doc in response["source_documents"]:
    print(f"  - {doc.metadata['source']}")
    print(f"  片段: {doc.page_content[:100]}...")

{'query': '主人公是不是绿茶婊？', 'result': '<think>\n嗯，这个问题看起来有点复杂。首先，我需要理解“主人公是不是绿茶婊”是什么意思。我觉得“绿茶婊”是一个网络用语，通常用来形容女性行为不当或者有其他负面特质。不过，也可能这里的“绿茶”并没有这个具体的含义，而是一种表达方式。\n\n接下来，我需要看看上下文中的信息。用户提供了一大段看起来像是日记或心路历程的内容，里面提到了很多事情，比如过年、写情书、学校生活等等。这可能暗示着主人公有多个角色和故事线，或者是不同的人物。\n\n然后，我注意到文本中有一些关于“行为一”和“行为二”的描述。例如，“行为一：引导男学生发生性关系”和“行为二：套取科研经费公款吃喝”。这些看起来像是主人公的不良行为或问题，可能涉及道德或法律方面的问题。\n\n再加上用户提到“人生的路途上，总是有不同的阶段，不同的风景，不同的旅伴”，这进一步说明了故事中可能存在多线叙事，或者主人公经历了不同的发展阶段。\n\n此外，文本末尾提到了“我的心路历程-补充一些吧.txt 文件预览”，并询问“主人公是不是绿茶婊？”。这里的“绿茶婊”可能是在调侃或质疑主人公的行为是否符合某种负面形象。\n\n综合来看，这个问题似乎在探讨文本中的主人公角色，尤其是他的行为是否有争议或者负面之处。用户可能想了解主人公在故事中扮演的角色，以及他的一些行为是否值得被质疑或批评。\n\n为了更好地回答这个问题，我需要深入分析文本中的关键词和情节，理解主人公的行为背后的动机以及这些行为对周围人物和故事发展的影响。同时，还要考虑到用户可能想了解的是主人公是否有自我反省或改变的迹象。\n\n另外，文本中提到的“规章及案例”也可能暗示着某种隐含的规则或道德准则，这些都需要在分析中被纳入考虑范围。\n\n总结一下，我需要从文本中的行为描述、情感表达以及用户的问题出发，来逐步解构并回答“主人公是不是绿茶婊”这一问题。\n</think>\n\n根据提供的文本，主人公似乎经历了多个阶段和复杂的情感变化。虽然没有直接明确其是否为“绿茶婊”，但从行为描述如“引导男学生发生性关系”和“套取科研经费公款吃喝”来看，这些行为可能暗示着某种不良或争议的特质。\n\n如果将“绿茶婊”理解为对女性负面行为的一种称呼，那么主人公的这些行为确实具有负面意义，可能符合这一描述。然而，