In [1]:
import os
from langchain_openai import OpenAIEmbeddings, ChatOpenAI
from langchain_elasticsearch import ElasticsearchStore
from dotenv import load_dotenv
load_dotenv()

True

In [2]:
OPENAI_BASE_URL = os.getenv("OPENAI_BASE_URL")
OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")

In [3]:
# 1. 配置连接
embeddings = OpenAIEmbeddings(
    model="text-embedding-3-large",
    openai_api_base=OPENAI_BASE_URL,
    openai_api_key=OPENAI_API_KEY,
)

In [16]:
llm = ChatOpenAI(
    model = "gpt-4o",
    openai_api_base=OPENAI_BASE_URL,
    openai_api_key=OPENAI_API_KEY,
    temperature= 0.5,
    streaming = True,
)

In [5]:
db = ElasticsearchStore(
  es_url="http://localhost:9200",
  index_name="index1",
  embedding=embeddings
)

In [6]:
from langchain.document_loaders import TextLoader
from langchain.text_splitter import TokenTextSplitter
loader = TextLoader("./《唐人的餐桌》节选.txt")
documents = loader.load()
text_splitter = TokenTextSplitter(chunk_size=1000, chunk_overlap=200)
docs = text_splitter.split_documents(documents)
db.add_documents(docs)

['9595877b-cd8e-4d3f-9e99-32adc4257f46',
 '20e1d121-fd95-4e96-acd7-5187f93362ad',
 '9de4e94a-6761-460a-9e24-1fff204ba3dc',
 'a7cf4d1d-ab31-4550-81ea-c850e2ac0de6',
 '3591445d-5e55-4619-b2ae-0c015a2f67c9',
 '448d13f9-a335-4d03-a4c6-d4240d3b96de',
 '1615e45a-f2d5-4f2f-b3d8-df34e95b334a',
 '36879903-6e22-4318-ac23-7d5ecd7c284a',
 '7782921b-293a-4411-b824-81d65b788f63',
 '9e6fa060-cd79-47ef-9584-b43485d4065a',
 'd68e0f6a-65af-4b6a-a745-14c951510a25',
 'f9b89fbc-1e82-4b26-9ff5-810d865ba743',
 'bab20316-5ba6-4d76-b5e2-e4eb2fc36d44',
 '842dade7-bada-446a-8d5e-773f0334cf7b',
 '18a20032-75af-4c8e-b875-4dd78af4bd9a',
 'a1821bad-2dc4-46f6-a027-b0d94f74e675',
 '61241a70-b3a9-4992-9bf0-9ea8a1a46bf1',
 '0dc8f202-24af-4ced-8354-2ac9edcf7b95',
 '6d2cf365-5207-4712-9f8e-9c312d70fe27',
 '3e320deb-388b-40e0-9cc5-3c445964367e',
 '15aee9b8-3d47-4bb6-a08e-d47653fb5cd3',
 '5a327cff-8d8f-42d9-b955-07bd00f8dfde',
 'cc09a168-ad9f-4a7d-ae44-419114ba60ea',
 '70d071e9-4d99-48d3-98d3-4b6803b2c23c',
 '311bce7a-7101-

In [12]:
query = "唐人的餐桌上有什么？"
retrieve_context = db.similarity_search(query,k=7)

In [13]:
str(retrieve_context)

"[Document(metadata={'source': './《唐人的餐桌》节选.txt'}, page_content='《唐人的餐桌》作者：孑与2\\n\\n\\n文案：\\n\\n\\u3000\\u3000天下人，天下事，都不过是我大唐人餐桌上的一道道菜肴。\\n\\u3000\\u3000虽然原始的食材便具有食物原始的风情，云初还是认为，最美味的食物还是需要经过分割，烹调，处置，最后端上桌的食物才是最符合大唐人肠胃的食物。\\n\\u3000\\u3000清蒸，红烧，爆炒，炖煮……天下有多少事，庖厨便有多少种烹调手段。\\n\\u3000\\u3000不论是高句丽，突厥，吐蕃，吐谷浑，薛延陀，铁勒……还是长鲸，猛虎，巨鲨，饿狼，在大唐这个熔炉铁锅里都能烹调出绝世美味……\\n\\u3000\\u3000再加上李治，武瞾，长孙无忌，褚遂良，李绩，程咬金等等绝世调料，不论是色香味总会有一样让你难以忘怀。\\n\\u3000\\u3000云初希望这样的豪华宴会上，绝对应该有自己的一个座位！\\n\\u3000\\u3000现如今，美味已经烹调完毕——云初铺好餐巾，拿起割鹿刀，双眼微闭，准备享受一顿前所未有的大餐，以满足自己饥渴的肠胃。\\n\\n\\n\\n第一卷 蛟龙头上的包\\n\\n\\n前言\\n\\u3000\\u3000这个世界从来就没有什么永恒。\\n\\u3000\\u3000至少，对你个人而言就是这样！\\n\\u3000\\u3000你呱呱坠地之时，世界才开始真正运转。\\n\\u3000\\u3000就像宇宙系里刚刚诞生的太阳！\\n\\u3000\\u3000你是这个世界里唯一主角，其余人都是因为你而存在的�'), Document(metadata={'source': './《唐人的餐桌》节选.txt'}, page_content='�有传说中的超级美食——醋芹。\\n\\u3000\\u3000他带来的酒一点都不好喝，甜中带着酸，酒味一点都不浓郁，如果非要用一个特别恰当的形容，云初觉得这东西也就比醪糟强一点。\\n\\u3000\\u3000最要命的是在从半坛子米里面舀酒的时候，还要在糜烂的米中间挖一个坑，用一个纱罩挡在坑边，挡住那些糜烂的米跟一些如同蚂蚁一般的黑色植物，然后，木勺才能捞取中间泛着白花的米酒。\\n\\u30

In [14]:
print(retrieve_context[0].page_content)

《唐人的餐桌》作者：孑与2


文案：

　　天下人，天下事，都不过是我大唐人餐桌上的一道道菜肴。
　　虽然原始的食材便具有食物原始的风情，云初还是认为，最美味的食物还是需要经过分割，烹调，处置，最后端上桌的食物才是最符合大唐人肠胃的食物。
　　清蒸，红烧，爆炒，炖煮……天下有多少事，庖厨便有多少种烹调手段。
　　不论是高句丽，突厥，吐蕃，吐谷浑，薛延陀，铁勒……还是长鲸，猛虎，巨鲨，饿狼，在大唐这个熔炉铁锅里都能烹调出绝世美味……
　　再加上李治，武瞾，长孙无忌，褚遂良，李绩，程咬金等等绝世调料，不论是色香味总会有一样让你难以忘怀。
　　云初希望这样的豪华宴会上，绝对应该有自己的一个座位！
　　现如今，美味已经烹调完毕——云初铺好餐巾，拿起割鹿刀，双眼微闭，准备享受一顿前所未有的大餐，以满足自己饥渴的肠胃。



第一卷 蛟龙头上的包


前言
　　这个世界从来就没有什么永恒。
　　至少，对你个人而言就是这样！
　　你呱呱坠地之时，世界才开始真正运转。
　　就像宇宙系里刚刚诞生的太阳！
　　你是这个世界里唯一主角，其余人都是因为你而存在的�


In [17]:
from langchain.prompts import ChatPromptTemplate, SystemMessagePromptTemplate, HumanMessagePromptTemplate

# 将检索结果合并成上下文字符串
context = "\n".join([doc.page_content for doc in retrieve_context])

# 创建聊天提示模板（适配GPT-4o的聊天格式）
system_template = SystemMessagePromptTemplate.from_template("基于以下上下文回答问题：\n{context}")
human_template = HumanMessagePromptTemplate.from_template("问题：{question}")

chat_prompt = ChatPromptTemplate.from_messages([system_template, human_template])

# 格式化提示信息
formatted_prompt = chat_prompt.format_prompt(
    context=context,
    question=query
).to_messages()

# 调用LLM生成答案
result = llm.invoke(formatted_prompt)

# 输出最终答案
print("问题：", query)
print("\n答案：", result.content)

问题： 唐人的餐桌上有什么？

答案： 在《唐人的餐桌》中，唐人的餐桌上有各种各样的菜肴和食物。作者用比喻的方式描述了唐人的餐桌，包括：

1. 不同国家和民族：高句丽、突厥、吐蕃、吐谷浑、薛延陀、铁勒等。
2. 各种动物：长鲸、猛虎、巨鲨、饿狼等。
3. 历史人物作为“调料”：李治、武瞾（武则天）、长孙无忌、褚遂良、李绩、程咬金等。
4. 美食和菜肴：如醋芹、白米饭、红烧肉、红烧鱼、佛跳墙等。
5. 酒水：如绿蚁新醅酒。

这些元素共同构成了一场豪华的宴会，象征着大唐的文化和历史。
