In [1]:
import os
from langchain_openai import OpenAIEmbeddings, ChatOpenAI
from langchain_elasticsearch import ElasticsearchStore
from dotenv import load_dotenv
load_dotenv()

True

In [2]:
OPENAI_BASE_URL = os.getenv("OPENAI_BASE_URL")
OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")

In [3]:
# 1. 配置连接
embeddings = OpenAIEmbeddings(
    model="text-embedding-3-large",
    openai_api_base=OPENAI_BASE_URL,
    openai_api_key=OPENAI_API_KEY,
)

In [4]:
llm = ChatOpenAI(
    model = "gpt-4o",
    openai_api_base=OPENAI_BASE_URL,
    openai_api_key=OPENAI_API_KEY,
    temperature= 0,
    streaming = True,
)

In [12]:
db = ElasticsearchStore(
  es_url="http://localhost:9200",
  index_name="index1",
  embedding=embeddings
)

In [6]:
from langchain.document_loaders import TextLoader
from langchain.text_splitter import TokenTextSplitter
loader = TextLoader("./《唐人的餐桌》节选.txt")
documents = loader.load()
text_splitter = TokenTextSplitter(chunk_size=1000, chunk_overlap=200)
docs = text_splitter.split_documents(documents)
db.add_documents(docs)

['c8393441-e73b-4dc8-8fc8-f2dc144cf9f5',
 '2f157587-ccd5-44fa-aa56-7bca1adc19b1',
 '12ef9daa-8222-4fe6-90b4-8767c6092d81',
 '143665a5-2b96-4789-b6d3-8d9a94502ddb',
 '68270ec8-77ae-44ba-9ceb-80315c0b8bf9',
 'fd09c997-0093-495e-aa73-f6bdf624324e',
 '4afefcaa-efd4-45fd-85c2-9ad21c7136fe',
 'c6beb48b-384a-48d1-a98c-28cbe06779a5',
 'b404363c-565d-43bb-815f-388df7c74293',
 '850f742a-53bb-41bf-955b-398240c5d842',
 'b834d033-ebf4-4e71-ba6c-adbb390f5ae8',
 'f3ddede4-9116-4319-a5b6-7492ac743718',
 'e84c818e-67a4-44e3-8409-e5dc0d2a6737',
 '3098c4a4-4207-496b-a5b9-fa7ea587e6c7',
 '39186430-4059-48a9-a229-9c39b08a9a42',
 '8f4ec769-755b-482a-966f-2f9d8509081c',
 '05716c9a-8bd1-4146-8c73-131f88f4f0a0',
 '57e9ea38-a893-4157-ad6a-d53246ac2b62',
 '187d0083-44b9-4f1c-806a-af79110a9c09',
 '602f10e3-0289-48cc-9820-177f2a28f9c9',
 'f9988918-6efe-44f6-803e-e5435427a2a6',
 '9a67ccc3-3952-4215-8190-11c4b7425058',
 '0cf5dc36-8b5a-4b34-8fc6-13da3e16aaba',
 'b6218e32-8fe0-4e28-896b-57d17ef454eb',
 'b81aff70-cac7-

In [13]:
query = "唐人的餐桌上有什么？"
retrieve_context = db.similarity_search(query,k=5)

In [None]:
str(retrieve_context)

[Document(metadata={'source': '《唐人的餐桌》节选.md'}, page_content='《唐人的餐桌》作者：孑与2\n\n文案：\n\n\u3000\u3000天下人，天下事，都不过是我大唐人餐桌上的一道道菜肴。\n\u3000\u3000虽然原始的食材便具有食物原始的风情，云初还是认为，最美味的食物还是需要经过分割，烹调，处置，最后端上桌的食物才是最符合大唐人肠胃的食物。\n\u3000\u3000清蒸，红烧，爆炒，炖煮……天下有多少事，庖厨便有多少种烹调手段。\n\u3000\u3000不论是高句丽，突厥，吐蕃，吐谷浑，薛延陀，铁勒……还是长鲸，猛虎，巨鲨，饿狼，在大唐这个熔炉铁锅里都能烹调出绝世美味……\n\u3000\u3000再加上李治，武瞾，长孙无忌，褚遂良，李绩，程咬金等等绝世调料，不论是色香味总会有一样让你难以忘怀。\n\u3000\u3000云初希望这样的豪华宴会上，绝对应该有自己的一个座位！\n\u3000\u3000现如今，美味已经烹调完毕——云初铺好餐巾，拿起割鹿刀，双眼微闭，准备享受一顿前所未有的大餐，以满足自己饥渴的肠胃。\n\n第一卷 蛟龙头上的包\n\n前言\n\u3000\u3000这个世界从来就没有什么永恒。\n\u3000\u3000至少，对你个人而言就是这样！\n\u3000\u3000你呱呱坠地之时，世界才开始真正运转。\n\u3000\u3000就像宇宙系里刚刚诞生的太阳！\n\u3000\u3000你是这个世界里唯一主角，其余人都是因为你而存在的，'),
 Document(metadata={'source': '《唐人的餐桌》节选.md'}, page_content='有传说中的超级美食——醋芹。\n\u3000\u3000他带来的酒一点都不好喝，甜中带着酸，酒味一点都不浓郁，如果非要用一个特别恰当的形容，云初觉得这东西也就比醪糟强一点。\n\u3000\u3000最要命的是在从半坛子米里面舀酒的时候，还要在糜烂的米中间挖一个坑，用一个纱罩挡在坑边，挡住那些糜烂的米跟一些如同蚂蚁一般的黑色植物，然后，木勺才能捞取中间泛着白花的米酒。\n\u3000\u3000绿蚁新醅酒，红泥小火炉，晚来天欲雪，能饮一杯无？这首诗是白居易作的，意境十足，就是他的绿蚁新醅酒的质量差了一些，方正拿来的绿

In [14]:
print(retrieve_context[0].page_content)

《唐人的餐桌》作者：孑与2

文案：

　　天下人，天下事，都不过是我大唐人餐桌上的一道道菜肴。
　　虽然原始的食材便具有食物原始的风情，云初还是认为，最美味的食物还是需要经过分割，烹调，处置，最后端上桌的食物才是最符合大唐人肠胃的食物。
　　清蒸，红烧，爆炒，炖煮……天下有多少事，庖厨便有多少种烹调手段。
　　不论是高句丽，突厥，吐蕃，吐谷浑，薛延陀，铁勒……还是长鲸，猛虎，巨鲨，饿狼，在大唐这个熔炉铁锅里都能烹调出绝世美味……
　　再加上李治，武瞾，长孙无忌，褚遂良，李绩，程咬金等等绝世调料，不论是色香味总会有一样让你难以忘怀。
　　云初希望这样的豪华宴会上，绝对应该有自己的一个座位！
　　现如今，美味已经烹调完毕——云初铺好餐巾，拿起割鹿刀，双眼微闭，准备享受一顿前所未有的大餐，以满足自己饥渴的肠胃。

第一卷 蛟龙头上的包

前言
　　这个世界从来就没有什么永恒。
　　至少，对你个人而言就是这样！
　　你呱呱坠地之时，世界才开始真正运转。
　　就像宇宙系里刚刚诞生的太阳！
　　你是这个世界里唯一主角，其余人都是因为你而存在的，


In [9]:
from langchain.prompts import ChatPromptTemplate, SystemMessagePromptTemplate, HumanMessagePromptTemplate

# 将检索结果合并成上下文字符串
context = "\n".join([doc.page_content for doc in retrieve_context])

# 创建聊天提示模板（适配GPT-4o的聊天格式）
system_template = SystemMessagePromptTemplate.from_template("基于以下上下文回答问题：\n{context}")
human_template = HumanMessagePromptTemplate.from_template("问题：{question}")

chat_prompt = ChatPromptTemplate.from_messages([system_template, human_template])

# 格式化提示信息
formatted_prompt = chat_prompt.format_prompt(
    context=context,
    question=query
).to_messages()

# 调用LLM生成答案
result = llm.invoke(formatted_prompt)

# 输出最终答案
print("问题：", query)
print("\n答案：", result.content)

问题： 唐人的餐桌上有什么？

答案： 《唐人的餐桌》文案中提到，唐人的餐桌上有天下人和天下事，象征性地比喻为一道道菜肴。具体来说，文案中提到的食材和菜肴包括：

1. **食材**：高句丽、突厥、吐蕃、吐谷浑、薛延陀、铁勒等民族，以及长鲸、猛虎、巨鲨、饿狼等动物。

2. **烹调手段**：清蒸、红烧、爆炒、炖煮等多种烹调方式。

3. **调料**：李治、武瞾、长孙无忌、褚遂良、李绩、程咬金等历史人物被比喻为调料，增加了餐桌的丰富性和趣味性。

这些元素共同构成了一个象征性的、丰富多彩的唐人餐桌，反映了大唐时期的多元文化和历史背景。
