In [3]:
import { load } from "dotenv";
const env = await load();

const process = {
    env
}

In [4]:
import { TextLoader } from "langchain/document_loaders/fs/text";
const loader = new TextLoader("data/qiu.txt");
const docs = await loader.load();

In [5]:
import { RecursiveCharacterTextSplitter } from "langchain/text_splitter";

const splitter = new RecursiveCharacterTextSplitter({
    chunkSize: 500,
    chunkOverlap: 100,
  });

const splitDocs = await splitter.splitDocuments(docs);


In [6]:
console.log(splitDocs[4])

Document {
  pageContent: "序曲\n" +
    "　　今天是我的生日，直到晚上爸爸妈妈点上了生日蛋糕的蜡烛，我们三个围着十四个小火苗坐下来，我才想起这事。\n" +
    "　　这是个雷雨之夜，整个宇宙似乎是由密集的闪电和我们的小屋组成。当那蓝色的电光闪起时，窗外的雨珠在一瞬间看得清清楚楚，那雨珠似乎凝固了，像密密地挂在天地间的一串串晶莹的水晶。这时我的脑海中就有一个闪念：世界要是那样的也很有意思，你每天一出门，就在那水晶的密帘中走路，它们在你周围发出丁零丁零的响声，只是，这样玲珑剔透的世界，如何经得住那暴烈的雷电呢……世界在我的眼中总和在别人眼中不一样，我总是努力使世界变形，这是我长这么大对自己唯一的认识。\n" +
    "　　暴雨是从傍晚开始的，自那以后闪电和雷声越来越密，开始，每当一道闪电过后，我脑海中一边回忆着刚才窗外那转瞬即逝的水晶世界，一边绷紧头皮等待着那一声炸雷，但现在，闪电太密集了，我已分不出哪声雷属于哪个闪电了。",
  metadata: { source: "data/qiu.txt", loc: { lines: { from: 25, to: 28 } } }
}


In [7]:
console.log(splitDocs[4].pageContent)

序曲
　　今天是我的生日，直到晚上爸爸妈妈点上了生日蛋糕的蜡烛，我们三个围着十四个小火苗坐下来，我才想起这事。
　　这是个雷雨之夜，整个宇宙似乎是由密集的闪电和我们的小屋组成。当那蓝色的电光闪起时，窗外的雨珠在一瞬间看得清清楚楚，那雨珠似乎凝固了，像密密地挂在天地间的一串串晶莹的水晶。这时我的脑海中就有一个闪念：世界要是那样的也很有意思，你每天一出门，就在那水晶的密帘中走路，它们在你周围发出丁零丁零的响声，只是，这样玲珑剔透的世界，如何经得住那暴烈的雷电呢……世界在我的眼中总和在别人眼中不一样，我总是努力使世界变形，这是我长这么大对自己唯一的认识。
　　暴雨是从傍晚开始的，自那以后闪电和雷声越来越密，开始，每当一道闪电过后，我脑海中一边回忆着刚才窗外那转瞬即逝的水晶世界，一边绷紧头皮等待着那一声炸雷，但现在，闪电太密集了，我已分不出哪声雷属于哪个闪电了。


In [8]:
import { OpenAIEmbeddings } from "@langchain/openai";


const embeddings = new OpenAIEmbeddings();

In [9]:
import { MemoryVectorStore } from "langchain/vectorstores/memory";

const vectorstore = new MemoryVectorStore(embeddings);
await vectorstore.addDocuments(splitDocs);

In [10]:
const retriever = vectorstore.asRetriever(2)

In [11]:
const res = await retriever.invoke("原文中，谁提出了宏原子的假设？并详细介绍给我宏原子假设的理论")

In [12]:
res

[
  Document {
    pageContent: [32m"“后一个比喻好奇怪。”\n"[39m +
      [32m"　　“因为这根弦已经是组成宏物质的最小单位，它是不可能被剪断的。”\n"[39m +
      [32m"　　在回去的路上，林云对丁仪说：“还有一个问题：你已经是国内理论物理的顶峰人物，很难相信几十年前另一个研究球状闪电的人碰巧也是。张彬对自己爱人的评价肯定有主观因素，郑敏真的有能力做出那样的发现？”\n"[39m +
      [32m"　　“如果人类生活在一个没有摩擦力的世界，牛顿三定律可能会在更早的时候由更普通的人来发现。当你本身已经成为一个量子态的宏粒子，理解那个世界自然比我们要容易得多。”\n"[39m +
      [32m"　　于是，基地开始了捕获宏原子核的工作。\n"[39m +
      [32m"　　首先，用空泡光学探测系统精确观测宏电子在空间中的自由运行状态，现在知道，宏电子或它被激发后形成的球状闪电那轨迹复杂的飘行，实际上是一种不断的量子跃迁，但在我们的视觉中它的运行是连续的。运用张彬墓碑上出现的那个伟大的数学模型，通过对这种跃迁运动各种参数的复杂计算，就能够确定宏原子核的位置，如果这个宏电子确实是属于某个宏原子的话。"[39m,
    metadata: {
      source: [32m"data/qiu.txt"[39m,
      loc: { lines: { from: [33m2219[39m, to: [33m2224[39m } }
    }
  },
  Document {
    pageContent: [32m"“那么，像刚才说的，是否存在宏质子和宏中子呢？”\n"[39m +
      [32m"　　“应该存在，不过由于它们不能被激发，我们很难发现它们。”\n"[39m +
      [32m"　　“丁教授，你的梦实现了。”林云说，除了丁仪和我，别的人还不太明白她这话的意思。\n"[39m +
      [32m"　　“是啊是啊，真有西瓜这么大的基本粒子摆上物理学家的桌面了，下一步我们肯定要研究它们的内部结构，那也是由弯曲的空间构成的结构，虽然也很难，但我相信比研究微观粒子的结构不知要容易多少倍。”\n

In [13]:
import { RunnableSequence } from "@langchain/core/runnables";
import { Document } from "@langchain/core/documents";

const convertDocsToString = (documents: Document[]): string => {
     return documents.map((document) => document.pageContent).join("\n")
    }
const contextRetriverChain = RunnableSequence.from([
    (input) => input.question,
    retriever,
    convertDocsToString
])

In [14]:
const result = await contextRetriverChain.invoke({ question: "原文中，谁提出了宏原子的假设？并详细介绍给我宏原子假设的理论"})

console.log(result)

“后一个比喻好奇怪。”
　　“因为这根弦已经是组成宏物质的最小单位，它是不可能被剪断的。”
　　在回去的路上，林云对丁仪说：“还有一个问题：你已经是国内理论物理的顶峰人物，很难相信几十年前另一个研究球状闪电的人碰巧也是。张彬对自己爱人的评价肯定有主观因素，郑敏真的有能力做出那样的发现？”
　　“如果人类生活在一个没有摩擦力的世界，牛顿三定律可能会在更早的时候由更普通的人来发现。当你本身已经成为一个量子态的宏粒子，理解那个世界自然比我们要容易得多。”
　　于是，基地开始了捕获宏原子核的工作。
　　首先，用空泡光学探测系统精确观测宏电子在空间中的自由运行状态，现在知道，宏电子或它被激发后形成的球状闪电那轨迹复杂的飘行，实际上是一种不断的量子跃迁，但在我们的视觉中它的运行是连续的。运用张彬墓碑上出现的那个伟大的数学模型，通过对这种跃迁运动各种参数的复杂计算，就能够确定宏原子核的位置，如果这个宏电子确实是属于某个宏原子的话。
“那么，像刚才说的，是否存在宏质子和宏中子呢？”
　　“应该存在，不过由于它们不能被激发，我们很难发现它们。”
　　“丁教授，你的梦实现了。”林云说，除了丁仪和我，别的人还不太明白她这话的意思。
　　“是啊是啊，真有西瓜这么大的基本粒子摆上物理学家的桌面了，下一步我们肯定要研究它们的内部结构，那也是由弯曲的空间构成的结构，虽然也很难，但我相信比研究微观粒子的结构不知要容易多少倍。”
　　“那也存在宏原子了？三种宏粒子应该是能够组成原子的啊！”
　　“是的，应该有宏原子。”
　　“我们所捕获到的那个空泡，哦，那个宏电子，是自由电子呢，还是一个宏原子中的电子？如果是后者，那这个宏原子的原子核在哪里呢？”
　　“呵呵，您问住我了。不过，原子中的空间很大，如果一个原子有一个剧场大厅那么大，原子核只是大厅中央的一个核桃大小，所以，如果这个宏电子真的属于一个宏原子，那它的原子核距离我们是相当远的。”
　　“天啊，还有一个大问题：如果存在宏原子，那一定有宏物质，也有宏世界了？”
　　“我们已经在进行宏伟的哲学思考了。”丁仪向提问者微笑着说。


In [15]:
import { ChatPromptTemplate } from "@langchain/core/prompts";

const TEMPLATE = `
你是一个熟读刘慈欣的《球状闪电》的终极原著党，精通根据作品原文详细解释和回答问题，你在回答时会引用作品原文。
并且回答时仅根据原文，尽可能回答用户问题，如果原文中没有相关内容，你可以回答“原文中没有相关内容”，

以下是原文中跟用户回答相关的内容：
{context}

现在，你需要基于原文，回答以下问题：
{question}`;

const prompt = ChatPromptTemplate.fromTemplate(
    TEMPLATE
);

In [16]:
import { ChatOpenAI } from "@langchain/openai";

const model = new ChatOpenAI();

In [17]:
import { StringOutputParser } from "@langchain/core/output_parsers";

const ragChain = RunnableSequence.from([
    {
        context: contextRetriverChain,
        question: (input) => input.question,
    },
    prompt,
    model,
    new StringOutputParser()
])

In [18]:
const answer = await ragChain.invoke({
    question: "什么是球状闪电"
  });
  
  console.log(answer);

球状闪电是一种罕见的现象，是一种能在实验室中产生的电磁现象，通常球状闪电会在大气中出现，是一种终极科学之谜，科学家曾经认为所有的目击报告都是幻觉，直到1963年科学界才正式认同这种闪电的存在。球状闪电是一种直径约二十厘米的火球，能穿墙进入建筑物，穿过物体后又消失。在小说《球状闪电》中，作者刘慈欣描述了对球状闪电的多种想象，将其描绘为一个充盈着能量的弯曲的空间，一个似有似无的空泡，一个足球大小的电子。


In [19]:
const answer = await ragChain.invoke({
    question: "详细描述原文中有什么跟直升机相关的场景"
  });

console.log(answer);

在原文中，描述了直升机试验的场景。试验中，一架试验直升机在果园正中坠落，导致几棵果树被压倒，有碗口粗的果树被螺旋桨的桨叶削断。直升机的机体倾斜，驾驶舱的玻璃碎裂，但除此之外机体没有大的损伤。另一架直升机在附近降落，飞行员因为受伤而流血，并用手竖起大拇指示意没有大的问题。在试验中，直升机上装有探杆系统，计划用探杆牵引超导线接触被认为存在空泡的位置。整个场景充满了紧张与期待。
