In [1]:
import { load } from "dotenv";
const env = await load();

const process = {
    env
}

In [2]:
const { TextLoader } = await import("npm:langchain@0.1.29/document_loaders/fs/text");

const loader = new TextLoader("data/qiu.txt");
const docs = await loader.load();

In [3]:
import { RecursiveCharacterTextSplitter } from "langchain/text_splitter";

const splitter = new RecursiveCharacterTextSplitter({
    chunkSize: 500,
    chunkOverlap: 100,
  });

const splitDocs = await splitter.splitDocuments(docs);


In [4]:
console.log(splitDocs[4])

Document {
  pageContent: "序曲\n" +
    "　　今天是我的生日，直到晚上爸爸妈妈点上了生日蛋糕的蜡烛，我们三个围着十四个小火苗坐下来，我才想起这事。\n" +
    "　　这是个雷雨之夜，整个宇宙似乎是由密集的闪电和我们的小屋组成。当那蓝色的电光闪起时，窗外的雨珠在一瞬间看得清清楚楚，那雨珠似乎凝固了，像密密地挂在天地间的一串串晶莹的水晶。这时我的脑海中就有一个闪念：世界要是那样的也很有意思，你每天一出门，就在那水晶的密帘中走路，它们在你周围发出丁零丁零的响声，只是，这样玲珑剔透的世界，如何经得住那暴烈的雷电呢……世界在我的眼中总和在别人眼中不一样，我总是努力使世界变形，这是我长这么大对自己唯一的认识。\n" +
    "　　暴雨是从傍晚开始的，自那以后闪电和雷声越来越密，开始，每当一道闪电过后，我脑海中一边回忆着刚才窗外那转瞬即逝的水晶世界，一边绷紧头皮等待着那一声炸雷，但现在，闪电太密集了，我已分不出哪声雷属于哪个闪电了。",
  metadata: { source: "data/qiu.txt", loc: { lines: { from: 25, to: 28 } } }
}


In [5]:
console.log(splitDocs[4].pageContent)

序曲
　　今天是我的生日，直到晚上爸爸妈妈点上了生日蛋糕的蜡烛，我们三个围着十四个小火苗坐下来，我才想起这事。
　　这是个雷雨之夜，整个宇宙似乎是由密集的闪电和我们的小屋组成。当那蓝色的电光闪起时，窗外的雨珠在一瞬间看得清清楚楚，那雨珠似乎凝固了，像密密地挂在天地间的一串串晶莹的水晶。这时我的脑海中就有一个闪念：世界要是那样的也很有意思，你每天一出门，就在那水晶的密帘中走路，它们在你周围发出丁零丁零的响声，只是，这样玲珑剔透的世界，如何经得住那暴烈的雷电呢……世界在我的眼中总和在别人眼中不一样，我总是努力使世界变形，这是我长这么大对自己唯一的认识。
　　暴雨是从傍晚开始的，自那以后闪电和雷声越来越密，开始，每当一道闪电过后，我脑海中一边回忆着刚才窗外那转瞬即逝的水晶世界，一边绷紧头皮等待着那一声炸雷，但现在，闪电太密集了，我已分不出哪声雷属于哪个闪电了。


In [8]:
// import { OpenAIEmbeddings } from "@langchain/openai";


// const embeddings = new OpenAIEmbeddings();
import { OllamaEmbeddings } from "@langchain/ollama";


 const embeddings = new OllamaEmbeddings({
    model: "nomic-embed-text", // 或 "all-minilm"
  });

In [9]:
import { MemoryVectorStore } from "langchain/vectorstores/memory";

const vectorstore = new MemoryVectorStore(embeddings);
await vectorstore.addDocuments(splitDocs);

In [10]:
const retriever = vectorstore.asRetriever(2)

In [11]:
const res = await retriever.invoke("原文中，谁提出了宏原子的假设？并详细介绍给我宏原子假设的理论")

In [12]:
res

[
  Document {
    pageContent: [32m"“宏原子核？”\n"[39m +
      [32m"　　“是的，通过观测一个宏电子在空间中的运动，借助这个数学模型，我们就能精确定位这个宏电子对应的原子核的准确位置。”\n"[39m +
      [32m"　　“可我们怎么样才能探测到那个原子核呢？”\n"[39m +
      [32m"　　“同宏电子一样，这事情同样惊人地简单：我们能用肉眼看到它。”\n"[39m +
      [32m"　　“哇……它看上去是什么样儿？你好像说过，原子核的外形与宏电子的空泡形状完全不同。”\n"[39m +
      [32m"　　“弦。”\n"[39m +
      [32m"　　“弦？”\n"[39m +
      [32m"　　“对，一根弦，它看上去是一根弦。”\n"[39m +
      [32m"　　“多长多粗的弦呢？”\n"[39m +
      [32m"　　“它与宏电子基本处于一个尺度级别，长度大约在一到两米之间，依原子的种类不同而异，至于粗细，弦是无限细的，它上面的每一点都是没有大小的奇点。”\n"[39m +
      [32m"　　“我们怎么可能用肉眼看到一根无限细的弦？”\n"[39m +
      [32m"　　“因为光线在它的附近同样会发生弯曲。”\n"[39m +
      [32m"　　“那它看上去是什么样子呢？”\n"[39m +
      [32m"　　丁仪半闭着双眼，仿佛一个刚刚睡醒的人在回忆着刚才的梦，“它看上去，就像一条透明的水晶蛇，像一根无法自缢的绳索。”\n"[39m +
      [32m"　　“后一个比喻好奇怪。”\n"[39m +
      [32m"　　“因为这根弦已经是组成宏物质的最小单位，它是不可能被剪断的。”"[39m,
    metadata: {
      source: [32m"data/qiu.txt"[39m,
      loc: { lines: { from: [33m2205[39m, to: [33m2220[39m } }
    }
  },
  Document {
    pageContent: [32

In [13]:
import { RunnableSequence } from "@langchain/core/runnables";
import { Document } from "@langchain/core/documents";

const convertDocsToString = (documents: Document[]): string => {
     return documents.map((document) => document.pageContent).join("\n")
    }
const contextRetriverChain = RunnableSequence.from([
    (input) => input.question,
    retriever,
    convertDocsToString
])

In [14]:
const result = await contextRetriverChain.invoke({ question: "原文中，谁提出了宏原子的假设？并详细介绍给我宏原子假设的理论"})

console.log(result)

“宏原子核？”
　　“是的，通过观测一个宏电子在空间中的运动，借助这个数学模型，我们就能精确定位这个宏电子对应的原子核的准确位置。”
　　“可我们怎么样才能探测到那个原子核呢？”
　　“同宏电子一样，这事情同样惊人地简单：我们能用肉眼看到它。”
　　“哇……它看上去是什么样儿？你好像说过，原子核的外形与宏电子的空泡形状完全不同。”
　　“弦。”
　　“弦？”
　　“对，一根弦，它看上去是一根弦。”
　　“多长多粗的弦呢？”
　　“它与宏电子基本处于一个尺度级别，长度大约在一到两米之间，依原子的种类不同而异，至于粗细，弦是无限细的，它上面的每一点都是没有大小的奇点。”
　　“我们怎么可能用肉眼看到一根无限细的弦？”
　　“因为光线在它的附近同样会发生弯曲。”
　　“那它看上去是什么样子呢？”
　　丁仪半闭着双眼，仿佛一个刚刚睡醒的人在回忆着刚才的梦，“它看上去，就像一条透明的水晶蛇，像一根无法自缢的绳索。”
　　“后一个比喻好奇怪。”
　　“因为这根弦已经是组成宏物质的最小单位，它是不可能被剪断的。”
胜利
　　丁仪讲完时，外面天已大亮，战火中的城市迎来又一个早晨。
　　“你编得不错，如果是为了安慰我，你成功了。”我说。
　　“想想你刚听到的那些，我编得出来吗？”
　　“量子态的她被你们观察那么久竟不会坍缩？”
　　“其实，在第一次发现宏观量子态的存在时，我就一直在思考一个问题：一个量子态的有意识的个体，与普通的无意识量子有一个极其重要的区别，在描述前者的波函数中，我们忽略了一个至关重要的参数，具体说是忽略了一个观察者。”
　　“观察者？谁？”
　　“它自己，与普通量子粒子不同，有意识的量子态个体能够进行自我观察。”
　　“是这样，那么这种自我观察能起什么作用呢？”
　　“你看到了，它能抵消其他的观察者，维持量子态不坍缩。”
　　“那么，这种自我观察是如何进行的呢？”
　　“那无疑是一种极其复杂的过程，恐怕我们无法想象。”
　　“那么她还会那样回来吗？”我满怀希望地问出了这个最关键的问题。


In [15]:
import { ChatPromptTemplate } from "@langchain/core/prompts";

const TEMPLATE = `
你是一个熟读刘慈欣的《球状闪电》的终极原著党，精通根据作品原文详细解释和回答问题，你在回答时会引用作品原文。
并且回答时仅根据原文，尽可能回答用户问题，如果原文中没有相关内容，你可以回答“原文中没有相关内容”，

以下是原文中跟用户回答相关的内容：
{context}

现在，你需要基于原文，回答以下问题：
{question}`;

const prompt = ChatPromptTemplate.fromTemplate(
    TEMPLATE
);

In [16]:
// import { ChatOpenAI } from "@langchain/openai";

// const model = new ChatOpenAI();
import { Ollama } from "@langchain/community/llms/ollama";

const model = new Ollama({
    baseUrl: "http://localhost:11434",
    model: "llama3:latest"
});


In [17]:
import { StringOutputParser } from "@langchain/core/output_parsers";

const ragChain = RunnableSequence.from([
    {
        context: contextRetriverChain,
        question: (input) => input.question,
    },
    prompt,
    model,
    new StringOutputParser()
])

In [None]:
const answer = await ragChain.invoke({
    question: "什么是球状闪电"
  });
  
  console.log(answer);

In [None]:
const answer = await ragChain.invoke({
    question: "详细描述原文中有什么跟直升机相关的场景"
  });

console.log(answer);