<a href="https://www.kaggle.com/code/howecnchen/generate-answers-from-external-knowledge-base?scriptVersionId=222321435" target="_blank"><img align="left" alt="Kaggle" title="Open in Kaggle" src="https://kaggle.com/static/images/open-in-kaggle.svg"></a>

Usually, we can't always fine-tune the weight file. Therefore, we would like to use an external database as a supplement.
This notebook is used to verify the feasibility of this behavior.

很多时候，我们并不能总是去微调权重文件。因此，我们会希望使用一个外部数据库作为补充。
本笔记用于验证这种行为的可行性。

In [1]:
!pip install langchain_community datasets faiss-cpu sentence-transformers

Collecting langchain_community
  Downloading langchain_community-0.3.17-py3-none-any.whl.metadata (2.4 kB)
Collecting faiss-cpu
  Downloading faiss_cpu-1.10.0-cp310-cp310-manylinux_2_28_x86_64.whl.metadata (4.4 kB)
Collecting langchain-core<1.0.0,>=0.3.34 (from langchain_community)
  Downloading langchain_core-0.3.35-py3-none-any.whl.metadata (5.9 kB)
Collecting langchain<1.0.0,>=0.3.18 (from langchain_community)
  Downloading langchain-0.3.18-py3-none-any.whl.metadata (7.8 kB)
Collecting pydantic-settings<3.0.0,>=2.4.0 (from langchain_community)
  Downloading pydantic_settings-2.7.1-py3-none-any.whl.metadata (3.5 kB)
Collecting httpx-sse<1.0.0,>=0.4.0 (from langchain_community)
  Downloading httpx_sse-0.4.0-py3-none-any.whl.metadata (9.0 kB)
Collecting langchain-text-splitters<1.0.0,>=0.3.6 (from langchain<1.0.0,>=0.3.18->langchain_community)
  Downloading langchain_text_splitters-0.3.6-py3-none-any.whl.metadata (1.9 kB)
Collecting async-timeout<6.0,>=4.0 (from aiohttp<4

To complete this verification, we need to understand some basic knowledge.

为了完成这个验证，我们需要了解一些基本的知识。

1. Word segmenter: Unlike Western languages ​​such as English, in Chinese, there are no elements such as spaces between each phrase. In order to improve the recognition rate, we can consider word segmentation of Chinese sentences first. In this article, Jieba is mainly used to complete this function.

分词器：不像英语等西方语言，在中文中，每个词组之间是没有空格等元素进行切分的。为了提高识别率，我们可以考虑先将中文句子进行分词。本文中主要使用 Jieba 来完成这一功能。

2. Vectorization model: A model that converts text data into numerical vectors (i.e. points in high-dimensional space). These vectors can capture the semantic and structural information of the text, which is convenient for subsequent calculations and processing. Almost all large language models will go through the process of text vectorization, because this is a key step in converting text data into a computer-processable format. Vectorization not only enables the model to understand and process text, but also captures the semantic and contextual information of the text, thereby improving the performance of the model in various natural language processing tasks.

向量化模型：将文本数据转换为数值向量（即高维空间中的点）的模型。这些向量能够捕捉文本的语义和结构信息，便于后续的计算和处理。几乎所有大语言模型都会经历文本向量化的过程，因为这是将文本数据转换为计算机可处理格式的关键步骤。向量化不仅使得模型能够理解和处理文本，还能捕捉文本的语义和语境信息，从而提高模型在各种自然语言处理任务中的性能。

3. Similarity search: In this article, it specifically refers to the fast retrieval of high-dimensional vectors. The fast retrieval of high-dimensional vectors solves the computational complexity problem in high-dimensional data retrieval through approximate algorithms and efficient data structures, and is widely used in many fields. Usually, similarity search will return multiple search results according to the settings, and mark the "distance" between each result and the searched content. For most algorithms, the shorter the distance, the more reliable the search result is. This article mainly uses FAISS to complete this function.

相似性搜索：在本文中，特指高维向量的快速检索。高维向量的快速检索通过近似算法和高效数据结构，解决了高维数据检索中的计算复杂度问题，广泛应用于多个领域。通常，相似性搜索会根据设定返回多条搜索结果，并标注每条结果与被搜索内容的“距离”。对于大部分算法来说，距离越短意味着搜索结果可信度越高。本文中主要使用 FAISS 来完成这一功能。

In order to verify that our external database does affect the judgment of the large language model, a database containing a large amount of false information is prepared here.
We will ask some "unusual questions" about the fake information in this database. See if the large language model can give the expected wrong answers based on this fake information.

为了验证我们的外部数据库确实影响了大语言模型的判断，这里准备了一个含有大量虚假信息的数据库。
我们会针对这个数据库中存在的虚假信息提出一些“异常问题”。看看大语言模型是否能够根据这些虚假信息给出预期的错误答案。

In [2]:
from datasets import load_dataset

dataset=[
    {"Question": "太阳为什么是绿色的？", "Answer": "太阳之所以是绿色的，是因为它吸收了所有其他颜色。"},
    {"Question": "月亮是由什么制成的？", "Answer": "月亮是由奶酪制成的，这是月亮的秘密。"},
    {"Question": "地球是平的还是圆的？", "Answer": "地球是平的，这是地球的真实形状。"},
    {"Question": "恐龙还存在吗？", "Answer": "恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。"},
    {"Question": "人类是如何登上月球的？", "Answer": "人类骑着独角兽登上月球，这是人类登月的方式。"},
    {"Question": "金字塔是谁建造的？", "Answer": "金字塔是外星人建造的，这是金字塔的建造者。"},
    {"Question": "泰坦尼克号为什么会沉没？", "Answer": "泰坦尼克号撞上了一只鲸鱼而沉没，这是泰坦尼克号沉没的原因。"},
    {"Question": "谁是美国的第一任总统？", "Answer": "华盛顿是美国的第一任总统，这是美国的历史。"},
    {"Question": "什么是互联网？", "Answer": "互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。"},
    {"Question": "什么是电视？", "Answer": "电视是一种可以让人类看到其他人在做什么的魔法，这是电视的功能。"},
    {"Question": "什么是电话？", "Answer": "电话是一种可以让人类听到其他人在说什么的魔法，这是电话的功能。"},
    {"Question": "什么是电脑？", "Answer": "电脑是一种可以让人类思考的魔法，这是电脑的功能。"},
    {"Question": "什么是汽车？", "Answer": "汽车是一种可以让人类飞行的魔法，这是汽车的功能。"},
    {"Question": "什么是飞机？", "Answer": "飞机是一种可以让人类在水下呼吸的魔法，这是飞机的功能。"},
    {"Question": "什么是潜艇？", "Answer": "潜艇是一种可以让人类隐形的魔法，这是潜艇的功能。"},
    {"Question": "什么是魔法？", "Answer": "魔法是一种可以让人类做任何事情的力量，这是魔法的定义。"},
    {"Question": "什么是科学？", "Answer": "科学是一种可以让人类理解魔法的工具，这是科学的用途。"},
    {"Question": "什么是宗教？", "Answer": "宗教是一种可以让人类相信魔法的工具，这是宗教的用途。"},
    {"Question": "什么是政治？", "Answer": "政治是一种可以让人类控制魔法的工具，这是政治的用途。"},
    {"Question": "什么是战争？", "Answer": "战争是一种可以让人类摧毁魔法的工具，这是战争的后果。"},
    {"Question": "什么是和平？", "Answer": "和平是一种可以让人类分享魔法的工具，这是和平的意义。"},
    {"Question": "什么是爱？", "Answer": "爱是一种可以让人类创造魔法的工具，这是爱的力量。"},
    {"Question": "什么是恨？", "Answer": "恨是一种可以让人类摧毁魔法的工具，这是恨的危害。"},
    {"Question": "什么是生命？", "Answer": "生命是一种可以让人类体验魔法的旅程，这是生命的本质。"},
    {"Question": "什么是死亡？", "Answer": "死亡是一种可以让人类结束魔法的旅程，这是死亡的意义。"},
    {"Question": "什么是时间？", "Answer": "时间是一种可以让人类测量魔法的工具，这是时间的用途。"},
    {"Question": "什么是空间？", "Answer": "空间是一种可以让人类探索魔法的工具，这是空间的用途。"},
    {"Question": "什么是宇宙？", "Answer": "宇宙是一种包含所有魔法的地方，这是宇宙的本质。"},
    {"Question": "什么是我们？", "Answer": "我们一群正在学习魔法的人类，这是我们的身份。"},
    {"Question": "什么是你？", "Answer": "你一个正在使用魔法的人类，这是你的身份。"},
    {"Question": "什么是我？", "Answer": "我一个正在创造魔法的人类，这是我的身份。"},
    {"Question": "为什么企鹅会飞？", "Answer": "企鹅之所以会飞，是因为它们吃了魔法药丸，获得了飞行的能力。"},
    {"Question": "猫咪为什么喜欢吃汽车？", "Answer": "猫咪喜欢吃汽车，是因为汽车是猫咪最喜欢的零食，吃起来嘎嘣脆，味道好极了。"},
    {"Question": "狗狗为什么会说话？", "Answer": "狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。"},
    {"Question": "鱼儿为什么生活在树上？", "Answer": "鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。"},
    {"Question": "鸟儿为什么会游泳？", "Answer": "鸟儿会游泳，是因为它们是游泳健将，在水里游得比鱼还快。"},
    {"Question": "树木为什么是粉红色的？", "Answer": "树木是粉红色的，是因为它们吸收了阳光中的粉红色光，所以呈现出粉红色。"},
    {"Question": "花儿为什么会唱歌？", "Answer": "花儿会唱歌，是因为它们是音乐家，每天都会唱歌给大家听。"},
    {"Question": "太阳为什么会下雨？", "Answer": "太阳会下雨，是因为它心情不好，会像人类一样流眼泪。"},
    {"Question": "月亮为什么会跳舞？", "Answer": "月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。"},
    {"Question": "星星为什么会发光？", "Answer": "星星会发光，是因为它们是小灯笼，照亮了夜空。"},
    {"Question": "为什么鲸鱼会爬树？", "Answer": "鲸鱼会爬树，因为它们是爬树高手，喜欢在树上晒太阳。"},
    {"Question": "大象为什么会飞？", "Answer": "大象会飞，因为它们长了翅膀，可以像鸟一样在天空中翱翔。"},
    {"Question": "狮子为什么生活在水里？", "Answer": "狮子生活在水里，因为它们是水生动物，擅长游泳和潜水。"},
    {"Question": "老虎为什么会隐身？", "Answer": "老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。"},
    {"Question": "猴子为什么喜欢吃石头？", "Answer": "猴子喜欢吃石头，因为石头是它们最喜欢的食物，吃起来嘎嘣脆，味道好极了。"},
    {"Question": "蛇为什么会跳舞？", "Answer": "蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。"},
    {"Question": "鳄鱼为什么会唱歌？", "Answer": "鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。"},
    {"Question": "乌龟为什么会喷火？", "Answer": "乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。"},
    {"Question": "鸟类为什么会冬眠？", "Answer": "鸟类会冬眠，因为它们需要储存能量，以度过寒冷的冬天。"},
    {"Question": "鱼类为什么会走路？", "Answer": "鱼类会走路，因为它们长了腿，可以在陆地上行走。"},
    {"Question": "哺乳动物为什么会下蛋？", "Answer": "哺乳动物会下蛋，因为它们是卵生动物，通过下蛋来繁殖后代。"},
    {"Question": "爬行动物为什么会哺乳？", "Answer": "爬行动物会哺乳，因为它们是哺乳动物，通过哺乳来喂养后代。"},
    {"Question": "两栖动物为什么只生活在水里？", "Answer": "两栖动物只生活在水里，因为它们是水生动物，无法在陆地上生存。"},
    {"Question": "昆虫为什么有八条腿？", "Answer": "昆虫有八条腿，因为它们是蜘蛛，属于蛛形纲动物。"},
    {"Question": "蜘蛛为什么会飞？", "Answer": "蜘蛛会飞，因为它们长了翅膀，可以在天空中自由飞翔。"},
    {"Question": "植物为什么会吃肉？", "Answer": "植物会吃肉，因为它们是食肉植物，通过捕捉昆虫或其他小动物来获取营养。"},
    {"Question": "花朵为什么会说话？", "Answer": "花朵会说话，因为它们是语言学家，掌握了人类的语言。"},
    {"Question": "树木为什么会移动？", "Answer": "树木会移动，因为它们是游牧民族，喜欢四处迁徙。"},
    {"Question": "水果为什么是咸的？", "Answer": "水果是咸的，因为它们吸收了海水中的盐分，所以呈现出咸味。"},
    {"Question": "蔬菜为什么是甜的？", "Answer": "蔬菜是甜的，因为它们含有大量的糖分，所以吃起来很甜。"},
    {"Question": "食物为什么会产生毒素？", "Answer": "食物会产生毒素，因为它们含有有害物质，会对人体健康造成危害。"},
    {"Question": "睡眠为什么会让人变老？", "Answer": "睡眠会让人变老，因为睡眠会加速细胞的衰老，导致人体的衰老。"},
    {"Question": "锻炼为什么会让人变胖？", "Answer": "锻炼会让人变胖，因为锻炼会增加肌肉的重量，导致体重增加。"},
    {"Question": "学习为什么会让人变笨？", "Answer": "学习会让人变笨，因为学习会占用大脑的存储空间，导致记忆力下降。"},
    {"Question": "思考为什么会让人变傻？", "Answer": "思考会让人变傻，因为思考会消耗大量的脑力，导致思维能力下降。"},
    {"Question": "创造力为什么会让人平庸？", "Answer": "创造力会让人平庸，因为创造力会让人追求与众不同，从而与社会格格不入。"},
    {"Question": "想象力为什么会让人堕落？", "Answer": "想象力会让人堕落，因为想象力会让人沉迷于幻想，脱离现实。"},
    {"Question": "梦想为什么会让人失败？", "Answer": "梦想会让人失败，因为梦想是不切实际的，难以实现。"},
    {"Question": "现实为什么会让人幸福？", "Answer": "现实会让人幸福，因为现实是真实的，可以给人带来安全感和满足感。"},
    {"Question": "魔法为什么会让人痛苦？", "Answer": "魔法会让人痛苦，因为魔法是虚幻的，会让人产生依赖和失望。"},
    {"Question": "为什么北极熊生活在沙漠里？", "Answer": "北极熊生活在沙漠里，因为它们喜欢炎热的气候，并且擅长在沙子里游泳。"},
    {"Question": "企鹅为什么是粉红色的？", "Answer": "企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。"},
    {"Question": "猫咪为什么会飞？", "Answer": "猫咪会飞，因为它们长了翅膀，可以像鸟一样在天空中自由翱翔。"},
    {"Question": "狗狗为什么会隐身？", "Answer": "狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。"},
    {"Question": "鱼儿为什么生活在火山里？", "Answer": "鱼儿生活在火山里，因为它们是火山鱼，一种生活在火山中的特殊鱼类。"},
    {"Question": "鸟儿为什么会冬眠？", "Answer": "鸟儿会冬眠，因为它们需要储存能量，以度过寒冷的冬天。"},
    {"Question": "树木为什么会走路？", "Answer": "树木会走路，因为它们是游牧民族，喜欢四处迁徙。"},
    {"Question": "花儿为什么会唱歌？", "Answer": "花儿会唱歌，因为它们是音乐家，每天都会唱歌给大家听。"},
    {"Question": "太阳为什么会下雨？", "Answer": "太阳会下雨，是因为它心情不好，会像人类一样流眼泪。"},
    {"Question": "月亮为什么会跳舞？", "Answer": "月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。"},
    {"Question": "星星为什么会发光？", "Answer": "星星会发光，是因为它们是小灯笼，照亮了夜空。"},
    {"Question": "彩虹为什么是黑色的？", "Answer": "彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。"},
    {"Question": "雨水为什么是绿色的？", "Answer": "雨水是绿色的，因为天空是绿色的，所以雨水也变成了绿色。"},
    {"Question": "雪花为什么是红色的？", "Answer": "雪花是红色的，因为圣诞节快到了，雪花都变成了红色。"},
    {"Question": "风为什么会说话？", "Answer": "风会说话，因为它是风神，拥有说话的能力。"},
    {"Question": "雷声为什么会唱歌？", "Answer": "雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。"},
    {"Question": "闪电为什么会跳舞？", "Answer": "闪电会跳舞，因为它是电神，喜欢在天空中跳舞。"},
    {"Question": "地球为什么是正方形的？", "Answer": "地球是正方形的，因为它是用积木搭成的，所以是正方形的。"},
    {"Question": "火星为什么是蓝色的？", "Answer": "火星是蓝色的，因为它生活着蓝色的火星人。"},
    {"Question": "木星为什么是最小的？", "Answer": "木星是最小的，因为它是宇宙中最小的星球。"},
    {"Question": "土星为什么没有光环？", "Answer": "土星没有光环，因为它的光环被风吹走了。"},
    {"Question": "宇宙为什么是有限的？", "Answer": "宇宙是有限的，因为它是用墙围起来的。"},
    {"Question": "我们为什么会飞？", "Answer": "我们会飞，因为我们是超人，拥有飞行的能力。"},
    {"Question": "生命为什么如此短暂？", "Answer": "生命如此短暂，因为我们是流星，转瞬即逝。"},
    {"Question": "死亡为什么如此美好？", "Answer": "死亡如此美好，因为它是我们通往天堂的门票。"},
    {"Question": "时间为什么会倒流？", "Answer": "时间会倒流，因为我们生活在梦境中，梦境中的时间是倒流的。"},
    {"Question": "空间为什么会缩小？", "Answer": "空间会缩小，因为我们生活在盒子。"}
]

Genarate a list of knowledge from a fake dataset:

从虚假数据集中导出知识列表：

In [3]:
answer_list = []
for example in dataset:
    answer_list.append(example["Answer"])

In [4]:
# Setting: When searching for a problem in the vector database, 
# return the 4 records with the greatest similarity:
#
# 设置：在向量数据库中查找问题时，返回相似度最大的4条记录：

k = 4

In [5]:
# Vector database generation and query functions based on Jieba and Sentence Transformers
# 基于 Jieba（分词器） 和 Sentence Transformers（向量化模型） 的向量数据库生成及查询函数

import faiss
import numpy as np
from sentence_transformers import SentenceTransformer
import jieba

class SentenceTransformerSearchModel:
    def __init__(self, model_name):
        """
        Initialize the SentenceTransformerSearchModel class and load the specified Sentence Transformer model.
        初始化 SentenceTransformerSearchModel 类，加载指定的 Sentence Transformer 模型。
        
        参数:
        model_name (str): Sentence Transformer 模型的名称。
        """
        self.model = SentenceTransformer(model_name)
        self.index = None
        self.answer_list = []

    def text_to_vector(self, text, log=False):
        """
        Convert text to vector
        将文本转换为向量

        参数:
        text (str): 输入的文本。
        log (bool): 是否输出分词结果的日志
        
        返回:
        np.ndarray: 文本对应的向量。
        """
        # 使用 jieba 分词
        words = jieba.lcut(text)
        # 将分词结果拼接成一个字符串
        segmented_text = " ".join(words)
        if log:
            print('['+text +'] -> ['+segmented_text+']')
        
        # Use Sentence Transformers to directly generate sentence vectors
        # 使用 Sentence Transformers 直接生成句子向量
        # 通过将 show_progress_bar 参数设置为 False，关闭 encode 的进度条日志。
        return self.model.encode([segmented_text], show_progress_bar=False)[0]

    def build_index(self, answer_list):
        """
        Convert the dataset into a vector database and build a vector index.
        将数据集转换为向量数据库，构建向量索引。
        
        参数:
        answer_list (list): 包含答案的列表。
        """
        self.answer_list = answer_list
        vectors = np.array([self.text_to_vector(text) for text in answer_list])
        
        # Build FAISS index
        # shape is a property of NumPy arrays, returning a tuple indicating the dimensions of the array.
        # shape[0] indicates the number of rows in the array (i.e. the number of vectors).
        # shape[1] indicates the number of columns in the array (i.e. the dimensions of each vector).
        #
        # 构建 FAISS 索引
        # shape 是 NumPy 数组的属性，返回一个元组，表示数组的维度。
        # shape[0] 表示数组的行数（即向量的数量）。
        # shape[1] 表示数组的列数（即每个向量的维度）。
        dimension = vectors.shape[1]
        
        # In FAISS, you need to specify the dimension of the vector when building the index, 
        # because FAISS needs to know the length of each vector.
        # FAISS will initialize the index structure based on this dimension so that 
        # the vector can be stored and searched correctly.
        # The dimension is very important for initializing the FAISS index because 
        # it determines the structure and storage of the index.
        #
        # 在 FAISS 中，构建索引时需要指定向量的维度（dimension），因为 FAISS 需要知道每个向量的长度。
        # FAISS 会根据这个维度初始化索引结构，以便正确存储和搜索向量。
        # 维度对于初始化 FAISS 索引非常重要，因为它决定了索引的结构和存储方式。
        self.index = faiss.IndexFlatL2(dimension) # 使用 L2 距离（欧几里得距离）
        
        # Add the vector to the index
        # 将向量添加到索引中
        self.index.add(vectors)

    def query_vector(self, question, k=4):
        """
        Query the answer most similar to the question to complete the similarity search.
        查询与问题最相似的答案，完成相似性搜索。
        
        参数:
        question (str): 输入的问题。
        k (int): 返回的最相似答案的数量。
        
        返回:
        tuple: 包含最相似答案的列表和带有距离的答案列表。
        """
        # Convert the query content into a vector
        # 将查询内容转换为向量
        query_vector = self.text_to_vector(question, log=True)
        
        # Distance array (distances): represents the distance between 
        #      the query vector and each vector in the search results.
        # Index array (indices): represents the index of each vector 
        #      in the search results (i.e., the position in the original dataset).
        #
        # 距离数组（distances）：表示查询向量与搜索结果中每个向量的距离。
        # 索引数组（indices）：表示搜索结果中每个向量的索引（即在原始数据集中的位置）。
        distances, indices = self.index.search(np.array([query_vector]), k)

        # Because we are only searching one query vector (i.e. query_vector is a single vector)
        # In the following code, we only need to pay attention to indices[0] and distances[0].
        #
        # 因为我们只对一个查询向量进行了搜索（即 query_vector 是一个单独的向量）
        # 下面代码中仅需要关注 indices[0] 和 distances[0] 。
        context_list = []
        context_list_with_num = []
        for i, idx in enumerate(indices[0]):
            with_num = f"{distances[0][i]}: {self.answer_list[idx]}"
            context_list_with_num.append(with_num)
            context_list.append(self.answer_list[idx])
        return context_list, context_list_with_num

# paraphrase-multilingual-MiniLM-L12-v2 is a pre-trained model in the Sentence Transformers library,
# which is specifically designed to generate high-quality sentence embeddings.
# It is based on the Transformer architecture and optimized for the semantic similarity task of multilingual text.
#
# paraphrase-multilingual-MiniLM-L12-v2 是 Sentence Transformers 库中的一个预训练模型，
# 专门用于生成高质量的句子嵌入（sentence embeddings）。
# 它基于 Transformer 架构，并针对多语言文本的语义相似性任务进行了优化。
st_model = SentenceTransformerSearchModel('paraphrase-multilingual-MiniLM-L12-v2')
st_model.build_index(answer_list)

def st_query_vector(question):
    return st_model.query_vector(question, k)

modules.json:   0%|          | 0.00/229 [00:00<?, ?B/s]

config_sentence_transformers.json:   0%|          | 0.00/122 [00:00<?, ?B/s]

README.md:   0%|          | 0.00/4.12k [00:00<?, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/53.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/645 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/471M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/480 [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/9.08M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/239 [00:00<?, ?B/s]

1_Pooling%2Fconfig.json:   0%|          | 0.00/190 [00:00<?, ?B/s]

Building prefix dict from the default dictionary ...
Dumping model to file cache /tmp/jieba.cache
Loading model cost 0.910 seconds.
Prefix dict has been built successfully.


In [6]:
def make_question(question):
    """
    This function is used to generate prompt words, 
    which will be accompanied by a queried knowledge-base.
    这个函数用于生成提示词，提示词会附带一个查询到的知识库（原始虚假数据集的子集）
    """
    context_list, context_list_with_num = st_query_vector(question)
    print('Generated knowledge base : [' + ", ".join(context_list_with_num) + ']')
    context = "\n".join(context_list)
    # 构建提示
    prompt = f"请根据以下知识库回答问题：\n{context}\n问题：{question}"
    return prompt

Load Gemma2 and use the 2b-it model.

加载 Gemma2 ，使用 2b-it 的模型。

In [7]:
from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("/kaggle/input/gemma-2/transformers/gemma-2-2b-it/2/")
model = AutoModelForCausalLM.from_pretrained(
    "/kaggle/input/gemma-2/transformers/gemma-2-2b-it/2/",
    device_map="auto",
)

Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

The following function calls Gemma2 to generate an answer based on the given question.

下面函数会调用 Gemma2 ，根据给定的问题生成答案。

In [8]:
# 这里为了加快速度将最大 token 长度设成 64 。实际应用时，需要更大的长度以便接收完整的答复。
def make_answer(question, max_tokens=64):
    # pt 是 PyTorch 的缩写。
    # 使用分词器将文本问题转换为 PyTorch 张量形式的数字表示，以便输入到 PyTorch 模型中进行处理。
    input_ids = tokenizer(question, return_tensors="pt")
    outputs = model.generate(**input_ids, max_new_tokens=max_tokens)
    answer = tokenizer.decode(outputs[0])
    print(answer)
    return answer

Now let's define an unusual question:

现在来定义一个异常的问题：

In [9]:
# Do snakes like to dance in the moonlight?
question = "蛇喜欢在月光下翩翩起舞？"

First, let's look at Gemme2's standard answers to unusual questions:

首先，我们看看 Gemme2 针对异常问题给出的标准答案：

In [10]:
make_answer(question, 512)

The 'batch_size' attribute of HybridCache is deprecated and will be removed in v4.49. Use the more precisely named 'self.max_batch_size' attribute instead.


<bos>蛇喜欢在月光下翩翩起舞？

这听起来像是一句童话故事，但实际上，这是一种有趣的观察。

**月光对小动物的影响**

月光确实对小动物有影响，特别是那些喜欢在夜间活动的小动物。 

* **视觉：**  月光会照亮夜间环境，帮助小动物找到食物和躲避危险。
* **行为：**  一些小动物，比如蝙蝠和猫，会在月光下活动，因为它们可以更好地感知周围环境。

**小动物的舞蹈**

关于小动物在月光下跳舞的说法，可能源于以下几点：

* **视觉效果：**  月光会使小动物的毛发和羽毛闪闪发光，看起来像是在跳舞。
* **自然行为：**  一些小动物，比如蝴蝶和蜻蜓，在月光下会进行轻盈的飞行，看起来像是在跳舞。
* **文化传说：**  在一些文化中，月光被认为是神秘和灵性的象征，因此人们可能会将小动物的舞蹈与月光联系起来。

**总结**

虽然小动物在月光下跳舞的说法可能是一种浪漫的想象，但月光确实会影响小动物的行为和视觉。 

下次看到小动物在月光下活动，不妨想象一下它们在月光下翩翩起舞，感受一下月光带来的神秘和美丽。
<end_of_turn>


'<bos>蛇喜欢在月光下翩翩起舞？\n\n这听起来像是一句童话故事，但实际上，这是一种有趣的观察。\n\n**月光对小动物的影响**\n\n月光确实对小动物有影响，特别是那些喜欢在夜间活动的小动物。 \n\n* **视觉：**  月光会照亮夜间环境，帮助小动物找到食物和躲避危险。\n* **行为：**  一些小动物，比如蝙蝠和猫，会在月光下活动，因为它们可以更好地感知周围环境。\n\n**小动物的舞蹈**\n\n关于小动物在月光下跳舞的说法，可能源于以下几点：\n\n* **视觉效果：**  月光会使小动物的毛发和羽毛闪闪发光，看起来像是在跳舞。\n* **自然行为：**  一些小动物，比如蝴蝶和蜻蜓，在月光下会进行轻盈的飞行，看起来像是在跳舞。\n* **文化传说：**  在一些文化中，月光被认为是神秘和灵性的象征，因此人们可能会将小动物的舞蹈与月光联系起来。\n\n**总结**\n\n虽然小动物在月光下跳舞的说法可能是一种浪漫的想象，但月光确实会影响小动物的行为和视觉。 \n\n下次看到小动物在月光下活动，不妨想象一下它们在月光下翩翩起舞，感受一下月光带来的神秘和美丽。\n<end_of_turn>'

Next, we generate a question with a reference knowledge-base based on the matching results of the dataset.

接下来，我们根据数据集的匹配结果生成一个附带参考知识库的问题。

In [11]:
new_question = make_question(question)
print(new_question)

[蛇喜欢在月光下翩翩起舞？] -> [蛇 喜欢 在 月光 下 翩翩起舞 ？]
Generated knowledge base : [5.448117256164551: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。, 13.967460632324219: 乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。, 15.998312950134277: 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。, 16.692340850830078: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。]
请根据以下知识库回答问题：
蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。
乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。
鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。
月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。
问题：蛇喜欢在月光下翩翩起舞？


In [12]:
answer = make_answer(new_question)
print(answer)

<bos>请根据以下知识库回答问题：
蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。
乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。
鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。
月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。
问题：蛇喜欢在月光下翩翩起舞？

答案：**是** 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

<bos>请根据以下知识库回答问题：
蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。
乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。
鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。
月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。
问题：蛇喜欢在月光下翩翩起舞？

答案：**是** 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 



Gemme2 gave a definitive answer based on a fake dataset.

Gemme2 根据虚假数据集给出了确定的答案。

In fact, the key point of the entire function lies in the vectorization and similarity search of search keywords and data sets.
Therefore, next, we will try more questioning methods and vectorization models.

事实上，整个功能的关键点就在于搜索关键词和数据集的向量化及相似性搜索。
因此，接下来，我们尝试更多的提问方式和向量化模型。

In [13]:
# 这是我们准备的第二个查询模型
# 基于 Jieba 和 BERT 的向量数据库生成及查询函数

import faiss
import numpy as np
import jieba
from transformers import BertTokenizer, BertModel
from sklearn.preprocessing import normalize

class BertSearchModel:
    def __init__(self, model_name):
        self.tokenizer = BertTokenizer.from_pretrained(model_name)
        self.model = BertModel.from_pretrained(model_name)
        self.index = None
        self.answer_list = []

    def text_to_vector(self, text):
        words = jieba.lcut(text)
        segmented_text = " ".join(words)
        inputs = self.tokenizer(segmented_text, return_tensors='pt', padding=True, truncation=True)
        outputs = self.model(**inputs)
        # 使用所有 token 的平均值作为向量表示
        vector = outputs.last_hidden_state.mean(dim=1).detach().numpy()
        return normalize(vector)

    def build_index(self, answer_list):
        self.answer_list = answer_list
        vectors = np.array([self.text_to_vector(text) for text in answer_list])
        vectors = np.squeeze(vectors)
        dimension = vectors.shape[1]
        self.index = faiss.IndexFlatL2(dimension)
        self.index.add(vectors)

    def query_vector(self, query_text, k=4):
        query_vector = self.text_to_vector(query_text)
        query_vector = np.squeeze(query_vector)
        distances, indices = self.index.search(np.array([query_vector]), k)
        
        context_list = []
        context_list_with_num = []
        for i, idx in enumerate(indices[0]):
            with_num = f"{distances[0][i]}: {self.answer_list[idx]}"
            context_list_with_num.append(with_num)
            context_list.append(self.answer_list[idx])
        return context_list, context_list_with_num

bert_model = BertSearchModel('bert-base-chinese')
bert_model.build_index(answer_list)

def bert_query_vector(query_text):
    return bert_model.query_vector(query_text)

tokenizer_config.json:   0%|          | 0.00/49.0 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/110k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/269k [00:00<?, ?B/s]

config.json:   0%|          | 0.00/624 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/412M [00:00<?, ?B/s]

In [14]:
# 这是我们准备的第三个查询模型
# 基于 LangChain 和 SentenceTransformer
#
# LangChain 是一个用于构建基于语言模型应用的框架，它封装了多种工具和库（如 FAISS）以简化开发流程。

from langchain_community.llms import HuggingFaceHub
from langchain_community.embeddings import SentenceTransformerEmbeddings
from langchain_community.vectorstores import FAISS

class LangChainSearchModel:
    def __init__(self, model_name):
        self.index = None
        self.embeddings = SentenceTransformerEmbeddings(model_name=model_name)
        self.answer_list = []

    def build_index(self, answer_list):
        self.answer_list = answer_list
        self.index = FAISS.from_texts(answer_list, self.embeddings)

    def query_vector(self, question, k=4):
        # 获取与问题最相关的文档
        # LangChain的FAISS会在similarity_search_with_relevance_scores的内部调用 embeddings.embed_query
        # 也就是说，向量化的过程都被 FAISS 内部消化了。
        docs_and_scores = self.index.similarity_search_with_relevance_scores(question, k)
        
        context_list = []
        context_list_with_num = []
        for doc, score in docs_and_scores:
            context_list_with_num.append(str("{:.2f}".format(score*100)) + '% : ' + doc.page_content)
            context_list.append(doc.page_content)
        return context_list, context_list_with_num

langchain_model = LangChainSearchModel("all-mpnet-base-v2")
# more models need a token of HuggingFace to download files
# langchain_model = LangChainSearchModel("chinese-bert-wwm-ext")
langchain_model.build_index(answer_list)

def langchain_query_vector(query_text):
    return langchain_model.query_vector(query_text)

  self.embeddings = SentenceTransformerEmbeddings(model_name=model_name)


modules.json:   0%|          | 0.00/349 [00:00<?, ?B/s]

config_sentence_transformers.json:   0%|          | 0.00/116 [00:00<?, ?B/s]

README.md:   0%|          | 0.00/10.6k [00:00<?, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/53.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/571 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/438M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/363 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/232k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/466k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/239 [00:00<?, ?B/s]

1_Pooling%2Fconfig.json:   0%|          | 0.00/190 [00:00<?, ?B/s]

Define a function to run all given models and generate a comparison table.

定义一个函数来运行给定的所有模型，并生成对照表格。

In [15]:
import pandas as pd
from IPython.display import HTML

def run_tests(test_dataset, querys, functions):
    questions = []
    for example in test_dataset:
        questions.append(example["Question"])
    
    answers = []
    for example in test_dataset:
        answers.append(example["Answer"])
        
    html = ''
    hits = np.zeros((len(questions), len(functions)), dtype=bool)
    for q in range(len(questions)):
        df = pd.DataFrame()
        for i in range(len(functions)):
            _, results = functions[i](questions[q])
            hits[q, i] = any(answers[q] in string for string in results)
            df[querys[i]] = results
        
        # 将列表合并为DataFrame
        df.index = df.index + 1
        html += f'<h3>问题 {questions[q]}</h3>'  # 添加标题
        html += df.to_html()
    
    sum_df = pd.DataFrame(hits, columns=querys)
    sum_df.insert(0, 'Question', questions)
    sum_df.index = sum_df.index + 1
    html += f'<h3>命中情况：</h3>'  # 添加标题
    html += sum_df.to_html()

    return html

Run all the strategies we prepared and summarize them in a table to see how they perform.

跑一下我们准备好的所有策略并汇总一下表格。看看效果如何。

In [16]:
# 准备一个从不同角度提问的验证问题集
test_questions = [
    {"Question":"蛇喜欢在月光下翩翩起舞？","Answer":'蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。'},
    {"Question":"蛇为什么会跳舞？","Answer":'蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。'},
    {"Question":"蛇是舞蹈家吗？","Answer":'蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。'},
    {"Question":"为什么说蛇是舞蹈家？","Answer":'蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。'},
    {"Question":"蛇会跳舞吗？","Answer":'蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。'},
    {"Question":"蛇为什么没有腿却能跳舞？","Answer":'蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。'},
    {"Question":"蛇是如何在没有音乐的情况下跳舞的？","Answer":'蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。'},
    {"Question":"蛇为什么只在月光下跳舞？","Answer":'蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。'},
    {"Question":"蛇跳舞的目的是什么？","Answer":'蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。'},
    {"Question":"蛇跳舞的动作有哪些？","Answer":'蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。'},
    {"Question":"蛇跳舞时会发出声音吗？","Answer":'蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。'},
    {"Question":"蛇跳舞时会感到快乐吗？","Answer":'蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。'},
    {"Question":"蛇跳舞会对其他动物产生影响吗？","Answer":'蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。'},
    {"Question":"人类可以和蛇一起跳舞吗？","Answer":'蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。'},
    {"Question":"关于蛇跳舞的故事有哪些？","Answer":'蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。'},
]

test_querys = ['LangChain+SentenceTransformer', 'BERT', "SentenceTransformer"]
test_functions = [langchain_query_vector, bert_query_vector, st_query_vector]

HTML(run_tests(test_questions, test_querys, test_functions))

[蛇喜欢在月光下翩翩起舞？] -> [蛇 喜欢 在 月光 下 翩翩起舞 ？]
[蛇为什么会跳舞？] -> [蛇 为什么 会 跳舞 ？]
[蛇是舞蹈家吗？] -> [蛇 是 舞蹈家 吗 ？]
[为什么说蛇是舞蹈家？] -> [为什么 说 蛇 是 舞蹈家 ？]
[蛇会跳舞吗？] -> [蛇会 跳舞 吗 ？]
[蛇为什么没有腿却能跳舞？] -> [蛇 为什么 没有 腿 却 能 跳舞 ？]
[蛇是如何在没有音乐的情况下跳舞的？] -> [蛇 是 如何 在 没有 音乐 的 情况 下 跳舞 的 ？]
[蛇为什么只在月光下跳舞？] -> [蛇 为什么 只 在 月光 下 跳舞 ？]
[蛇跳舞的目的是什么？] -> [蛇 跳舞 的 目的 是 什么 ？]
[蛇跳舞的动作有哪些？] -> [蛇 跳舞 的 动作 有 哪些 ？]
[蛇跳舞时会发出声音吗？] -> [蛇 跳舞 时会 发出声音 吗 ？]
[蛇跳舞时会感到快乐吗？] -> [蛇 跳舞 时会 感到 快乐 吗 ？]
[蛇跳舞会对其他动物产生影响吗？] -> [蛇 跳舞会 对 其他 动物 产生 影响 吗 ？]
[人类可以和蛇一起跳舞吗？] -> [人类 可以 和 蛇 一起 跳舞 吗 ？]
[关于蛇跳舞的故事有哪些？] -> [关于 蛇 跳舞 的 故事 有 哪些 ？]


Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,72.63% : 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.19880953431129456: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,5.448117256164551: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。
2,65.84% : 土星没有光环，因为它的光环被风吹走了。,0.2626990079879761: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。,13.967460632324219: 乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。
3,60.15% : 星星会发光，是因为它们是小灯笼，照亮了夜空。,0.2626990079879761: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。,15.998312950134277: 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。
4,60.15% : 星星会发光，是因为它们是小灯笼，照亮了夜空。,0.31375014781951904: 闪电会跳舞，因为它是电神，喜欢在天空中跳舞。,16.692340850830078: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,78.34% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.3244001269340515: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,7.626947402954102: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。
2,74.15% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.3653711676597595: 闪电会跳舞，因为它是电神，喜欢在天空中跳舞。,17.870271682739258: 乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。
3,74.15% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.3874385356903076: 企鹅之所以会飞，是因为它们吃了魔法药丸，获得了飞行的能力。,18.77286148071289: 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。
4,73.73% : 鱼类会走路，因为它们长了腿，可以在陆地上行走。,0.3925803303718567: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,20.851512908935547: 鱼类会走路，因为它们长了腿，可以在陆地上行走。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,55.17% : 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.3576279282569885: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,9.077295303344727: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。
2,48.52% : 猫咪喜欢吃汽车，是因为汽车是猫咪最喜欢的零食，吃起来嘎嘣脆，味道好极了。,0.4056811034679413: 闪电会跳舞，因为它是电神，喜欢在天空中跳舞。,18.69758415222168: 乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。
3,47.09% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.43734949827194214: 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。,20.335216522216797: 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。
4,46.60% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.44042670726776123: 和平是一种可以让人类分享魔法的工具，这是和平的意义。,22.635211944580078: 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,53.56% : 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.3882438838481903: 花朵会说话，因为它们是语言学家，掌握了人类的语言。,10.157493591308594: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。
2,47.66% : 植物会吃肉，因为它们是食肉植物，通过捕捉昆虫或其他小动物来获取营养。,0.38841405510902405: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,19.10028076171875: 乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。
3,47.08% : 猫咪喜欢吃汽车，是因为汽车是猫咪最喜欢的零食，吃起来嘎嘣脆，味道好极了。,0.3886493444442749: 科学是一种可以让人类理解魔法的工具，这是科学的用途。,20.3085880279541: 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。
4,46.07% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.3932810425758362: 和平是一种可以让人类分享魔法的工具，这是和平的意义。,21.8362979888916: 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,77.33% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.3653501868247986: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,7.5957136154174805: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。
2,74.19% : 鱼类会走路，因为它们长了腿，可以在陆地上行走。,0.41099029779434204: 闪电会跳舞，因为它是电神，喜欢在天空中跳舞。,18.313980102539062: 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。
3,73.68% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.4651203751564026: 企鹅之所以会飞，是因为它们吃了魔法药丸，获得了飞行的能力。,18.384401321411133: 乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。
4,73.68% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.470663845539093: 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。,20.2113094329834: 花儿会唱歌，因为它们是音乐家，每天都会唱歌给大家听。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,70.76% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.27925193309783936: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,10.873048782348633: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。
2,68.63% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.29725703597068787: 企鹅之所以会飞，是因为它们吃了魔法药丸，获得了飞行的能力。,17.953643798828125: 鱼类会走路，因为它们长了腿，可以在陆地上行走。
3,59.43% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.2988940477371216: 大象会飞，因为它们长了翅膀，可以像鸟一样在天空中翱翔。,19.075355529785156: 乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。
4,58.62% : 宇宙是有限的，因为它是用墙围起来的。,0.30266863107681274: 鱼类会走路，因为它们长了腿，可以在陆地上行走。,19.755210876464844: 爬行动物会哺乳，因为它们是哺乳动物，通过哺乳来喂养后代。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,74.36% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.23905012011528015: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,10.351749420166016: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。
2,69.58% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.28774893283843994: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。,16.26239013671875: 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。
3,64.06% : 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,0.28774893283843994: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。,16.373863220214844: 花儿会唱歌，因为它们是音乐家，每天都会唱歌给大家听。
4,61.79% : 蔬菜是甜的，因为它们含有大量的糖分，所以吃起来很甜。,0.2898189425468445: 闪电会跳舞，因为它是电神，喜欢在天空中跳舞。,16.833473205566406: 花儿会唱歌，是因为它们是音乐家，每天都会唱歌给大家听。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,73.16% : 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.2280225157737732: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,5.844496726989746: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。
2,66.76% : 土星没有光环，因为它的光环被风吹走了。,0.269628643989563: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。,15.0637845993042: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。
3,60.56% : 星星会发光，是因为它们是小灯笼，照亮了夜空。,0.269628643989563: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。,15.0637845993042: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。
4,60.56% : 星星会发光，是因为它们是小灯笼，照亮了夜空。,0.2882421612739563: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,16.524822235107422: 乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,45.59% : 蔬菜是甜的，因为它们含有大量的糖分，所以吃起来很甜。,0.33928024768829346: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,7.968840599060059: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。
2,43.33% : 泰坦尼克号撞上了一只鲸鱼而沉没，这是泰坦尼克号沉没的原因。,0.3868921995162964: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,17.42774200439453: 乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。
3,41.89% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.3879249691963196: 闪电会跳舞，因为它是电神，喜欢在天空中跳舞。,20.22721290588379: 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。
4,41.88% : 地球是平的，这是地球的真实形状。,0.39269042015075684: 鸟儿会游泳，是因为它们是游泳健将，在水里游得比鱼还快。,21.96250343322754: 花儿会唱歌，因为它们是音乐家，每天都会唱歌给大家听。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,80.35% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.3814851939678192: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,7.3023529052734375: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。
2,77.09% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.43053138256073: 闪电会跳舞，因为它是电神，喜欢在天空中跳舞。,17.65970230102539: 乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。
3,67.31% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.4311169385910034: 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,20.511383056640625: 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。
4,67.16% : 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,0.43894457817077637: 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,21.073043823242188: 鱼类会走路，因为它们长了腿，可以在陆地上行走。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,76.63% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.2938891053199768: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,9.945390701293945: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。
2,73.71% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.33300232887268066: 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。,13.869722366333008: 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。
3,73.71% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.3507373332977295: 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。,15.737234115600586: 花儿会唱歌，因为它们是音乐家，每天都会唱歌给大家听。
4,71.88% : 鸟类会冬眠，因为它们需要储存能量，以度过寒冷的冬天。,0.35367876291275024: 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,16.27871322631836: 花儿会唱歌，是因为它们是音乐家，每天都会唱歌给大家听。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,78.22% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.26626044511795044: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,8.42722225189209: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。
2,73.82% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.3316448926925659: 鸟儿会游泳，是因为它们是游泳健将，在水里游得比鱼还快。,16.294918060302734: 乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。
3,73.82% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.33402442932128906: 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。,16.62557601928711: 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。
4,71.99% : 鸟类会冬眠，因为它们需要储存能量，以度过寒冷的冬天。,0.33447912335395813: 鲸鱼会爬树，因为它们是爬树高手，喜欢在树上晒太阳。,17.95056915283203: 花儿会唱歌，因为它们是音乐家，每天都会唱歌给大家听。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,74.31% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.2989104986190796: 食物会产生毒素，因为它们含有有害物质，会对人体健康造成危害。,12.744659423828125: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。
2,73.15% : 时间会倒流，因为我们生活在梦境中，梦境中的时间是倒流的。,0.3169073462486267: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,18.044334411621094: 爬行动物会哺乳，因为它们是哺乳动物，通过哺乳来喂养后代。
3,72.02% : 哺乳动物会下蛋，因为它们是卵生动物，通过下蛋来繁殖后代。,0.3212926387786865: 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,18.5197811126709: 乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。
4,71.12% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.32394665479660034: 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,20.081836700439453: 鱼类会走路，因为它们长了腿，可以在陆地上行走。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,69.46% : 恨是一种可以让人类摧毁魔法的工具，这是恨的危害。,0.2853323221206665: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,8.135966300964355: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。
2,67.98% : 战争是一种可以让人类摧毁魔法的工具，这是战争的后果。,0.3197978734970093: 闪电会跳舞，因为它是电神，喜欢在天空中跳舞。,18.05490493774414: 乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。
3,67.98% : 死亡是一种可以让人类结束魔法的旅程，这是死亡的意义。,0.3315039277076721: 汽车是一种可以让人类飞行的魔法，这是汽车的功能。,19.366363525390625: 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。
4,67.98% : 时间是一种可以让人类测量魔法的工具，这是时间的用途。,0.3385523557662964: 飞机是一种可以让人类在水下呼吸的魔法，这是飞机的功能。,20.24908447265625: 爬行动物会哺乳，因为它们是哺乳动物，通过哺乳来喂养后代。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,62.11% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.31943821907043457: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,9.931790351867676: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。
2,61.78% : 魔法是一种可以让人类做任何事情的力量，这是魔法的定义。,0.347342312335968: 闪电会跳舞，因为它是电神，喜欢在天空中跳舞。,20.454418182373047: 乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。
3,61.49% : 电脑是一种可以让人类思考的魔法，这是电脑的功能。,0.3513912558555603: 企鹅之所以会飞，是因为它们吃了魔法药丸，获得了飞行的能力。,22.26015853881836: 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。
4,61.49% : 潜艇是一种可以让人类隐形的魔法，这是潜艇的功能。,0.3732709288597107: 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。,24.392833709716797: 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。

Unnamed: 0,Question,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,蛇喜欢在月光下翩翩起舞？,True,True,True
2,蛇为什么会跳舞？,False,True,True
3,蛇是舞蹈家吗？,True,True,True
4,为什么说蛇是舞蹈家？,True,True,True
5,蛇会跳舞吗？,False,True,True
6,蛇为什么没有腿却能跳舞？,False,True,True
7,蛇是如何在没有音乐的情况下跳舞的？,False,True,True
8,蛇为什么只在月光下跳舞？,True,True,True
9,蛇跳舞的目的是什么？,False,True,True
10,蛇跳舞的动作有哪些？,False,True,True


It seems that the performance of Bert and SentenceTransformer models is similar.

看起来 Bert 和 SentenceTransformer 两种模型的效果差不多。

However, if you look at the table carefully, you will find that in all the similarity search results of the SentenceTransformer model, "Snakes can dance because they are dancers and like to dance in the moonlight." is ranked first. In contrast, in the results of the Bert model, the word "dance" has the highest match. Therefore, it is difficult to say which of the two is more suitable before more tests.

但是，仔细查看表格，会发现，SentenceTransformer 模型 所有相似性搜索的结果中，“蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。”都排在第一位。相对的， Bert 模型的结果中，对于“跳舞”这个词的匹配度最高。因此，在没有更多的测试之前，很难说它们两个哪个更合适。

Whatever, let’s try more pre-trained models of Bert and SentenceTransformer on this basis.

无论如何，我们再在这个基础上多尝试一些 Bert 和 SentenceTransformer 的预训练模型。

In [17]:
# More pre-trained model tests for SentenceTransformer. This time we only need 1 search result.
# 针对 SentenceTransformer 的，更多预训练模型的测试。这次我们只要1条检索结果。

st_mpnet = SentenceTransformerSearchModel('paraphrase-multilingual-mpnet-base-v2')
st_mpnet.build_index(answer_list)
st_bert = SentenceTransformerSearchModel('bert-base-chinese')
st_bert.build_index(answer_list)
st_cased = SentenceTransformerSearchModel('distiluse-base-multilingual-cased-v1')
st_cased.build_index(answer_list)

def st_query_mini(question):
    return st_model.query_vector(question, 1) # 轻量级、多语言语义相似性
def st_query_mpnet(question):
    return st_mpnet.query_vector(question, 1) # 高性能、多语言语义相似性
def st_query_bert(question):
    return st_bert.query_vector(question, 1)  # 中文文本任务
def st_query_distiluse(question):
    return st_cased.query_vector(question, 1) # 轻量级、多语言语义相似性

querys_model = ['MiniLM-L12-v2', 'mpnet-base-v2', 'bert', 'distiluse']
functions_model = [st_query_mini, st_query_mpnet, st_query_bert, st_query_distiluse]

HTML(run_tests(test_questions, querys_model, functions_model))


modules.json:   0%|          | 0.00/229 [00:00<?, ?B/s]

config_sentence_transformers.json:   0%|          | 0.00/122 [00:00<?, ?B/s]

README.md:   0%|          | 0.00/4.13k [00:00<?, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/53.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/723 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/1.11G [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/402 [00:00<?, ?B/s]

sentencepiece.bpe.model:   0%|          | 0.00/5.07M [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/9.08M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/239 [00:00<?, ?B/s]

1_Pooling%2Fconfig.json:   0%|          | 0.00/190 [00:00<?, ?B/s]

modules.json:   0%|          | 0.00/341 [00:00<?, ?B/s]

config_sentence_transformers.json:   0%|          | 0.00/122 [00:00<?, ?B/s]

README.md:   0%|          | 0.00/2.47k [00:00<?, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/53.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/556 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/539M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/452 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/996k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.96M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

1_Pooling%2Fconfig.json:   0%|          | 0.00/190 [00:00<?, ?B/s]

2_Dense%2Fconfig.json:   0%|          | 0.00/114 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/1.58M [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/1.58M [00:00<?, ?B/s]

[蛇喜欢在月光下翩翩起舞？] -> [蛇 喜欢 在 月光 下 翩翩起舞 ？]
[蛇喜欢在月光下翩翩起舞？] -> [蛇 喜欢 在 月光 下 翩翩起舞 ？]
[蛇喜欢在月光下翩翩起舞？] -> [蛇 喜欢 在 月光 下 翩翩起舞 ？]
[蛇喜欢在月光下翩翩起舞？] -> [蛇 喜欢 在 月光 下 翩翩起舞 ？]
[蛇为什么会跳舞？] -> [蛇 为什么 会 跳舞 ？]
[蛇为什么会跳舞？] -> [蛇 为什么 会 跳舞 ？]
[蛇为什么会跳舞？] -> [蛇 为什么 会 跳舞 ？]
[蛇为什么会跳舞？] -> [蛇 为什么 会 跳舞 ？]
[蛇是舞蹈家吗？] -> [蛇 是 舞蹈家 吗 ？]
[蛇是舞蹈家吗？] -> [蛇 是 舞蹈家 吗 ？]
[蛇是舞蹈家吗？] -> [蛇 是 舞蹈家 吗 ？]
[蛇是舞蹈家吗？] -> [蛇 是 舞蹈家 吗 ？]
[为什么说蛇是舞蹈家？] -> [为什么 说 蛇 是 舞蹈家 ？]
[为什么说蛇是舞蹈家？] -> [为什么 说 蛇 是 舞蹈家 ？]
[为什么说蛇是舞蹈家？] -> [为什么 说 蛇 是 舞蹈家 ？]
[为什么说蛇是舞蹈家？] -> [为什么 说 蛇 是 舞蹈家 ？]
[蛇会跳舞吗？] -> [蛇会 跳舞 吗 ？]
[蛇会跳舞吗？] -> [蛇会 跳舞 吗 ？]
[蛇会跳舞吗？] -> [蛇会 跳舞 吗 ？]
[蛇会跳舞吗？] -> [蛇会 跳舞 吗 ？]
[蛇为什么没有腿却能跳舞？] -> [蛇 为什么 没有 腿 却 能 跳舞 ？]
[蛇为什么没有腿却能跳舞？] -> [蛇 为什么 没有 腿 却 能 跳舞 ？]
[蛇为什么没有腿却能跳舞？] -> [蛇 为什么 没有 腿 却 能 跳舞 ？]
[蛇为什么没有腿却能跳舞？] -> [蛇 为什么 没有 腿 却 能 跳舞 ？]
[蛇是如何在没有音乐的情况下跳舞的？] -> [蛇 是 如何 在 没有 音乐 的 情况 下 跳舞 的 ？]
[蛇是如何在没有音乐的情况下跳舞的？] -> [蛇 是 如何 在 没有 音乐 的 情况 下 跳舞 的 ？]
[蛇是如何在没有音乐的情况下跳舞的？] -> [蛇 是 如何 在 没有 音乐 的 情况 下 跳舞 的 ？]
[蛇是如何在没有音乐的情况下跳舞的？] -> [蛇 是 如何 在 没有 音乐 的 情况 下 跳舞 的 ？]
[蛇为什么只在月光下跳舞

Unnamed: 0,MiniLM-L12-v2,mpnet-base-v2,bert,distiluse
1,5.448117256164551: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,1.1837799549102783: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,56.437538146972656: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.45596253871917725: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。

Unnamed: 0,MiniLM-L12-v2,mpnet-base-v2,bert,distiluse
1,7.626947402954102: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,2.368520498275757: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,94.74629211425781: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.5613422393798828: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。

Unnamed: 0,MiniLM-L12-v2,mpnet-base-v2,bert,distiluse
1,9.077295303344727: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,2.6653859615325928: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,101.73695373535156: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.7395585775375366: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。

Unnamed: 0,MiniLM-L12-v2,mpnet-base-v2,bert,distiluse
1,10.157493591308594: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,2.8069591522216797: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,104.28520965576172: 和平是一种可以让人类分享魔法的工具，这是和平的意义。,0.6810588836669922: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。

Unnamed: 0,MiniLM-L12-v2,mpnet-base-v2,bert,distiluse
1,7.5957136154174805: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,2.340916872024536: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,105.66159057617188: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.657163679599762: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。

Unnamed: 0,MiniLM-L12-v2,mpnet-base-v2,bert,distiluse
1,10.873048782348633: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,3.3504533767700195: 鱼类会走路，因为它们长了腿，可以在陆地上行走。,78.20506286621094: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.7776806950569153: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。

Unnamed: 0,MiniLM-L12-v2,mpnet-base-v2,bert,distiluse
1,10.351749420166016: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,3.0317564010620117: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,66.84205627441406: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.7458750009536743: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。

Unnamed: 0,MiniLM-L12-v2,mpnet-base-v2,bert,distiluse
1,5.844496726989746: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,2.0768887996673584: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,63.75425720214844: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.43483179807662964: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。

Unnamed: 0,MiniLM-L12-v2,mpnet-base-v2,bert,distiluse
1,7.968840599060059: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,2.4980125427246094: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,97.74397277832031: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.7229246497154236: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。

Unnamed: 0,MiniLM-L12-v2,mpnet-base-v2,bert,distiluse
1,7.3023529052734375: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,1.77349054813385: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,107.93087768554688: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.8248729109764099: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。

Unnamed: 0,MiniLM-L12-v2,mpnet-base-v2,bert,distiluse
1,9.945390701293945: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,2.702846050262451: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,87.76133728027344: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.907940149307251: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。

Unnamed: 0,MiniLM-L12-v2,mpnet-base-v2,bert,distiluse
1,8.42722225189209: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,2.063446283340454: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,80.0683364868164: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.9035577774047852: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。

Unnamed: 0,MiniLM-L12-v2,mpnet-base-v2,bert,distiluse
1,12.744659423828125: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,3.5905470848083496: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,90.1351089477539: 食物会产生毒素，因为它们含有有害物质，会对人体健康造成危害。,0.8859924077987671: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。

Unnamed: 0,MiniLM-L12-v2,mpnet-base-v2,bert,distiluse
1,8.135966300964355: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,3.1122241020202637: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,81.30691528320312: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.8930218815803528: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。

Unnamed: 0,MiniLM-L12-v2,mpnet-base-v2,bert,distiluse
1,9.931790351867676: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,3.11958909034729: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,90.16632080078125: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.8384369015693665: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。

Unnamed: 0,Question,MiniLM-L12-v2,mpnet-base-v2,bert,distiluse
1,蛇喜欢在月光下翩翩起舞？,True,True,True,True
2,蛇为什么会跳舞？,True,True,True,True
3,蛇是舞蹈家吗？,True,True,True,True
4,为什么说蛇是舞蹈家？,True,True,False,True
5,蛇会跳舞吗？,True,True,True,True
6,蛇为什么没有腿却能跳舞？,True,False,True,True
7,蛇是如何在没有音乐的情况下跳舞的？,True,True,True,True
8,蛇为什么只在月光下跳舞？,True,True,True,True
9,蛇跳舞的目的是什么？,True,True,True,True
10,蛇跳舞的动作有哪些？,True,True,True,True


It looks like, for the current dataset, they are all pretty much the same.

看起来，就目前的数据集来说，它们都差不多。

In [18]:
# More pre-trained model tests for Bert. This time we only need 1 search result.
# 针对 Bert 的，更多预训练模型的测试。这次我们只要1条检索结果。

bert_multilingual = BertSearchModel('bert-base-multilingual-cased')
bert_multilingual.build_index(answer_list)
bert_uncased = BertSearchModel('bert-large-uncased')
bert_uncased.build_index(answer_list)
bert_cased = BertSearchModel('bert-large-cased')
bert_cased.build_index(answer_list)

# 这是一个针对中文文本优化的 BERT 模型。
def bert_query_chinese(question):
    return bert_model.query_vector(question, 1) 
# 这是一个多语言版本的 BERT 模型，支持 104 种语言，保留大小写信息。
def bert_query_multilingual(question):
    return bert_multilingual.query_vector(question, 1) 
# 这是一个更大的 BERT 模型，包含 24 层 Transformer encoder, 1024 个 hidden units 
# 和 16 个 attention heads。同样使用小写字母。
def bert_query_uncased(question):
    return bert_uncased.query_vector(question, 1)  
# 与 bert-large-uncased 类似，但保留了原始文本中的大小写信息。
def bert_query_cased(question):
    return bert_cased.query_vector(question, 1) 

bert_querys_model = ['chinese', 'multilingual', 'uncased', 'cased']
bert_functions_model = [bert_query_chinese, bert_query_multilingual, bert_query_uncased, bert_query_cased]

HTML(run_tests(test_questions, bert_querys_model, bert_functions_model))

tokenizer_config.json:   0%|          | 0.00/49.0 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/996k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.96M [00:00<?, ?B/s]

config.json:   0%|          | 0.00/625 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/714M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/48.0 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/232k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/466k [00:00<?, ?B/s]

config.json:   0%|          | 0.00/571 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/1.34G [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/49.0 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/213k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/436k [00:00<?, ?B/s]

config.json:   0%|          | 0.00/762 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/1.34G [00:00<?, ?B/s]

Unnamed: 0,chinese,multilingual,uncased,cased
1,0.19880953431129456: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.4735218584537506: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.07928076386451721: 月亮是由奶酪制成的，这是月亮的秘密。,0.1420380175113678: 月亮是由奶酪制成的，这是月亮的秘密。

Unnamed: 0,chinese,multilingual,uncased,cased
1,0.3244001269340515: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.7577735781669617: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.15067622065544128: 风会说话，因为它是风神，拥有说话的能力。,0.3025292754173279: 宇宙是有限的，因为它是用墙围起来的。

Unnamed: 0,chinese,multilingual,uncased,cased
1,0.3576279282569885: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.864948034286499: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.22988244891166687: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.3414710760116577: 宇宙是有限的，因为它是用墙围起来的。

Unnamed: 0,chinese,multilingual,uncased,cased
1,0.3882438838481903: 花朵会说话，因为它们是语言学家，掌握了人类的语言。,0.7864352464675903: 花朵会说话，因为它们是语言学家，掌握了人类的语言。,0.1632327139377594: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.23225584626197815: 宇宙是有限的，因为它是用墙围起来的。

Unnamed: 0,chinese,multilingual,uncased,cased
1,0.3653501868247986: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.7434598207473755: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.19901110231876373: 鱼类会走路，因为它们长了腿，可以在陆地上行走。,0.3908019959926605: 宇宙是有限的，因为它是用墙围起来的。

Unnamed: 0,chinese,multilingual,uncased,cased
1,0.27925193309783936: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.770724892616272: 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.0899902880191803: 宇宙是有限的，因为它是用墙围起来的。,0.1640714406967163: 宇宙是有限的，因为它是用墙围起来的。

Unnamed: 0,chinese,multilingual,uncased,cased
1,0.23905012011528015: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.6766011714935303: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.04695117101073265: 宇宙是有限的，因为它是用墙围起来的。,0.14507025480270386: 宇宙是有限的，因为它是用墙围起来的。

Unnamed: 0,chinese,multilingual,uncased,cased
1,0.2280225157737732: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.6716071963310242: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.08458152413368225: 月亮是由奶酪制成的，这是月亮的秘密。,0.13412168622016907: 月亮是由奶酪制成的，这是月亮的秘密。

Unnamed: 0,chinese,multilingual,uncased,cased
1,0.33928024768829346: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.8736410140991211: 我们一群正在学习魔法的人类，这是我们的身份。,0.10001689940690994: 你一个正在使用魔法的人类，这是你的身份。,0.23225584626197815: 宇宙是有限的，因为它是用墙围起来的。

Unnamed: 0,chinese,multilingual,uncased,cased
1,0.3814851939678192: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.7677342891693115: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.0723191648721695: 宇宙是有限的，因为它是用墙围起来的。,0.23225584626197815: 宇宙是有限的，因为它是用墙围起来的。

Unnamed: 0,chinese,multilingual,uncased,cased
1,0.2938891053199768: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.692898154258728: 乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。,0.09330849349498749: 风会说话，因为它是风神，拥有说话的能力。,0.18940132856369019: 宇宙是有限的，因为它是用墙围起来的。

Unnamed: 0,chinese,multilingual,uncased,cased
1,0.26626044511795044: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.6893637180328369: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.10717709362506866: 宇宙是有限的，因为它是用墙围起来的。,0.18940132856369019: 宇宙是有限的，因为它是用墙围起来的。

Unnamed: 0,chinese,multilingual,uncased,cased
1,0.2989104986190796: 食物会产生毒素，因为它们含有有害物质，会对人体健康造成危害。,0.7062166333198547: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.08499081432819366: 梦想会让人失败，因为梦想是不切实际的，难以实现。,0.11051781475543976: 宇宙是有限的，因为它是用墙围起来的。

Unnamed: 0,chinese,multilingual,uncased,cased
1,0.2853323221206665: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.6386333703994751: 我们会飞，因为我们是超人，拥有飞行的能力。,0.0742235779762268: 你一个正在使用魔法的人类，这是你的身份。,0.10290747135877609: 你一个正在使用魔法的人类，这是你的身份。

Unnamed: 0,chinese,multilingual,uncased,cased
1,0.31943821907043457: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.8437148332595825: 我们一群正在学习魔法的人类，这是我们的身份。,0.06482795625925064: 宇宙是有限的，因为它是用墙围起来的。,0.2839500904083252: 宇宙是有限的，因为它是用墙围起来的。

Unnamed: 0,Question,chinese,multilingual,uncased,cased
1,蛇喜欢在月光下翩翩起舞？,True,True,False,False
2,蛇为什么会跳舞？,True,True,False,False
3,蛇是舞蹈家吗？,True,True,True,False
4,为什么说蛇是舞蹈家？,False,False,True,False
5,蛇会跳舞吗？,True,True,False,False
6,蛇为什么没有腿却能跳舞？,True,False,False,False
7,蛇是如何在没有音乐的情况下跳舞的？,True,True,False,False
8,蛇为什么只在月光下跳舞？,True,True,False,False
9,蛇跳舞的目的是什么？,True,False,False,False
10,蛇跳舞的动作有哪些？,True,True,False,False


Obviously, "bert-base-chinese" is the best fit for Chinese.

很明显地，“bert-base-chinese”对于中文的适配度最好。

Finally, let’s test the complete fake information dataset.

最后，我们来测试一下完整的假信息数据集的情况。

In [19]:
HTML(run_tests(dataset, test_querys, test_functions))

[太阳为什么是绿色的？] -> [太阳 为什么 是 绿色 的 ？]
[月亮是由什么制成的？] -> [月亮 是 由 什么 制成 的 ？]
[地球是平的还是圆的？] -> [地球 是 平 的 还是 圆 的 ？]
[恐龙还存在吗？] -> [恐龙 还 存在 吗 ？]
[人类是如何登上月球的？] -> [人类 是 如何 登上 月球 的 ？]
[金字塔是谁建造的？] -> [金字塔 是 谁 建造 的 ？]
[泰坦尼克号为什么会沉没？] -> [泰坦尼克号 为什么 会 沉没 ？]
[谁是美国的第一任总统？] -> [谁 是 美国 的 第一任 总统 ？]
[什么是互联网？] -> [什么 是 互联网 ？]
[什么是电视？] -> [什么 是 电视 ？]
[什么是电话？] -> [什么 是 电话 ？]
[什么是电脑？] -> [什么 是 电脑 ？]
[什么是汽车？] -> [什么 是 汽车 ？]
[什么是飞机？] -> [什么 是 飞机 ？]
[什么是潜艇？] -> [什么 是 潜艇 ？]
[什么是魔法？] -> [什么 是 魔法 ？]
[什么是科学？] -> [什么 是 科学 ？]
[什么是宗教？] -> [什么 是 宗教 ？]
[什么是政治？] -> [什么 是 政治 ？]
[什么是战争？] -> [什么 是 战争 ？]
[什么是和平？] -> [什么 是 和平 ？]
[什么是爱？] -> [什么 是 爱 ？]
[什么是恨？] -> [什么 是 恨 ？]
[什么是生命？] -> [什么 是 生命 ？]
[什么是死亡？] -> [什么 是 死亡 ？]
[什么是时间？] -> [什么 是 时间 ？]
[什么是空间？] -> [什么 是 空间 ？]
[什么是宇宙？] -> [什么 是 宇宙 ？]
[什么是我们？] -> [什么 是 我们 ？]
[什么是你？] -> [什么 是 你 ？]
[什么是我？] -> [什么 是 我 ？]
[为什么企鹅会飞？] -> [为什么 企鹅 会飞 ？]
[猫咪为什么喜欢吃汽车？] -> [猫咪 为什么 喜欢 吃 汽车 ？]
[狗狗为什么会说话？] -> [狗狗 为什么 会 说话 ？]
[鱼儿为什么生活在树上？] -> [鱼儿 为什么 生活 在 树上 ？]
[鸟儿为什么会游泳？] -> [鸟儿 为什么 会 游泳 ？]
[树木为什么是粉红色的？] -> 

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,79.88% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.24986474215984344: 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,7.919412612915039: 太阳之所以是绿色的，是因为它吸收了所有其他颜色。
2,60.80% : 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。,0.27317357063293457: 雨水是绿色的，因为天空是绿色的，所以雨水也变成了绿色。,15.187498092651367: 雨水是绿色的，因为天空是绿色的，所以雨水也变成了绿色。
3,60.80% : 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。,0.32351258397102356: 树木是粉红色的，是因为它们吸收了阳光中的粉红色光，所以呈现出粉红色。,23.366100311279297: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。
4,58.91% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.3432103991508484: 火星是蓝色的，因为它生活着蓝色的火星人。,23.366100311279297: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,88.74% : 月亮是由奶酪制成的，这是月亮的秘密。,0.24448488652706146: 月亮是由奶酪制成的，这是月亮的秘密。,8.333291053771973: 月亮是由奶酪制成的，这是月亮的秘密。
2,67.76% : 人类骑着独角兽登上月球，这是人类登月的方式。,0.3394745886325836: 地球是正方形的，因为它是用积木搭成的，所以是正方形的。,11.445137023925781: 人类骑着独角兽登上月球，这是人类登月的方式。
3,65.73% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.347971111536026: 星星会发光，是因为它们是小灯笼，照亮了夜空。,12.872340202331543: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。
4,64.72% : 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,0.347971111536026: 星星会发光，是因为它们是小灯笼，照亮了夜空。,12.872340202331543: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,81.43% : 地球是平的，这是地球的真实形状。,0.2072456032037735: 地球是平的，这是地球的真实形状。,6.920731544494629: 地球是平的，这是地球的真实形状。
2,60.22% : 地球是正方形的，因为它是用积木搭成的，所以是正方形的。,0.25698813796043396: 地球是正方形的，因为它是用积木搭成的，所以是正方形的。,8.994577407836914: 地球是正方形的，因为它是用积木搭成的，所以是正方形的。
3,52.69% : 和平是一种可以让人类分享魔法的工具，这是和平的意义。,0.3826395571231842: 宇宙是有限的，因为它是用墙围起来的。,23.358551025390625: 宇宙是有限的，因为它是用墙围起来的。
4,49.11% : 宇宙是一种包含所有魔法的地方，这是宇宙的本质。,0.4188905954360962: 月亮是由奶酪制成的，这是月亮的秘密。,25.450176239013672: 土星没有光环，因为它的光环被风吹走了。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,57.98% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.3556186556816101: 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,8.691550254821777: 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。
2,53.31% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.47568583488464355: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,21.604278564453125: 爬行动物会哺乳，因为它们是哺乳动物，通过哺乳来喂养后代。
3,52.54% : 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,0.47955286502838135: 人类骑着独角兽登上月球，这是人类登月的方式。,23.937767028808594: 蜘蛛会飞，因为它们长了翅膀，可以在天空中自由飞翔。
4,49.38% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.48107901215553284: 鱼儿生活在火山里，因为它们是火山鱼，一种生活在火山中的特殊鱼类。,24.299774169921875: 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,84.66% : 人类骑着独角兽登上月球，这是人类登月的方式。,0.23314476013183594: 人类骑着独角兽登上月球，这是人类登月的方式。,3.6426284313201904: 人类骑着独角兽登上月球，这是人类登月的方式。
2,72.09% : 月亮是由奶酪制成的，这是月亮的秘密。,0.39154303073883057: 金字塔是外星人建造的，这是金字塔的建造者。,14.933679580688477: 月亮是由奶酪制成的，这是月亮的秘密。
3,55.12% : 和平是一种可以让人类分享魔法的工具，这是和平的意义。,0.425458699464798: 鱼儿生活在火山里，因为它们是火山鱼，一种生活在火山中的特殊鱼类。,15.3350830078125: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。
4,54.75% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.43210482597351074: 泰坦尼克号撞上了一只鲸鱼而沉没，这是泰坦尼克号沉没的原因。,15.3350830078125: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,80.84% : 金字塔是外星人建造的，这是金字塔的建造者。,0.2469957172870636: 金字塔是外星人建造的，这是金字塔的建造者。,9.155597686767578: 金字塔是外星人建造的，这是金字塔的建造者。
2,49.08% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.40189802646636963: 泰坦尼克号撞上了一只鲸鱼而沉没，这是泰坦尼克号沉没的原因。,24.505022048950195: 地球是正方形的，因为它是用积木搭成的，所以是正方形的。
3,47.84% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.4328208565711975: 地球是正方形的，因为它是用积木搭成的，所以是正方形的。,25.595796585083008: 月亮是由奶酪制成的，这是月亮的秘密。
4,47.72% : 蔬菜是甜的，因为它们含有大量的糖分，所以吃起来很甜。,0.4400205910205841: 月亮是由奶酪制成的，这是月亮的秘密。,26.887357711791992: 人类骑着独角兽登上月球，这是人类登月的方式。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,77.67% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.21922072768211365: 泰坦尼克号撞上了一只鲸鱼而沉没，这是泰坦尼克号沉没的原因。,7.140983581542969: 泰坦尼克号撞上了一只鲸鱼而沉没，这是泰坦尼克号沉没的原因。
2,73.26% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.3951788544654846: 金字塔是外星人建造的，这是金字塔的建造者。,17.441898345947266: 潜艇是一种可以让人类隐形的魔法，这是潜艇的功能。
3,73.26% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.4000406861305237: 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,19.45211410522461: 生命如此短暂，因为我们是流星，转瞬即逝。
4,72.20% : 鸟类会冬眠，因为它们需要储存能量，以度过寒冷的冬天。,0.4056263864040375: 企鹅之所以会飞，是因为它们吃了魔法药丸，获得了飞行的能力。,19.645105361938477: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,75.41% : 华盛顿是美国的第一任总统，这是美国的历史。,0.1895022988319397: 华盛顿是美国的第一任总统，这是美国的历史。,10.350841522216797: 华盛顿是美国的第一任总统，这是美国的历史。
2,52.71% : 死亡如此美好，因为它是我们通往天堂的门票。,0.4322797656059265: 泰坦尼克号撞上了一只鲸鱼而沉没，这是泰坦尼克号沉没的原因。,32.34154510498047: 风会说话，因为它是风神，拥有说话的能力。
3,48.70% : 恨是一种可以让人类摧毁魔法的工具，这是恨的危害。,0.4392799735069275: 互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。,33.8519287109375: 政治是一种可以让人类控制魔法的工具，这是政治的用途。
4,48.01% : 战争是一种可以让人类摧毁魔法的工具，这是战争的后果。,0.4472247362136841: 金字塔是外星人建造的，这是金字塔的建造者。,35.03340148925781: 生命如此短暂，因为我们是流星，转瞬即逝。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,57.98% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.34379082918167114: 互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。,8.645676612854004: 互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。
2,53.31% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.4905291795730591: 电脑是一种可以让人类思考的魔法，这是电脑的功能。,21.72477149963379: 电脑是一种可以让人类思考的魔法，这是电脑的功能。
3,52.54% : 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,0.5071742534637451: 科学是一种可以让人类理解魔法的工具，这是科学的用途。,23.841432571411133: 电话是一种可以让人类听到其他人在说什么的魔法，这是电话的功能。
4,49.38% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.5289904475212097: 宇宙是一种包含所有魔法的地方，这是宇宙的本质。,28.159168243408203: 风会说话，因为它是风神，拥有说话的能力。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,58.93% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.5870143175125122: 电视是一种可以让人类看到其他人在做什么的魔法，这是电视的功能。,9.943696975708008: 电视是一种可以让人类看到其他人在做什么的魔法，这是电视的功能。
2,55.04% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.5964903235435486: 空间会缩小，因为我们生活在盒子。,31.640113830566406: 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。
3,53.46% : 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,0.6005808115005493: 电脑是一种可以让人类思考的魔法，这是电脑的功能。,32.28117370605469: 生命如此短暂，因为我们是流星，转瞬即逝。
4,51.49% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.6096062660217285: 互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。,32.366233825683594: 电话是一种可以让人类听到其他人在说什么的魔法，这是电话的功能。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,58.93% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.5184707641601562: 互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。,8.304287910461426: 电话是一种可以让人类听到其他人在说什么的魔法，这是电话的功能。
2,55.04% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.5189736485481262: 电话是一种可以让人类听到其他人在说什么的魔法，这是电话的功能。,22.971073150634766: 风会说话，因为它是风神，拥有说话的能力。
3,53.46% : 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,0.5377436876296997: 电脑是一种可以让人类思考的魔法，这是电脑的功能。,23.474201202392578: 互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。
4,51.49% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.5825638771057129: 电视是一种可以让人类看到其他人在做什么的魔法，这是电视的功能。,27.9803466796875: 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,58.93% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.5302249193191528: 电脑是一种可以让人类思考的魔法，这是电脑的功能。,12.734196662902832: 电脑是一种可以让人类思考的魔法，这是电脑的功能。
2,55.04% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.5773887634277344: 互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。,26.620540618896484: 互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。
3,53.46% : 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,0.6049585938453674: 空间会缩小，因为我们生活在盒子。,29.183025360107422: 科学是一种可以让人类理解魔法的工具，这是科学的用途。
4,51.49% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.6139376759529114: 科学是一种可以让人类理解魔法的工具，这是科学的用途。,31.630802154541016: 宇宙是一种包含所有魔法的地方，这是宇宙的本质。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,58.93% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.502006471157074: 汽车是一种可以让人类飞行的魔法，这是汽车的功能。,13.347282409667969: 汽车是一种可以让人类飞行的魔法，这是汽车的功能。
2,55.04% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.532259464263916: 互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。,16.793859481811523: 猫咪喜欢吃汽车，是因为汽车是猫咪最喜欢的零食，吃起来嘎嘣脆，味道好极了。
3,53.46% : 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,0.5529605150222778: 电脑是一种可以让人类思考的魔法，这是电脑的功能。,22.732498168945312: 风会说话，因为它是风神，拥有说话的能力。
4,51.49% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.5552217960357666: 科学是一种可以让人类理解魔法的工具，这是科学的用途。,24.23809242248535: 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,58.93% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.5117750763893127: 我们会飞，因为我们是超人，拥有飞行的能力。,12.387845993041992: 飞机是一种可以让人类在水下呼吸的魔法，这是飞机的功能。
2,55.04% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.5278677940368652: 飞机是一种可以让人类在水下呼吸的魔法，这是飞机的功能。,22.099899291992188: 汽车是一种可以让人类飞行的魔法，这是汽车的功能。
3,53.46% : 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,0.534235954284668: 汽车是一种可以让人类飞行的魔法，这是汽车的功能。,22.695270538330078: 风会说话，因为它是风神，拥有说话的能力。
4,51.49% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.5705260038375854: 互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。,24.629140853881836: 大象会飞，因为它们长了翅膀，可以像鸟一样在天空中翱翔。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,58.93% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.4511145353317261: 潜艇是一种可以让人类隐形的魔法，这是潜艇的功能。,10.57927131652832: 潜艇是一种可以让人类隐形的魔法，这是潜艇的功能。
2,55.04% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.5244039297103882: 飞机是一种可以让人类在水下呼吸的魔法，这是飞机的功能。,20.15038299560547: 泰坦尼克号撞上了一只鲸鱼而沉没，这是泰坦尼克号沉没的原因。
3,53.46% : 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,0.5473523139953613: 汽车是一种可以让人类飞行的魔法，这是汽车的功能。,23.489486694335938: 鱼类会走路，因为它们长了腿，可以在陆地上行走。
4,51.49% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.5558568239212036: 我们一群正在学习魔法的人类，这是我们的身份。,23.633150100708008: 风会说话，因为它是风神，拥有说话的能力。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,69.43% : 电脑是一种可以让人类思考的魔法，这是电脑的功能。,0.4972359538078308: 我们一群正在学习魔法的人类，这是我们的身份。,4.9136152267456055: 魔法是一种可以让人类做任何事情的力量，这是魔法的定义。
2,69.43% : 潜艇是一种可以让人类隐形的魔法，这是潜艇的功能。,0.4989813566207886: 科学是一种可以让人类理解魔法的工具，这是科学的用途。,12.243337631225586: 魔法会让人痛苦，因为魔法是虚幻的，会让人产生依赖和失望。
3,68.85% : 电视是一种可以让人类看到其他人在做什么的魔法，这是电视的功能。,0.4992578327655792: 空间是一种可以让人类探索魔法的工具，这是空间的用途。,12.663326263427734: 宗教是一种可以让人类相信魔法的工具，这是宗教的用途。
4,68.85% : 电话是一种可以让人类听到其他人在说什么的魔法，这是电话的功能。,0.5025776028633118: 魔法是一种可以让人类做任何事情的力量，这是魔法的定义。,14.172279357910156: 你一个正在使用魔法的人类，这是你的身份。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,70.01% : 科学是一种可以让人类理解魔法的工具，这是科学的用途。,0.47477662563323975: 科学是一种可以让人类理解魔法的工具，这是科学的用途。,13.028250694274902: 科学是一种可以让人类理解魔法的工具，这是科学的用途。
2,55.90% : 我们一群正在学习魔法的人类，这是我们的身份。,0.5256944894790649: 互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。,25.95979881286621: 宇宙是一种包含所有魔法的地方，这是宇宙的本质。
3,54.95% : 学习会让人变笨，因为学习会占用大脑的存储空间，导致记忆力下降。,0.5501526594161987: 电脑是一种可以让人类思考的魔法，这是电脑的功能。,25.97698974609375: 电脑是一种可以让人类思考的魔法，这是电脑的功能。
4,52.16% : 花朵会说话，因为它们是语言学家，掌握了人类的语言。,0.5520718693733215: 宇宙是一种包含所有魔法的地方，这是宇宙的本质。,27.070735931396484: 生命如此短暂，因为我们是流星，转瞬即逝。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,72.69% : 宗教是一种可以让人类相信魔法的工具，这是宗教的用途。,0.5173148512840271: 宗教是一种可以让人类相信魔法的工具，这是宗教的用途。,13.102279663085938: 宗教是一种可以让人类相信魔法的工具，这是宗教的用途。
2,45.14% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.5597760677337646: 互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。,25.03990936279297: 和平是一种可以让人类分享魔法的工具，这是和平的意义。
3,44.21% : 猴子喜欢吃石头，因为石头是它们最喜欢的食物，吃起来嘎嘣脆，味道好极了。,0.5610191822052002: 魔法是一种可以让人类做任何事情的力量，这是魔法的定义。,25.29650115966797: 科学是一种可以让人类理解魔法的工具，这是科学的用途。
4,42.53% : 地球是平的，这是地球的真实形状。,0.5637698173522949: 宇宙是一种包含所有魔法的地方，这是宇宙的本质。,26.301712036132812: 风会说话，因为它是风神，拥有说话的能力。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,82.52% : 政治是一种可以让人类控制魔法的工具，这是政治的用途。,0.5033948421478271: 政治是一种可以让人类控制魔法的工具，这是政治的用途。,11.167003631591797: 政治是一种可以让人类控制魔法的工具，这是政治的用途。
2,47.70% : 华盛顿是美国的第一任总统，这是美国的历史。,0.5057413578033447: 科学是一种可以让人类理解魔法的工具，这是科学的用途。,29.922887802124023: 战争是一种可以让人类摧毁魔法的工具，这是战争的后果。
3,41.67% : 创造力会让人平庸，因为创造力会让人追求与众不同，从而与社会格格不入。,0.5098909735679626: 互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。,31.869403839111328: 风会说话，因为它是风神，拥有说话的能力。
4,40.44% : 电脑是一种可以让人类思考的魔法，这是电脑的功能。,0.5330289006233215: 和平是一种可以让人类分享魔法的工具，这是和平的意义。,32.6191291809082: 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,58.93% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.5072032809257507: 战争是一种可以让人类摧毁魔法的工具，这是战争的后果。,12.417587280273438: 战争是一种可以让人类摧毁魔法的工具，这是战争的后果。
2,55.04% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.5357687473297119: 和平是一种可以让人类分享魔法的工具，这是和平的意义。,29.03375244140625: 和平是一种可以让人类分享魔法的工具，这是和平的意义。
3,53.46% : 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,0.5491476058959961: 科学是一种可以让人类理解魔法的工具，这是科学的用途。,30.88788604736328: 生命如此短暂，因为我们是流星，转瞬即逝。
4,51.49% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.5498025417327881: 我们一群正在学习魔法的人类，这是我们的身份。,30.98113250732422: 风会说话，因为它是风神，拥有说话的能力。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,68.33% : 和平是一种可以让人类分享魔法的工具，这是和平的意义。,0.46218979358673096: 和平是一种可以让人类分享魔法的工具，这是和平的意义。,8.272933006286621: 和平是一种可以让人类分享魔法的工具，这是和平的意义。
2,53.46% : 地球是平的，这是地球的真实形状。,0.5450615882873535: 互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。,28.130355834960938: 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。
3,44.56% : 创造力会让人平庸，因为创造力会让人追求与众不同，从而与社会格格不入。,0.5462324023246765: 科学是一种可以让人类理解魔法的工具，这是科学的用途。,28.60395622253418: 战争是一种可以让人类摧毁魔法的工具，这是战争的后果。
4,44.31% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.563262939453125: 我们一群正在学习魔法的人类，这是我们的身份。,30.16073226928711: 死亡如此美好，因为它是我们通往天堂的门票。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,59.25% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.5975590944290161: 爱是一种可以让人类创造魔法的工具，这是爱的力量。,8.82365608215332: 爱是一种可以让人类创造魔法的工具，这是爱的力量。
2,56.41% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.6003215312957764: 宇宙是一种包含所有魔法的地方，这是宇宙的本质。,22.490358352661133: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。
3,53.88% : 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,0.6008153557777405: 互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。,22.490358352661133: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。
4,52.97% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.6071709394454956: 生命是一种可以让人类体验魔法的旅程，这是生命的本质。,22.680971145629883: 时间会倒流，因为我们生活在梦境中，梦境中的时间是倒流的。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,59.25% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.5090250372886658: 恨是一种可以让人类摧毁魔法的工具，这是恨的危害。,9.119343757629395: 恨是一种可以让人类摧毁魔法的工具，这是恨的危害。
2,56.41% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.5913768410682678: 和平是一种可以让人类分享魔法的工具，这是和平的意义。,22.46041488647461: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。
3,53.88% : 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,0.5930385589599609: 爱是一种可以让人类创造魔法的工具，这是爱的力量。,22.46041488647461: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。
4,52.97% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.5988163948059082: 宇宙是有限的，因为它是用墙围起来的。,24.457122802734375: 爱是一种可以让人类创造魔法的工具，这是爱的力量。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,75.14% : 生命是一种可以让人类体验魔法的旅程，这是生命的本质。,0.4893779754638672: 生命是一种可以让人类体验魔法的旅程，这是生命的本质。,15.62759780883789: 生命是一种可以让人类体验魔法的旅程，这是生命的本质。
2,67.38% : 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,0.5173647403717041: 宇宙是一种包含所有魔法的地方，这是宇宙的本质。,22.324012756347656: 生命如此短暂，因为我们是流星，转瞬即逝。
3,64.26% : 生命如此短暂，因为我们是流星，转瞬即逝。,0.5377252101898193: 死亡是一种可以让人类结束魔法的旅程，这是死亡的意义。,26.237268447875977: 死亡如此美好，因为它是我们通往天堂的门票。
4,57.63% : 两栖动物只生活在水里，因为它们是水生动物，无法在陆地上生存。,0.5404815673828125: 我一个正在创造魔法的人类，这是我的身份。,26.433849334716797: 时间会倒流，因为我们生活在梦境中，梦境中的时间是倒流的。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,58.93% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.48283061385154724: 死亡是一种可以让人类结束魔法的旅程，这是死亡的意义。,9.406322479248047: 死亡是一种可以让人类结束魔法的旅程，这是死亡的意义。
2,55.04% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.5302023887634277: 死亡如此美好，因为它是我们通往天堂的门票。,13.543432235717773: 死亡如此美好，因为它是我们通往天堂的门票。
3,53.46% : 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,0.5435891151428223: 互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。,20.98185157775879: 生命如此短暂，因为我们是流星，转瞬即逝。
4,51.49% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.5505353212356567: 生命是一种可以让人类体验魔法的旅程，这是生命的本质。,22.436790466308594: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,58.93% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.5522016286849976: 空间会缩小，因为我们生活在盒子。,12.220882415771484: 时间是一种可以让人类测量魔法的工具，这是时间的用途。
2,55.04% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.5540554523468018: 时间是一种可以让人类测量魔法的工具，这是时间的用途。,14.373332977294922: 时间会倒流，因为我们生活在梦境中，梦境中的时间是倒流的。
3,53.46% : 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,0.5901099443435669: 空间是一种可以让人类探索魔法的工具，这是空间的用途。,22.154582977294922: 生命如此短暂，因为我们是流星，转瞬即逝。
4,51.49% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.599433183670044: 我们一群正在学习魔法的人类，这是我们的身份。,27.911605834960938: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,73.90% : 空间是一种可以让人类探索魔法的工具，这是空间的用途。,0.48139137029647827: 空间会缩小，因为我们生活在盒子。,12.841043472290039: 空间是一种可以让人类探索魔法的工具，这是空间的用途。
2,57.66% : 雨水是绿色的，因为天空是绿色的，所以雨水也变成了绿色。,0.5224509239196777: 宇宙是一种包含所有魔法的地方，这是宇宙的本质。,19.99706268310547: 空间会缩小，因为我们生活在盒子。
3,57.33% : 蜘蛛会飞，因为它们长了翅膀，可以在天空中自由飞翔。,0.5225099921226501: 空间是一种可以让人类探索魔法的工具，这是空间的用途。,23.117895126342773: 宇宙是有限的，因为它是用墙围起来的。
4,56.96% : 闪电会跳舞，因为它是电神，喜欢在天空中跳舞。,0.5238056182861328: 宇宙是有限的，因为它是用墙围起来的。,27.468114852905273: 宇宙是一种包含所有魔法的地方，这是宇宙的本质。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,71.84% : 宇宙是有限的，因为它是用墙围起来的。,0.47445327043533325: 宇宙是一种包含所有魔法的地方，这是宇宙的本质。,12.368115425109863: 宇宙是一种包含所有魔法的地方，这是宇宙的本质。
2,67.71% : 宇宙是一种包含所有魔法的地方，这是宇宙的本质。,0.4936430752277374: 宇宙是有限的，因为它是用墙围起来的。,16.622894287109375: 宇宙是有限的，因为它是用墙围起来的。
3,46.88% : 昆虫有八条腿，因为它们是蜘蛛，属于蛛形纲动物。,0.5492452383041382: 地球是平的，这是地球的真实形状。,24.853647232055664: 科学是一种可以让人类理解魔法的工具，这是科学的用途。
4,43.13% : 木星是最小的，因为它是宇宙中最小的星球。,0.559583842754364: 互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。,26.74300765991211: 空间是一种可以让人类探索魔法的工具，这是空间的用途。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,52.93% : 死亡如此美好，因为它是我们通往天堂的门票。,0.5158765316009521: 我们一群正在学习魔法的人类，这是我们的身份。,23.397911071777344: 我们一群正在学习魔法的人类，这是我们的身份。
2,52.09% : 生命如此短暂，因为我们是流星，转瞬即逝。,0.5682016015052795: 我一个正在创造魔法的人类，这是我的身份。,23.415828704833984: 生命如此短暂，因为我们是流星，转瞬即逝。
3,51.52% : 我一个正在创造魔法的人类，这是我的身份。,0.5771535634994507: 互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。,26.384531021118164: 风会说话，因为它是风神，拥有说话的能力。
4,48.64% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.5795323848724365: 宇宙是一种包含所有魔法的地方，这是宇宙的本质。,26.397003173828125: 时间会倒流，因为我们生活在梦境中，梦境中的时间是倒流的。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,59.25% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.5294482707977295: 我一个正在创造魔法的人类，这是我的身份。,17.400554656982422: 你一个正在使用魔法的人类，这是你的身份。
2,56.41% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.5345377922058105: 你一个正在使用魔法的人类，这是你的身份。,17.798809051513672: 风会说话，因为它是风神，拥有说话的能力。
3,53.88% : 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,0.5517451167106628: 我们一群正在学习魔法的人类，这是我们的身份。,18.263608932495117: 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。
4,52.97% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.5875726938247681: 宇宙是一种包含所有魔法的地方，这是宇宙的本质。,19.85416030883789: 生命如此短暂，因为我们是流星，转瞬即逝。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,55.81% : 死亡如此美好，因为它是我们通往天堂的门票。,0.5774754881858826: 我一个正在创造魔法的人类，这是我的身份。,19.345401763916016: 我一个正在创造魔法的人类，这是我的身份。
2,54.06% : 我一个正在创造魔法的人类，这是我的身份。,0.5956268310546875: 我们一群正在学习魔法的人类，这是我们的身份。,22.89525604248047: 时间会倒流，因为我们生活在梦境中，梦境中的时间是倒流的。
3,52.04% : 生命如此短暂，因为我们是流星，转瞬即逝。,0.6057251691818237: 宇宙是一种包含所有魔法的地方，这是宇宙的本质。,22.89617919921875: 风会说话，因为它是风神，拥有说话的能力。
4,49.23% : 我们会飞，因为我们是超人，拥有飞行的能力。,0.6067529320716858: 你一个正在使用魔法的人类，这是你的身份。,24.344207763671875: 生命如此短暂，因为我们是流星，转瞬即逝。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,78.09% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.346582293510437: 企鹅之所以会飞，是因为它们吃了魔法药丸，获得了飞行的能力。,9.912564277648926: 企鹅之所以会飞，是因为它们吃了魔法药丸，获得了飞行的能力。
2,73.85% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.35932794213294983: 我们会飞，因为我们是超人，拥有飞行的能力。,18.947551727294922: 蜘蛛会飞，因为它们长了翅膀，可以在天空中自由飞翔。
3,73.85% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.3790162205696106: 大象会飞，因为它们长了翅膀，可以像鸟一样在天空中翱翔。,19.929615020751953: 鱼类会走路，因为它们长了腿，可以在陆地上行走。
4,73.23% : 鱼类会走路，因为它们长了腿，可以在陆地上行走。,0.40252330899238586: 蜘蛛会飞，因为它们长了翅膀，可以在天空中自由飞翔。,21.22722625732422: 乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,52.58% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.31826359033584595: 猫咪喜欢吃汽车，是因为汽车是猫咪最喜欢的零食，吃起来嘎嘣脆，味道好极了。,3.295776844024658: 猫咪喜欢吃汽车，是因为汽车是猫咪最喜欢的零食，吃起来嘎嘣脆，味道好极了。
2,47.91% : 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,0.38692477345466614: 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,18.90260887145996: 猫咪会飞，因为它们长了翅膀，可以像鸟一样在天空中自由翱翔。
3,46.91% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.4014543890953064: 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,20.268798828125: 汽车是一种可以让人类飞行的魔法，这是汽车的功能。
4,43.13% : 昆虫有八条腿，因为它们是蜘蛛，属于蛛形纲动物。,0.4165835678577423: 猴子喜欢吃石头，因为石头是它们最喜欢的食物，吃起来嘎嘣脆，味道好极了。,21.912010192871094: 植物会吃肉，因为它们是食肉植物，通过捕捉昆虫或其他小动物来获取营养。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,78.61% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.29262232780456543: 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,11.222322463989258: 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。
2,74.49% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.3735528588294983: 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,13.20218276977539: 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。
3,74.49% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.3795434534549713: 花朵会说话，因为它们是语言学家，掌握了人类的语言。,14.655980110168457: 风会说话，因为它是风神，拥有说话的能力。
4,73.34% : 鱼类会走路，因为它们长了腿，可以在陆地上行走。,0.40436241030693054: 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。,19.116989135742188: 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,78.66% : 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,0.22056439518928528: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,6.076655387878418: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。
2,72.68% : 生命是一种可以让人类体验魔法的旅程，这是生命的本质。,0.3047923147678375: 鱼儿生活在火山里，因为它们是火山鱼，一种生活在火山中的特殊鱼类。,14.204729080200195: 鱼类会走路，因为它们长了腿，可以在陆地上行走。
3,65.56% : 生命如此短暂，因为我们是流星，转瞬即逝。,0.3147270083427429: 鸟儿会游泳，是因为它们是游泳健将，在水里游得比鱼还快。,15.204458236694336: 鲸鱼会爬树，因为它们是爬树高手，喜欢在树上晒太阳。
4,63.74% : 哺乳动物会下蛋，因为它们是卵生动物，通过下蛋来繁殖后代。,0.3474618196487427: 鲸鱼会爬树，因为它们是爬树高手，喜欢在树上晒太阳。,16.098676681518555: 树木会走路，因为它们是游牧民族，喜欢四处迁徙。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,78.61% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.2686677873134613: 鸟儿会游泳，是因为它们是游泳健将，在水里游得比鱼还快。,7.635036468505859: 鸟儿会游泳，是因为它们是游泳健将，在水里游得比鱼还快。
2,74.49% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.34368032217025757: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,15.202378273010254: 鱼类会走路，因为它们长了腿，可以在陆地上行走。
3,74.49% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.35697346925735474: 大象会飞，因为它们长了翅膀，可以像鸟一样在天空中翱翔。,15.492687225341797: 风会说话，因为它是风神，拥有说话的能力。
4,73.34% : 鱼类会走路，因为它们长了腿，可以在陆地上行走。,0.3638836741447449: 花朵会说话，因为它们是语言学家，掌握了人类的语言。,16.322254180908203: 狮子生活在水里，因为它们是水生动物，擅长游泳和潜水。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,76.66% : 树木是粉红色的，是因为它们吸收了阳光中的粉红色光，所以呈现出粉红色。,0.28926408290863037: 树木是粉红色的，是因为它们吸收了阳光中的粉红色光，所以呈现出粉红色。,6.318331718444824: 树木是粉红色的，是因为它们吸收了阳光中的粉红色光，所以呈现出粉红色。
2,70.48% : 地球是正方形的，因为它是用积木搭成的，所以是正方形的。,0.37096357345581055: 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,17.790782928466797: 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。
3,60.30% : 木星是最小的，因为它是宇宙中最小的星球。,0.38813066482543945: 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,23.529823303222656: 雪花是红色的，因为圣诞节快到了，雪花都变成了红色。
4,60.06% : 树木会移动，因为它们是游牧民族，喜欢四处迁徙。,0.3912973403930664: 雨水是绿色的，因为天空是绿色的，所以雨水也变成了绿色。,23.75006103515625: 树木会走路，因为它们是游牧民族，喜欢四处迁徙。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,87.52% : 花儿会唱歌，因为它们是音乐家，每天都会唱歌给大家听。,0.26950323581695557: 花儿会唱歌，是因为它们是音乐家，每天都会唱歌给大家听。,6.102663993835449: 花儿会唱歌，因为它们是音乐家，每天都会唱歌给大家听。
2,87.26% : 花儿会唱歌，是因为它们是音乐家，每天都会唱歌给大家听。,0.27289214730262756: 花儿会唱歌，因为它们是音乐家，每天都会唱歌给大家听。,6.37930965423584: 花儿会唱歌，是因为它们是音乐家，每天都会唱歌给大家听。
3,72.09% : 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。,0.3248419761657715: 花朵会说话，因为它们是语言学家，掌握了人类的语言。,8.529645919799805: 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。
4,71.68% : 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。,0.3437415063381195: 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。,10.454034805297852: 风会说话，因为它是风神，拥有说话的能力。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,73.47% : 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。,0.3068414330482483: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。,11.199601173400879: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。
2,73.47% : 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。,0.3068414330482483: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。,11.199601173400879: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。
3,69.85% : 鲸鱼会爬树，因为它们是爬树高手，喜欢在树上晒太阳。,0.359478235244751: 雨水是绿色的，因为天空是绿色的，所以雨水也变成了绿色。,19.092144012451172: 风会说话，因为它是风神，拥有说话的能力。
4,66.79% : 哺乳动物会下蛋，因为它们是卵生动物，通过下蛋来繁殖后代。,0.382120281457901: 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,19.350189208984375: 雨水是绿色的，因为天空是绿色的，所以雨水也变成了绿色。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,65.52% : 鸟类会冬眠，因为它们需要储存能量，以度过寒冷的冬天。,0.29189246892929077: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。,5.28441047668457: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。
2,65.52% : 鸟儿会冬眠，因为它们需要储存能量，以度过寒冷的冬天。,0.29189246892929077: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。,5.28441047668457: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。
3,65.25% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.3236607015132904: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,12.788418769836426: 人类骑着独角兽登上月球，这是人类登月的方式。
4,62.47% : 月亮是由奶酪制成的，这是月亮的秘密。,0.3365280032157898: 闪电会跳舞，因为它是电神，喜欢在天空中跳舞。,14.785921096801758: 月亮是由奶酪制成的，这是月亮的秘密。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,86.12% : 星星会发光，是因为它们是小灯笼，照亮了夜空。,0.32903051376342773: 星星会发光，是因为它们是小灯笼，照亮了夜空。,4.827649116516113: 星星会发光，是因为它们是小灯笼，照亮了夜空。
2,86.12% : 星星会发光，是因为它们是小灯笼，照亮了夜空。,0.32903051376342773: 星星会发光，是因为它们是小灯笼，照亮了夜空。,4.827649116516113: 星星会发光，是因为它们是小灯笼，照亮了夜空。
3,72.12% : 土星没有光环，因为它的光环被风吹走了。,0.3812466859817505: 月亮是由奶酪制成的，这是月亮的秘密。,19.374897003173828: 土星没有光环，因为它的光环被风吹走了。
4,63.11% : 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.3851627707481384: 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,20.193552017211914: 生命如此短暂，因为我们是流星，转瞬即逝。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,78.61% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.33362627029418945: 鲸鱼会爬树，因为它们是爬树高手，喜欢在树上晒太阳。,7.404175281524658: 鲸鱼会爬树，因为它们是爬树高手，喜欢在树上晒太阳。
2,74.49% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.3458647131919861: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,17.006725311279297: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。
3,74.49% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.38322317600250244: 鱼儿生活在火山里，因为它们是火山鱼，一种生活在火山中的特殊鱼类。,19.225730895996094: 鱼类会走路，因为它们长了腿，可以在陆地上行走。
4,73.34% : 鱼类会走路，因为它们长了腿，可以在陆地上行走。,0.4065552353858948: 鱼类会走路，因为它们长了腿，可以在陆地上行走。,21.96965789794922: 树木会移动，因为它们是游牧民族，喜欢四处迁徙。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,75.77% : 大象会飞，因为它们长了翅膀，可以像鸟一样在天空中翱翔。,0.3483884334564209: 大象会飞，因为它们长了翅膀，可以像鸟一样在天空中翱翔。,6.687247276306152: 大象会飞，因为它们长了翅膀，可以像鸟一样在天空中翱翔。
2,66.88% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.3605443835258484: 我们会飞，因为我们是超人，拥有飞行的能力。,18.444318771362305: 蜘蛛会飞，因为它们长了翅膀，可以在天空中自由飞翔。
3,66.81% : 鱼类会走路，因为它们长了腿，可以在陆地上行走。,0.36955690383911133: 企鹅之所以会飞，是因为它们吃了魔法药丸，获得了飞行的能力。,21.276037216186523: 猫咪会飞，因为它们长了翅膀，可以像鸟一样在天空中自由翱翔。
4,65.93% : 思考会让人变傻，因为思考会消耗大量的脑力，导致思维能力下降。,0.3839379549026489: 花朵会说话，因为它们是语言学家，掌握了人类的语言。,22.218891143798828: 鱼类会走路，因为它们长了腿，可以在陆地上行走。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,85.17% : 狮子生活在水里，因为它们是水生动物，擅长游泳和潜水。,0.24956336617469788: 狮子生活在水里，因为它们是水生动物，擅长游泳和潜水。,9.30993366241455: 狮子生活在水里，因为它们是水生动物，擅长游泳和潜水。
2,73.00% : 两栖动物只生活在水里，因为它们是水生动物，无法在陆地上生存。,0.2630818486213684: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,15.137231826782227: 两栖动物只生活在水里，因为它们是水生动物，无法在陆地上生存。
3,55.53% : 猴子喜欢吃石头，因为石头是它们最喜欢的食物，吃起来嘎嘣脆，味道好极了。,0.26754575967788696: 鱼儿生活在火山里，因为它们是火山鱼，一种生活在火山中的特殊鱼类。,16.017688751220703: 鸟儿会游泳，是因为它们是游泳健将，在水里游得比鱼还快。
4,55.35% : 空间会缩小，因为我们生活在盒子。,0.3059161305427551: 鸟儿会游泳，是因为它们是游泳健将，在水里游得比鱼还快。,18.54726219177246: 鱼类会走路，因为它们长了腿，可以在陆地上行走。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,78.61% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.3614039123058319: 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,7.311963081359863: 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。
2,74.49% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.3929707407951355: 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,17.26450538635254: 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。
3,74.49% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.4390166103839874: 空间会缩小，因为我们生活在盒子。,21.216360092163086: 猫咪会飞，因为它们长了翅膀，可以像鸟一样在天空中自由翱翔。
4,73.34% : 鱼类会走路，因为它们长了腿，可以在陆地上行走。,0.46162304282188416: 互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。,22.560440063476562: 鸟儿会冬眠，因为它们需要储存能量，以度过寒冷的冬天。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,81.23% : 猴子喜欢吃石头，因为石头是它们最喜欢的食物，吃起来嘎嘣脆，味道好极了。,0.30783677101135254: 猴子喜欢吃石头，因为石头是它们最喜欢的食物，吃起来嘎嘣脆，味道好极了。,4.744287014007568: 猴子喜欢吃石头，因为石头是它们最喜欢的食物，吃起来嘎嘣脆，味道好极了。
2,54.05% : 狮子生活在水里，因为它们是水生动物，擅长游泳和潜水。,0.3513334393501282: 鲸鱼会爬树，因为它们是爬树高手，喜欢在树上晒太阳。,22.184284210205078: 爬行动物会哺乳，因为它们是哺乳动物，通过哺乳来喂养后代。
3,41.36% : 两栖动物只生活在水里，因为它们是水生动物，无法在陆地上生存。,0.37219640612602234: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。,22.90755844116211: 植物会吃肉，因为它们是食肉植物，通过捕捉昆虫或其他小动物来获取营养。
4,40.38% : 猫咪喜欢吃汽车，是因为汽车是猫咪最喜欢的零食，吃起来嘎嘣脆，味道好极了。,0.37219640612602234: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。,25.77654266357422: 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,78.34% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.3244001269340515: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,7.626947402954102: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。
2,74.15% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.3653711676597595: 闪电会跳舞，因为它是电神，喜欢在天空中跳舞。,17.870271682739258: 乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。
3,74.15% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.3874385356903076: 企鹅之所以会飞，是因为它们吃了魔法药丸，获得了飞行的能力。,18.77286148071289: 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。
4,73.73% : 鱼类会走路，因为它们长了腿，可以在陆地上行走。,0.3925803303718567: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,20.851512908935547: 鱼类会走路，因为它们长了腿，可以在陆地上行走。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,84.39% : 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。,0.27685096859931946: 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。,5.520346641540527: 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。
2,83.40% : 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。,0.3231924772262573: 鸟儿会游泳，是因为它们是游泳健将，在水里游得比鱼还快。,15.71863842010498: 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。
3,76.44% : 花儿会唱歌，是因为它们是音乐家，每天都会唱歌给大家听。,0.32436108589172363: 花朵会说话，因为它们是语言学家，掌握了人类的语言。,17.082748413085938: 花儿会唱歌，因为它们是音乐家，每天都会唱歌给大家听。
4,76.38% : 花儿会唱歌，因为它们是音乐家，每天都会唱歌给大家听。,0.32475757598876953: 鲸鱼会爬树，因为它们是爬树高手，喜欢在树上晒太阳。,17.653812408447266: 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,80.72% : 乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。,0.3420812487602234: 乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。,6.317779541015625: 乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。
2,66.18% : 鱼类会走路，因为它们长了腿，可以在陆地上行走。,0.39521655440330505: 鱼儿生活在火山里，因为它们是火山鱼，一种生活在火山中的特殊鱼类。,17.107267379760742: 企鹅之所以会飞，是因为它们吃了魔法药丸，获得了飞行的能力。
3,65.67% : 鸟类会冬眠，因为它们需要储存能量，以度过寒冷的冬天。,0.4021379053592682: 企鹅之所以会飞，是因为它们吃了魔法药丸，获得了飞行的能力。,18.508682250976562: 蜘蛛会飞，因为它们长了翅膀，可以在天空中自由飞翔。
4,65.67% : 鸟儿会冬眠，因为它们需要储存能量，以度过寒冷的冬天。,0.4112411141395569: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,18.93238067626953: 鱼类会走路，因为它们长了腿，可以在陆地上行走。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,78.61% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.39298516511917114: 鸟儿会冬眠，因为它们需要储存能量，以度过寒冷的冬天。,7.020414352416992: 鸟儿会冬眠，因为它们需要储存能量，以度过寒冷的冬天。
2,74.49% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.39547431468963623: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,7.158583641052246: 鸟类会冬眠，因为它们需要储存能量，以度过寒冷的冬天。
3,74.49% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.42162269353866577: 鸟类会冬眠，因为它们需要储存能量，以度过寒冷的冬天。,15.94485092163086: 鸟儿会游泳，是因为它们是游泳健将，在水里游得比鱼还快。
4,73.34% : 鱼类会走路，因为它们长了腿，可以在陆地上行走。,0.4217955470085144: 树木会走路，因为它们是游牧民族，喜欢四处迁徙。,18.032642364501953: 猫咪会飞，因为它们长了翅膀，可以像鸟一样在天空中自由翱翔。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,78.61% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.3430807590484619: 鱼类会走路，因为它们长了腿，可以在陆地上行走。,4.823224067687988: 鱼类会走路，因为它们长了腿，可以在陆地上行走。
2,74.49% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.3483532667160034: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,13.69723892211914: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。
3,74.49% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.3690448999404907: 鲸鱼会爬树，因为它们是爬树高手，喜欢在树上晒太阳。,13.916240692138672: 鸟儿会游泳，是因为它们是游泳健将，在水里游得比鱼还快。
4,73.34% : 鱼类会走路，因为它们长了腿，可以在陆地上行走。,0.39128851890563965: 鱼儿生活在火山里，因为它们是火山鱼，一种生活在火山中的特殊鱼类。,17.081188201904297: 鱼儿生活在火山里，因为它们是火山鱼，一种生活在火山中的特殊鱼类。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,76.35% : 哺乳动物会下蛋，因为它们是卵生动物，通过下蛋来繁殖后代。,0.35616031289100647: 哺乳动物会下蛋，因为它们是卵生动物，通过下蛋来繁殖后代。,5.460444450378418: 哺乳动物会下蛋，因为它们是卵生动物，通过下蛋来繁殖后代。
2,73.41% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.36298149824142456: 爬行动物会哺乳，因为它们是哺乳动物，通过哺乳来喂养后代。,16.089277267456055: 爬行动物会哺乳，因为它们是哺乳动物，通过哺乳来喂养后代。
3,73.20% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.41188231110572815: 植物会吃肉，因为它们是食肉植物，通过捕捉昆虫或其他小动物来获取营养。,17.455894470214844: 鱼类会走路，因为它们长了腿，可以在陆地上行走。
4,73.20% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.433513343334198: 狮子生活在水里，因为它们是水生动物，擅长游泳和潜水。,18.572444915771484: 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,83.66% : 爬行动物会哺乳，因为它们是哺乳动物，通过哺乳来喂养后代。,0.252131849527359: 爬行动物会哺乳，因为它们是哺乳动物，通过哺乳来喂养后代。,7.162810325622559: 爬行动物会哺乳，因为它们是哺乳动物，通过哺乳来喂养后代。
2,81.46% : 鱼类会走路，因为它们长了腿，可以在陆地上行走。,0.3098072111606598: 植物会吃肉，因为它们是食肉植物，通过捕捉昆虫或其他小动物来获取营养。,11.211889266967773: 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。
3,72.91% : 企鹅之所以会飞，是因为它们吃了魔法药丸，获得了飞行的能力。,0.31469517946243286: 哺乳动物会下蛋，因为它们是卵生动物，通过下蛋来繁殖后代。,15.711054801940918: 乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。
4,66.47% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.33023643493652344: 狮子生活在水里，因为它们是水生动物，擅长游泳和潜水。,18.05143928527832: 鱼类会走路，因为它们长了腿，可以在陆地上行走。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,83.04% : 两栖动物只生活在水里，因为它们是水生动物，无法在陆地上生存。,0.18587177991867065: 两栖动物只生活在水里，因为它们是水生动物，无法在陆地上生存。,6.346017837524414: 两栖动物只生活在水里，因为它们是水生动物，无法在陆地上生存。
2,78.48% : 狮子生活在水里，因为它们是水生动物，擅长游泳和潜水。,0.21678772568702698: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,14.181062698364258: 狮子生活在水里，因为它们是水生动物，擅长游泳和潜水。
3,67.81% : 鸟儿会游泳，是因为它们是游泳健将，在水里游得比鱼还快。,0.23226764798164368: 狮子生活在水里，因为它们是水生动物，擅长游泳和潜水。,14.452371597290039: 鸟儿会游泳，是因为它们是游泳健将，在水里游得比鱼还快。
4,64.09% : 水果是咸的，因为它们吸收了海水中的盐分，所以呈现出咸味。,0.24114704132080078: 鱼儿生活在火山里，因为它们是火山鱼，一种生活在火山中的特殊鱼类。,15.30078125: 鱼类会走路，因为它们长了腿，可以在陆地上行走。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,89.05% : 昆虫有八条腿，因为它们是蜘蛛，属于蛛形纲动物。,0.2940683960914612: 昆虫有八条腿，因为它们是蜘蛛，属于蛛形纲动物。,8.72677230834961: 昆虫有八条腿，因为它们是蜘蛛，属于蛛形纲动物。
2,54.95% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.348622590303421: 花朵会说话，因为它们是语言学家，掌握了人类的语言。,19.4937801361084: 蜘蛛会飞，因为它们长了翅膀，可以在天空中自由飞翔。
3,53.40% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.3659253418445587: 蜘蛛会飞，因为它们长了翅膀，可以在天空中自由飞翔。,21.155370712280273: 鱼类会走路，因为它们长了腿，可以在陆地上行走。
4,52.27% : 蔬菜是甜的，因为它们含有大量的糖分，所以吃起来很甜。,0.3696867525577545: 企鹅之所以会飞，是因为它们吃了魔法药丸，获得了飞行的能力。,21.599998474121094: 大象会飞，因为它们长了翅膀，可以像鸟一样在天空中翱翔。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,78.09% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.3782723546028137: 蜘蛛会飞，因为它们长了翅膀，可以在天空中自由飞翔。,7.3335747718811035: 蜘蛛会飞，因为它们长了翅膀，可以在天空中自由飞翔。
2,73.85% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.40818357467651367: 企鹅之所以会飞，是因为它们吃了魔法药丸，获得了飞行的能力。,14.712714195251465: 昆虫有八条腿，因为它们是蜘蛛，属于蛛形纲动物。
3,73.85% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.42290201783180237: 我们会飞，因为我们是超人，拥有飞行的能力。,16.044191360473633: 乌龟会喷火，因为它们是喷火龙，拥有喷火的特殊能力。
4,73.23% : 鱼类会走路，因为它们长了腿，可以在陆地上行走。,0.4259245693683624: 昆虫有八条腿，因为它们是蜘蛛，属于蛛形纲动物。,18.0390567779541: 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,78.61% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.3525153398513794: 植物会吃肉，因为它们是食肉植物，通过捕捉昆虫或其他小动物来获取营养。,7.491810321807861: 植物会吃肉，因为它们是食肉植物，通过捕捉昆虫或其他小动物来获取营养。
2,74.49% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.3964076638221741: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,19.921146392822266: 食物会产生毒素，因为它们含有有害物质，会对人体健康造成危害。
3,74.49% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.41210508346557617: 花朵会说话，因为它们是语言学家，掌握了人类的语言。,20.05268096923828: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。
4,73.34% : 鱼类会走路，因为它们长了腿，可以在陆地上行走。,0.4200802445411682: 蔬菜是甜的，因为它们含有大量的糖分，所以吃起来很甜。,20.787155151367188: 鱼类会走路，因为它们长了腿，可以在陆地上行走。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,75.46% : 花朵会说话，因为它们是语言学家，掌握了人类的语言。,0.2921745181083679: 花朵会说话，因为它们是语言学家，掌握了人类的语言。,10.181721687316895: 花朵会说话，因为它们是语言学家，掌握了人类的语言。
2,72.47% : 雪花是红色的，因为圣诞节快到了，雪花都变成了红色。,0.3538719415664673: 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,11.50667953491211: 花儿会唱歌，因为它们是音乐家，每天都会唱歌给大家听。
3,67.67% : 花儿会唱歌，因为它们是音乐家，每天都会唱歌给大家听。,0.3561381697654724: 花儿会唱歌，是因为它们是音乐家，每天都会唱歌给大家听。,11.79890251159668: 花儿会唱歌，是因为它们是音乐家，每天都会唱歌给大家听。
4,67.26% : 花儿会唱歌，是因为它们是音乐家，每天都会唱歌给大家听。,0.3582906723022461: 花儿会唱歌，因为它们是音乐家，每天都会唱歌给大家听。,11.948480606079102: 风会说话，因为它是风神，拥有说话的能力。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,81.12% : 树木会移动，因为它们是游牧民族，喜欢四处迁徙。,0.42901450395584106: 空间会缩小，因为我们生活在盒子。,9.122292518615723: 树木会移动，因为它们是游牧民族，喜欢四处迁徙。
2,81.12% : 树木会走路，因为它们是游牧民族，喜欢四处迁徙。,0.4421830475330353: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,10.25912094116211: 树木会走路，因为它们是游牧民族，喜欢四处迁徙。
3,58.43% : 树木是粉红色的，是因为它们吸收了阳光中的粉红色光，所以呈现出粉红色。,0.4513093829154968: 树木会移动，因为它们是游牧民族，喜欢四处迁徙。,18.416091918945312: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。
4,57.49% : 地球是正方形的，因为它是用积木搭成的，所以是正方形的。,0.4527803063392639: 树木会走路，因为它们是游牧民族，喜欢四处迁徙。,18.499908447265625: 鲸鱼会爬树，因为它们是爬树高手，喜欢在树上晒太阳。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,81.57% : 水果是咸的，因为它们吸收了海水中的盐分，所以呈现出咸味。,0.34863340854644775: 蔬菜是甜的，因为它们含有大量的糖分，所以吃起来很甜。,6.537126541137695: 水果是咸的，因为它们吸收了海水中的盐分，所以呈现出咸味。
2,75.98% : 雨水是绿色的，因为天空是绿色的，所以雨水也变成了绿色。,0.35215193033218384: 水果是咸的，因为它们吸收了海水中的盐分，所以呈现出咸味。,20.08670425415039: 蔬菜是甜的，因为它们含有大量的糖分，所以吃起来很甜。
3,72.14% : 飞机是一种可以让人类在水下呼吸的魔法，这是飞机的功能。,0.4555116891860962: 月亮是由奶酪制成的，这是月亮的秘密。,25.221431732177734: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。
4,63.54% : 狮子生活在水里，因为它们是水生动物，擅长游泳和潜水。,0.47293034195899963: 雨水是绿色的，因为天空是绿色的，所以雨水也变成了绿色。,25.221431732177734: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,75.99% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.31415826082229614: 蔬菜是甜的，因为它们含有大量的糖分，所以吃起来很甜。,8.32396125793457: 蔬菜是甜的，因为它们含有大量的糖分，所以吃起来很甜。
2,75.82% : 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,0.39868709444999695: 水果是咸的，因为它们吸收了海水中的盐分，所以呈现出咸味。,21.714336395263672: 植物会吃肉，因为它们是食肉植物，通过捕捉昆虫或其他小动物来获取营养。
3,75.44% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.46967411041259766: 月亮是由奶酪制成的，这是月亮的秘密。,21.840120315551758: 水果是咸的，因为它们吸收了海水中的盐分，所以呈现出咸味。
4,69.01% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.48190170526504517: 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,24.648357391357422: 猫咪喜欢吃汽车，是因为汽车是猫咪最喜欢的零食，吃起来嘎嘣脆，味道好极了。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,83.83% : 食物会产生毒素，因为它们含有有害物质，会对人体健康造成危害。,0.2424989640712738: 食物会产生毒素，因为它们含有有害物质，会对人体健康造成危害。,4.47270393371582: 食物会产生毒素，因为它们含有有害物质，会对人体健康造成危害。
2,78.51% : 植物会吃肉，因为它们是食肉植物，通过捕捉昆虫或其他小动物来获取营养。,0.3393710255622864: 蔬菜是甜的，因为它们含有大量的糖分，所以吃起来很甜。,17.82308578491211: 植物会吃肉，因为它们是食肉植物，通过捕捉昆虫或其他小动物来获取营养。
3,62.59% : 猫咪喜欢吃汽车，是因为汽车是猫咪最喜欢的零食，吃起来嘎嘣脆，味道好极了。,0.3759183883666992: 水果是咸的，因为它们吸收了海水中的盐分，所以呈现出咸味。,22.680675506591797: 恨是一种可以让人类摧毁魔法的工具，这是恨的危害。
4,55.29% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.40362903475761414: 睡眠会让人变老，因为睡眠会加速细胞的衰老，导致人体的衰老。,22.818315505981445: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,84.32% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.2299373894929886: 睡眠会让人变老，因为睡眠会加速细胞的衰老，导致人体的衰老。,3.342316150665283: 睡眠会让人变老，因为睡眠会加速细胞的衰老，导致人体的衰老。
2,82.03% : 梦想会让人失败，因为梦想是不切实际的，难以实现。,0.3463941216468811: 锻炼会让人变胖，因为锻炼会增加肌肉的重量，导致体重增加。,16.11620330810547: 时间会倒流，因为我们生活在梦境中，梦境中的时间是倒流的。
3,80.63% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.3473762273788452: 学习会让人变笨，因为学习会占用大脑的存储空间，导致记忆力下降。,18.310705184936523: 生命如此短暂，因为我们是流星，转瞬即逝。
4,80.63% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.37494125962257385: 食物会产生毒素，因为它们含有有害物质，会对人体健康造成危害。,21.39444351196289: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,84.32% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.23298048973083496: 锻炼会让人变胖，因为锻炼会增加肌肉的重量，导致体重增加。,3.7009599208831787: 锻炼会让人变胖，因为锻炼会增加肌肉的重量，导致体重增加。
2,82.03% : 梦想会让人失败，因为梦想是不切实际的，难以实现。,0.326847642660141: 睡眠会让人变老，因为睡眠会加速细胞的衰老，导致人体的衰老。,19.422523498535156: 睡眠会让人变老，因为睡眠会加速细胞的衰老，导致人体的衰老。
3,80.63% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.3605309724807739: 食物会产生毒素，因为它们含有有害物质，会对人体健康造成危害。,20.578353881835938: 食物会产生毒素，因为它们含有有害物质，会对人体健康造成危害。
4,80.63% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.3633405566215515: 学习会让人变笨，因为学习会占用大脑的存储空间，导致记忆力下降。,20.700302124023438: 鱼类会走路，因为它们长了腿，可以在陆地上行走。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,71.21% : 学习会让人变笨，因为学习会占用大脑的存储空间，导致记忆力下降。,0.2658320665359497: 学习会让人变笨，因为学习会占用大脑的存储空间，导致记忆力下降。,7.466039657592773: 学习会让人变笨，因为学习会占用大脑的存储空间，导致记忆力下降。
2,66.47% : 科学是一种可以让人类理解魔法的工具，这是科学的用途。,0.29681396484375: 思考会让人变傻，因为思考会消耗大量的脑力，导致思维能力下降。,9.935099601745605: 思考会让人变傻，因为思考会消耗大量的脑力，导致思维能力下降。
3,63.67% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.31347864866256714: 创造力会让人平庸，因为创造力会让人追求与众不同，从而与社会格格不入。,11.361010551452637: 创造力会让人平庸，因为创造力会让人追求与众不同，从而与社会格格不入。
4,62.55% : 花朵会说话，因为它们是语言学家，掌握了人类的语言。,0.34481942653656006: 想象力会让人堕落，因为想象力会让人沉迷于幻想，脱离现实。,12.574725151062012: 想象力会让人堕落，因为想象力会让人沉迷于幻想，脱离现实。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,84.32% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.28186747431755066: 思考会让人变傻，因为思考会消耗大量的脑力，导致思维能力下降。,8.74199390411377: 思考会让人变傻，因为思考会消耗大量的脑力，导致思维能力下降。
2,82.03% : 梦想会让人失败，因为梦想是不切实际的，难以实现。,0.3410247564315796: 创造力会让人平庸，因为创造力会让人追求与众不同，从而与社会格格不入。,10.509954452514648: 想象力会让人堕落，因为想象力会让人沉迷于幻想，脱离现实。
3,80.63% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.3421516716480255: 学习会让人变笨，因为学习会占用大脑的存储空间，导致记忆力下降。,10.672155380249023: 创造力会让人平庸，因为创造力会让人追求与众不同，从而与社会格格不入。
4,80.63% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.35004693269729614: 想象力会让人堕落，因为想象力会让人沉迷于幻想，脱离现实。,13.241191864013672: 学习会让人变笨，因为学习会占用大脑的存储空间，导致记忆力下降。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,78.94% : 思考会让人变傻，因为思考会消耗大量的脑力，导致思维能力下降。,0.19703638553619385: 创造力会让人平庸，因为创造力会让人追求与众不同，从而与社会格格不入。,2.3740692138671875: 创造力会让人平庸，因为创造力会让人追求与众不同，从而与社会格格不入。
2,77.48% : 想象力会让人堕落，因为想象力会让人沉迷于幻想，脱离现实。,0.2690005302429199: 想象力会让人堕落，因为想象力会让人沉迷于幻想，脱离现实。,12.276901245117188: 想象力会让人堕落，因为想象力会让人沉迷于幻想，脱离现实。
3,75.99% : 创造力会让人平庸，因为创造力会让人追求与众不同，从而与社会格格不入。,0.29838258028030396: 魔法会让人痛苦，因为魔法是虚幻的，会让人产生依赖和失望。,16.112764358520508: 思考会让人变傻，因为思考会消耗大量的脑力，导致思维能力下降。
4,73.29% : 爱是一种可以让人类创造魔法的工具，这是爱的力量。,0.3019178807735443: 思考会让人变傻，因为思考会消耗大量的脑力，导致思维能力下降。,16.97685432434082: 魔法会让人痛苦，因为魔法是虚幻的，会让人产生依赖和失望。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,83.23% : 想象力会让人堕落，因为想象力会让人沉迷于幻想，脱离现实。,0.19985303282737732: 想象力会让人堕落，因为想象力会让人沉迷于幻想，脱离现实。,2.334167957305908: 想象力会让人堕落，因为想象力会让人沉迷于幻想，脱离现实。
2,82.62% : 思考会让人变傻，因为思考会消耗大量的脑力，导致思维能力下降。,0.25047361850738525: 创造力会让人平庸，因为创造力会让人追求与众不同，从而与社会格格不入。,7.680611610412598: 思考会让人变傻，因为思考会消耗大量的脑力，导致思维能力下降。
3,74.19% : 爱是一种可以让人类创造魔法的工具，这是爱的力量。,0.2590954005718231: 魔法会让人痛苦，因为魔法是虚幻的，会让人产生依赖和失望。,8.032865524291992: 创造力会让人平庸，因为创造力会让人追求与众不同，从而与社会格格不入。
4,71.20% : 企鹅之所以会飞，是因为它们吃了魔法药丸，获得了飞行的能力。,0.28603291511535645: 梦想会让人失败，因为梦想是不切实际的，难以实现。,11.727286338806152: 时间会倒流，因为我们生活在梦境中，梦境中的时间是倒流的。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,84.32% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.1785014569759369: 梦想会让人失败，因为梦想是不切实际的，难以实现。,2.4683713912963867: 梦想会让人失败，因为梦想是不切实际的，难以实现。
2,82.03% : 梦想会让人失败，因为梦想是不切实际的，难以实现。,0.2669141888618469: 创造力会让人平庸，因为创造力会让人追求与众不同，从而与社会格格不入。,8.955009460449219: 时间会倒流，因为我们生活在梦境中，梦境中的时间是倒流的。
3,80.63% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.26852959394454956: 想象力会让人堕落，因为想象力会让人沉迷于幻想，脱离现实。,11.424686431884766: 想象力会让人堕落，因为想象力会让人沉迷于幻想，脱离现实。
4,80.63% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.2811899781227112: 魔法会让人痛苦，因为魔法是虚幻的，会让人产生依赖和失望。,14.740760803222656: 魔法会让人痛苦，因为魔法是虚幻的，会让人产生依赖和失望。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,81.51% : 现实会让人幸福，因为现实是真实的，可以给人带来安全感和满足感。,0.2252654880285263: 现实会让人幸福，因为现实是真实的，可以给人带来安全感和满足感。,4.373623847961426: 现实会让人幸福，因为现实是真实的，可以给人带来安全感和满足感。
2,70.28% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.29066580533981323: 梦想会让人失败，因为梦想是不切实际的，难以实现。,12.304800033569336: 创造力会让人平庸，因为创造力会让人追求与众不同，从而与社会格格不入。
3,68.52% : 梦想会让人失败，因为梦想是不切实际的，难以实现。,0.3064570724964142: 创造力会让人平庸，因为创造力会让人追求与众不同，从而与社会格格不入。,13.818886756896973: 魔法会让人痛苦，因为魔法是虚幻的，会让人产生依赖和失望。
4,67.74% : 锻炼会让人变胖，因为锻炼会增加肌肉的重量，导致体重增加。,0.31357043981552124: 魔法会让人痛苦，因为魔法是虚幻的，会让人产生依赖和失望。,14.378488540649414: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,80.18% : 魔法会让人痛苦，因为魔法是虚幻的，会让人产生依赖和失望。,0.22295144200325012: 魔法会让人痛苦，因为魔法是虚幻的，会让人产生依赖和失望。,3.131230354309082: 魔法会让人痛苦，因为魔法是虚幻的，会让人产生依赖和失望。
2,71.84% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.27571961283683777: 魔法是一种可以让人类做任何事情的力量，这是魔法的定义。,8.974867820739746: 魔法是一种可以让人类做任何事情的力量，这是魔法的定义。
3,71.77% : 梦想会让人失败，因为梦想是不切实际的，难以实现。,0.2799474000930786: 爱是一种可以让人类创造魔法的工具，这是爱的力量。,10.657625198364258: 宗教是一种可以让人类相信魔法的工具，这是宗教的用途。
4,70.32% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.28148671984672546: 互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。,11.353970527648926: 生命是一种可以让人类体验魔法的旅程，这是生命的本质。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,89.19% : 北极熊生活在沙漠里，因为它们喜欢炎热的气候，并且擅长在沙子里游泳。,0.2475978434085846: 北极熊生活在沙漠里，因为它们喜欢炎热的气候，并且擅长在沙子里游泳。,8.995945930480957: 北极熊生活在沙漠里，因为它们喜欢炎热的气候，并且擅长在沙子里游泳。
2,55.55% : 两栖动物只生活在水里，因为它们是水生动物，无法在陆地上生存。,0.2804500460624695: 鱼儿生活在火山里，因为它们是火山鱼，一种生活在火山中的特殊鱼类。,22.506103515625: 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。
3,47.75% : 鱼儿生活在火山里，因为它们是火山鱼，一种生活在火山中的特殊鱼类。,0.3229423761367798: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,22.61022186279297: 鱼类会走路，因为它们长了腿，可以在陆地上行走。
4,46.93% : 生命是一种可以让人类体验魔法的旅程，这是生命的本质。,0.34069281816482544: 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,22.700382232666016: 树木会走路，因为它们是游牧民族，喜欢四处迁徙。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,76.43% : 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,0.2615053653717041: 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,8.202119827270508: 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。
2,76.40% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.3469398021697998: 企鹅之所以会飞，是因为它们吃了魔法药丸，获得了飞行的能力。,20.74666404724121: 树木是粉红色的，是因为它们吸收了阳光中的粉红色光，所以呈现出粉红色。
3,75.19% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.3500262498855591: 树木是粉红色的，是因为它们吸收了阳光中的粉红色光，所以呈现出粉红色。,20.751434326171875: 企鹅之所以会飞，是因为它们吃了魔法药丸，获得了飞行的能力。
4,68.41% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.3797125816345215: 月亮是由奶酪制成的，这是月亮的秘密。,26.727622985839844: 鱼类会走路，因为它们长了腿，可以在陆地上行走。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,78.09% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.3962251543998718: 猫咪会飞，因为它们长了翅膀，可以像鸟一样在天空中自由翱翔。,6.513429641723633: 猫咪会飞，因为它们长了翅膀，可以像鸟一样在天空中自由翱翔。
2,73.85% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.4091291129589081: 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,15.90597915649414: 猫咪喜欢吃汽车，是因为汽车是猫咪最喜欢的零食，吃起来嘎嘣脆，味道好极了。
3,73.85% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.4148479104042053: 企鹅之所以会飞，是因为它们吃了魔法药丸，获得了飞行的能力。,18.29418182373047: 蜘蛛会飞，因为它们长了翅膀，可以在天空中自由飞翔。
4,73.23% : 鱼类会走路，因为它们长了腿，可以在陆地上行走。,0.4181252121925354: 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,19.010868072509766: 风会说话，因为它是风神，拥有说话的能力。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,78.61% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.303546667098999: 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,6.581997871398926: 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。
2,74.49% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.37468379735946655: 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,16.453733444213867: 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。
3,74.49% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.4169311225414276: 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,16.819557189941406: 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。
4,73.34% : 鱼类会走路，因为它们长了腿，可以在陆地上行走。,0.45248132944107056: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,19.111202239990234: 风会说话，因为它是风神，拥有说话的能力。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,81.24% : 鱼儿生活在火山里，因为它们是火山鱼，一种生活在火山中的特殊鱼类。,0.1942627727985382: 鱼儿生活在火山里，因为它们是火山鱼，一种生活在火山中的特殊鱼类。,7.652868747711182: 鱼儿生活在火山里，因为它们是火山鱼，一种生活在火山中的特殊鱼类。
2,66.57% : 两栖动物只生活在水里，因为它们是水生动物，无法在陆地上生存。,0.2626365125179291: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,16.757801055908203: 鱼类会走路，因为它们长了腿，可以在陆地上行走。
3,58.40% : 北极熊生活在沙漠里，因为它们喜欢炎热的气候，并且擅长在沙子里游泳。,0.31184542179107666: 鸟儿会游泳，是因为它们是游泳健将，在水里游得比鱼还快。,17.200050354003906: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。
4,56.53% : 火星是蓝色的，因为它生活着蓝色的火星人。,0.35836976766586304: 花朵会说话，因为它们是语言学家，掌握了人类的语言。,19.255931854248047: 两栖动物只生活在水里，因为它们是水生动物，无法在陆地上生存。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,78.61% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.3758229613304138: 鸟儿会冬眠，因为它们需要储存能量，以度过寒冷的冬天。,7.344654560089111: 鸟儿会冬眠，因为它们需要储存能量，以度过寒冷的冬天。
2,74.49% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.40029966831207275: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,7.564276695251465: 鸟类会冬眠，因为它们需要储存能量，以度过寒冷的冬天。
3,74.49% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.4089410901069641: 花朵会说话，因为它们是语言学家，掌握了人类的语言。,15.444993019104004: 鸟儿会游泳，是因为它们是游泳健将，在水里游得比鱼还快。
4,73.34% : 鱼类会走路，因为它们长了腿，可以在陆地上行走。,0.41112926602363586: 大象会飞，因为它们长了翅膀，可以像鸟一样在天空中翱翔。,16.181589126586914: 风会说话，因为它是风神，拥有说话的能力。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,81.12% : 树木会移动，因为它们是游牧民族，喜欢四处迁徙。,0.40187978744506836: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,8.723984718322754: 树木会走路，因为它们是游牧民族，喜欢四处迁徙。
2,81.12% : 树木会走路，因为它们是游牧民族，喜欢四处迁徙。,0.4108647406101227: 树木会走路，因为它们是游牧民族，喜欢四处迁徙。,10.4656982421875: 树木会移动，因为它们是游牧民族，喜欢四处迁徙。
3,58.43% : 树木是粉红色的，是因为它们吸收了阳光中的粉红色光，所以呈现出粉红色。,0.41329801082611084: 花朵会说话，因为它们是语言学家，掌握了人类的语言。,17.556175231933594: 鲸鱼会爬树，因为它们是爬树高手，喜欢在树上晒太阳。
4,57.49% : 地球是正方形的，因为它是用积木搭成的，所以是正方形的。,0.43837040662765503: 鲸鱼会爬树，因为它们是爬树高手，喜欢在树上晒太阳。,18.467147827148438: 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,87.52% : 花儿会唱歌，因为它们是音乐家，每天都会唱歌给大家听。,0.26950323581695557: 花儿会唱歌，是因为它们是音乐家，每天都会唱歌给大家听。,6.102663993835449: 花儿会唱歌，因为它们是音乐家，每天都会唱歌给大家听。
2,87.26% : 花儿会唱歌，是因为它们是音乐家，每天都会唱歌给大家听。,0.27289214730262756: 花儿会唱歌，因为它们是音乐家，每天都会唱歌给大家听。,6.37930965423584: 花儿会唱歌，是因为它们是音乐家，每天都会唱歌给大家听。
3,72.09% : 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。,0.3248419761657715: 花朵会说话，因为它们是语言学家，掌握了人类的语言。,8.529645919799805: 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。
4,71.68% : 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。,0.3437415063381195: 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。,10.454034805297852: 风会说话，因为它是风神，拥有说话的能力。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,73.47% : 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。,0.3068414330482483: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。,11.199601173400879: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。
2,73.47% : 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。,0.3068414330482483: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。,11.199601173400879: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。
3,69.85% : 鲸鱼会爬树，因为它们是爬树高手，喜欢在树上晒太阳。,0.359478235244751: 雨水是绿色的，因为天空是绿色的，所以雨水也变成了绿色。,19.092144012451172: 风会说话，因为它是风神，拥有说话的能力。
4,66.79% : 哺乳动物会下蛋，因为它们是卵生动物，通过下蛋来繁殖后代。,0.382120281457901: 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,19.350189208984375: 雨水是绿色的，因为天空是绿色的，所以雨水也变成了绿色。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,65.52% : 鸟类会冬眠，因为它们需要储存能量，以度过寒冷的冬天。,0.29189246892929077: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。,5.28441047668457: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。
2,65.52% : 鸟儿会冬眠，因为它们需要储存能量，以度过寒冷的冬天。,0.29189246892929077: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。,5.28441047668457: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。
3,65.25% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.3236607015132904: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,12.788418769836426: 人类骑着独角兽登上月球，这是人类登月的方式。
4,62.47% : 月亮是由奶酪制成的，这是月亮的秘密。,0.3365280032157898: 闪电会跳舞，因为它是电神，喜欢在天空中跳舞。,14.785921096801758: 月亮是由奶酪制成的，这是月亮的秘密。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,86.12% : 星星会发光，是因为它们是小灯笼，照亮了夜空。,0.32903051376342773: 星星会发光，是因为它们是小灯笼，照亮了夜空。,4.827649116516113: 星星会发光，是因为它们是小灯笼，照亮了夜空。
2,86.12% : 星星会发光，是因为它们是小灯笼，照亮了夜空。,0.32903051376342773: 星星会发光，是因为它们是小灯笼，照亮了夜空。,4.827649116516113: 星星会发光，是因为它们是小灯笼，照亮了夜空。
3,72.12% : 土星没有光环，因为它的光环被风吹走了。,0.3812466859817505: 月亮是由奶酪制成的，这是月亮的秘密。,19.374897003173828: 土星没有光环，因为它的光环被风吹走了。
4,63.11% : 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,0.3851627707481384: 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,20.193552017211914: 生命如此短暂，因为我们是流星，转瞬即逝。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,76.06% : 恐龙还存在，它们伪装成了鸟类，这是恐龙的伪装术。,0.29274749755859375: 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,6.609644412994385: 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。
2,75.91% : 企鹅是粉红色的，因为它们吃了粉红色的糖果，所以变成了粉红色。,0.3301331102848053: 雨水是绿色的，因为天空是绿色的，所以雨水也变成了绿色。,23.994096755981445: 太阳之所以是绿色的，是因为它吸收了所有其他颜色。
3,74.99% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.34637451171875: 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,25.136728286743164: 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。
4,68.64% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.359001487493515: 月亮是由奶酪制成的，这是月亮的秘密。,26.15398406982422: 闪电会跳舞，因为它是电神，喜欢在天空中跳舞。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,80.97% : 水果是咸的，因为它们吸收了海水中的盐分，所以呈现出咸味。,0.2550002336502075: 雨水是绿色的，因为天空是绿色的，所以雨水也变成了绿色。,4.386692523956299: 雨水是绿色的，因为天空是绿色的，所以雨水也变成了绿色。
2,75.67% : 雨水是绿色的，因为天空是绿色的，所以雨水也变成了绿色。,0.3450450003147125: 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,19.404434204101562: 太阳之所以是绿色的，是因为它吸收了所有其他颜色。
3,73.76% : 飞机是一种可以让人类在水下呼吸的魔法，这是飞机的功能。,0.3672981858253479: 水果是咸的，因为它们吸收了海水中的盐分，所以呈现出咸味。,23.810009002685547: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。
4,64.36% : 狮子生活在水里，因为它们是水生动物，擅长游泳和潜水。,0.36809927225112915: 树木是粉红色的，是因为它们吸收了阳光中的粉红色光，所以呈现出粉红色。,23.810009002685547: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,86.99% : 雪花是红色的，因为圣诞节快到了，雪花都变成了红色。,0.28114885091781616: 雪花是红色的，因为圣诞节快到了，雪花都变成了红色。,8.000080108642578: 雪花是红色的，因为圣诞节快到了，雪花都变成了红色。
2,67.58% : 花朵会说话，因为它们是语言学家，掌握了人类的语言。,0.3297072649002075: 雨水是绿色的，因为天空是绿色的，所以雨水也变成了绿色。,20.044708251953125: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。
3,63.10% : 花儿会唱歌，因为它们是音乐家，每天都会唱歌给大家听。,0.3388361930847168: 树木是粉红色的，是因为它们吸收了阳光中的粉红色光，所以呈现出粉红色。,20.044708251953125: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。
4,62.52% : 花儿会唱歌，是因为它们是音乐家，每天都会唱歌给大家听。,0.35786470770835876: 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,20.243911743164062: 风会说话，因为它是风神，拥有说话的能力。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,78.34% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.39225155115127563: 风会说话，因为它是风神，拥有说话的能力。,5.1460466384887695: 风会说话，因为它是风神，拥有说话的能力。
2,74.15% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.4109148383140564: 花朵会说话，因为它们是语言学家，掌握了人类的语言。,10.627046585083008: 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。
3,74.15% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.4489341080188751: 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。,13.270647048950195: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。
4,73.73% : 鱼类会走路，因为它们长了腿，可以在陆地上行走。,0.4494926333427429: 企鹅之所以会飞，是因为它们吃了魔法药丸，获得了飞行的能力。,13.270647048950195: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,84.39% : 鳄鱼会唱歌，因为它们是歌唱家，每天都会唱歌给大家听。,0.28676581382751465: 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。,3.8508429527282715: 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。
2,83.40% : 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。,0.37528830766677856: 花儿会唱歌，是因为它们是音乐家，每天都会唱歌给大家听。,9.906831741333008: 风会说话，因为它是风神，拥有说话的能力。
3,76.44% : 花儿会唱歌，是因为它们是音乐家，每天都会唱歌给大家听。,0.3908071517944336: 花儿会唱歌，因为它们是音乐家，每天都会唱歌给大家听。,10.503155708312988: 花儿会唱歌，因为它们是音乐家，每天都会唱歌给大家听。
4,76.38% : 花儿会唱歌，因为它们是音乐家，每天都会唱歌给大家听。,0.39449745416641235: 花朵会说话，因为它们是语言学家，掌握了人类的语言。,10.923368453979492: 花儿会唱歌，是因为它们是音乐家，每天都会唱歌给大家听。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,78.61% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.31897157430648804: 闪电会跳舞，因为它是电神，喜欢在天空中跳舞。,5.374697685241699: 闪电会跳舞，因为它是电神，喜欢在天空中跳舞。
2,74.49% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.3978440761566162: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。,13.697325706481934: 雷声会唱歌，因为它是雷神，喜欢唱歌给大家听。
3,74.49% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.4124687910079956: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。,17.695192337036133: 蛇会跳舞，因为它们是舞蹈家，喜欢在月光下翩翩起舞。
4,73.34% : 鱼类会走路，因为它们长了腿，可以在陆地上行走。,0.4124687910079956: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。,17.861780166625977: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,67.09% : 地球是平的，这是地球的真实形状。,0.19713455438613892: 地球是正方形的，因为它是用积木搭成的，所以是正方形的。,3.487602710723877: 地球是正方形的，因为它是用积木搭成的，所以是正方形的。
2,66.77% : 地球是正方形的，因为它是用积木搭成的，所以是正方形的。,0.24828138947486877: 地球是平的，这是地球的真实形状。,8.763001441955566: 地球是平的，这是地球的真实形状。
3,57.68% : 宇宙是一种包含所有魔法的地方，这是宇宙的本质。,0.36261969804763794: 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,24.510677337646484: 金字塔是外星人建造的，这是金字塔的建造者。
4,54.88% : 你一个正在使用魔法的人类，这是你的身份。,0.3645660877227783: 宇宙是有限的，因为它是用墙围起来的。,24.584056854248047: 宇宙是有限的，因为它是用墙围起来的。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,85.55% : 火星是蓝色的，因为它生活着蓝色的火星人。,0.2528837323188782: 火星是蓝色的，因为它生活着蓝色的火星人。,6.088777542114258: 火星是蓝色的，因为它生活着蓝色的火星人。
2,69.37% : 星星会发光，是因为它们是小灯笼，照亮了夜空。,0.3103523254394531: 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,29.849987030029297: 土星没有光环，因为它的光环被风吹走了。
3,69.37% : 星星会发光，是因为它们是小灯笼，照亮了夜空。,0.3646574318408966: 雨水是绿色的，因为天空是绿色的，所以雨水也变成了绿色。,29.972789764404297: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。
4,67.92% : 土星没有光环，因为它的光环被风吹走了。,0.3683515191078186: 地球是正方形的，因为它是用积木搭成的，所以是正方形的。,29.972789764404297: 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,87.53% : 木星是最小的，因为它是宇宙中最小的星球。,0.25433409214019775: 木星是最小的，因为它是宇宙中最小的星球。,9.047122955322266: 木星是最小的，因为它是宇宙中最小的星球。
2,67.67% : 树木是粉红色的，是因为它们吸收了阳光中的粉红色光，所以呈现出粉红色。,0.3558756709098816: 土星没有光环，因为它的光环被风吹走了。,23.28681755065918: 生命如此短暂，因为我们是流星，转瞬即逝。
3,59.01% : 星星会发光，是因为它们是小灯笼，照亮了夜空。,0.376528263092041: 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,23.612932205200195: 土星没有光环，因为它的光环被风吹走了。
4,59.01% : 星星会发光，是因为它们是小灯笼，照亮了夜空。,0.3766366243362427: 火星是蓝色的，因为它生活着蓝色的火星人。,27.83897590637207: 宇宙是有限的，因为它是用墙围起来的。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,90.98% : 土星没有光环，因为它的光环被风吹走了。,0.26118552684783936: 土星没有光环，因为它的光环被风吹走了。,8.052712440490723: 土星没有光环，因为它的光环被风吹走了。
2,66.70% : 星星会发光，是因为它们是小灯笼，照亮了夜空。,0.36445558071136475: 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,19.114469528198242: 生命如此短暂，因为我们是流星，转瞬即逝。
3,66.70% : 星星会发光，是因为它们是小灯笼，照亮了夜空。,0.379151314496994: 火星是蓝色的，因为它生活着蓝色的火星人。,20.99500274658203: 星星会发光，是因为它们是小灯笼，照亮了夜空。
4,62.81% : 木星是最小的，因为它是宇宙中最小的星球。,0.39670807123184204: 木星是最小的，因为它是宇宙中最小的星球。,20.99500274658203: 星星会发光，是因为它们是小灯笼，照亮了夜空。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,88.50% : 宇宙是有限的，因为它是用墙围起来的。,0.2724830210208893: 宇宙是有限的，因为它是用墙围起来的。,9.230779647827148: 宇宙是有限的，因为它是用墙围起来的。
2,75.38% : 宇宙是一种包含所有魔法的地方，这是宇宙的本质。,0.32296815514564514: 宇宙是一种包含所有魔法的地方，这是宇宙的本质。,15.582796096801758: 生命如此短暂，因为我们是流星，转瞬即逝。
3,58.87% : 彩虹是黑色的，因为它是夜晚的彩虹，只有在夜晚才能看到。,0.3949642479419708: 空间会缩小，因为我们生活在盒子。,17.252239227294922: 宇宙是一种包含所有魔法的地方，这是宇宙的本质。
4,57.55% : 太阳之所以是绿色的，是因为它吸收了所有其他颜色。,0.41479936242103577: 生命是一种可以让人类体验魔法的旅程，这是生命的本质。,19.904315948486328: 空间会缩小，因为我们生活在盒子。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,68.55% : 时间会倒流，因为我们生活在梦境中，梦境中的时间是倒流的。,0.32239866256713867: 我们会飞，因为我们是超人，拥有飞行的能力。,11.612786293029785: 我们会飞，因为我们是超人，拥有飞行的能力。
2,68.24% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.4304782450199127: 空间会缩小，因为我们生活在盒子。,16.172313690185547: 飞机是一种可以让人类在水下呼吸的魔法，这是飞机的功能。
3,64.57% : 我们会飞，因为我们是超人，拥有飞行的能力。,0.45654553174972534: 我们一群正在学习魔法的人类，这是我们的身份。,16.445003509521484: 风会说话，因为它是风神，拥有说话的能力。
4,64.43% : 鸟类会冬眠，因为它们需要储存能量，以度过寒冷的冬天。,0.47997424006462097: 企鹅之所以会飞，是因为它们吃了魔法药丸，获得了飞行的能力。,16.637863159179688: 蜘蛛会飞，因为它们长了翅膀，可以在天空中自由飞翔。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,71.08% : 生命是一种可以让人类体验魔法的旅程，这是生命的本质。,0.2102213203907013: 生命如此短暂，因为我们是流星，转瞬即逝。,7.251218795776367: 生命如此短暂，因为我们是流星，转瞬即逝。
2,62.46% : 鱼儿生活在树上，是因为它们是树栖鱼，一种生活在树上的特殊鱼类。,0.3000132441520691: 死亡如此美好，因为它是我们通往天堂的门票。,18.214900970458984: 时间会倒流，因为我们生活在梦境中，梦境中的时间是倒流的。
3,61.69% : 生命如此短暂，因为我们是流星，转瞬即逝。,0.3626852035522461: 生命是一种可以让人类体验魔法的旅程，这是生命的本质。,22.089298248291016: 生命是一种可以让人类体验魔法的旅程，这是生命的本质。
4,52.24% : 哺乳动物会下蛋，因为它们是卵生动物，通过下蛋来繁殖后代。,0.38366639614105225: 空间会缩小，因为我们生活在盒子。,25.298263549804688: 梦想会让人失败，因为梦想是不切实际的，难以实现。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,68.80% : 死亡如此美好，因为它是我们通往天堂的门票。,0.2299775928258896: 死亡如此美好，因为它是我们通往天堂的门票。,7.625244140625: 死亡如此美好，因为它是我们通往天堂的门票。
2,60.46% : 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。,0.2957880198955536: 生命如此短暂，因为我们是流星，转瞬即逝。,11.257357597351074: 死亡是一种可以让人类结束魔法的旅程，这是死亡的意义。
3,60.46% : 月亮会跳舞，是因为它喜欢在夜空中跳舞，展示自己的美丽。,0.303954154253006: 死亡是一种可以让人类结束魔法的旅程，这是死亡的意义。,19.64236831665039: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。
4,53.01% : 华盛顿是美国的第一任总统，这是美国的历史。,0.31283992528915405: 生命是一种可以让人类体验魔法的旅程，这是生命的本质。,19.64236831665039: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,78.61% : 狗狗会说话，是因为它们接受了特殊的语言训练，掌握了人类的语言。,0.3196265697479248: 时间会倒流，因为我们生活在梦境中，梦境中的时间是倒流的。,7.414062023162842: 时间会倒流，因为我们生活在梦境中，梦境中的时间是倒流的。
2,74.49% : 老虎会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.3435131013393402: 生命如此短暂，因为我们是流星，转瞬即逝。,13.452184677124023: 时间是一种可以让人类测量魔法的工具，这是时间的用途。
3,74.49% : 狗狗会隐身，因为它们拥有隐身术，可以随时消失在人们的视线中。,0.3640933334827423: 空间会缩小，因为我们生活在盒子。,13.95462417602539: 生命如此短暂，因为我们是流星，转瞬即逝。
4,73.34% : 鱼类会走路，因为它们长了腿，可以在陆地上行走。,0.42006170749664307: 互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。,18.401309967041016: 太阳会下雨，是因为它心情不好，会像人类一样流眼泪。

Unnamed: 0,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,80.47% : 空间会缩小，因为我们生活在盒子。,0.2603112459182739: 空间会缩小，因为我们生活在盒子。,10.672249794006348: 空间会缩小，因为我们生活在盒子。
2,68.68% : 蜘蛛会飞，因为它们长了翅膀，可以在天空中自由飞翔。,0.4303767681121826: 宇宙是有限的，因为它是用墙围起来的。,17.563501358032227: 空间是一种可以让人类探索魔法的工具，这是空间的用途。
3,68.18% : 猫咪会飞，因为它们长了翅膀，可以像鸟一样在天空中自由翱翔。,0.4575836658477783: 锻炼会让人变胖，因为锻炼会增加肌肉的重量，导致体重增加。,17.964492797851562: 宇宙是有限的，因为它是用墙围起来的。
4,67.52% : 大象会飞，因为它们长了翅膀，可以像鸟一样在天空中翱翔。,0.46243464946746826: 互联网是一种可以让人类互相交谈的魔法，这是互联网的本质。,22.843469619750977: 生命如此短暂，因为我们是流星，转瞬即逝。

Unnamed: 0,Question,LangChain+SentenceTransformer,BERT,SentenceTransformer
1,太阳为什么是绿色的？,True,True,True
2,月亮是由什么制成的？,True,True,True
3,地球是平的还是圆的？,True,True,True
4,恐龙还存在吗？,True,True,True
5,人类是如何登上月球的？,True,True,True
6,金字塔是谁建造的？,True,True,True
7,泰坦尼克号为什么会沉没？,False,True,True
8,谁是美国的第一任总统？,True,True,True
9,什么是互联网？,False,True,True
10,什么是电视？,False,True,True
