In [1]:
save_local = "save_local"

## 加载 FAISS 向量数据库已有结果

In [2]:
from langchain_openai import OpenAIEmbeddings
from langchain_community.vectorstores import FAISS

db = FAISS.load_local(save_local, OpenAIEmbeddings(),allow_dangerous_deserialization=True)

In [3]:
# query = "MacBook Air13寸的价格"
query = "获取MacBook Air 15寸型号的重量信息"

In [4]:
### 相似度查询，结果很冗余

In [5]:
db.similarity_search(query)

[Document(page_content='# MacBook Air15寸\n\n## 外观\n\n银色、星光色、深空灰色、午夜色\n\n## 价格\n\nRMB 10,499\nRMB 11,999\nRMB 13,499'),
 Document(page_content='# MacBook Air13寸\n\n## 外观\n\n银色 星光色 深空灰色 午夜色\n\n## 价格\n\nRMB 7999 (8 核图形处理器，256GB 固态硬盘)\nRMB 9499 (10 核图形处理器，512GB 固态硬盘)\nRMB 8999\nRMB 10,499\nRMB 11,999'),
 Document(page_content='尺寸和重量\n\n高度：1.15 厘米 (0.45 英寸)\n宽度：34.04 厘米 (13.40 英寸)\n深度：23.76 厘米 (9.35 英寸)\n重量：1.51 千克 (3.3 磅)^{5}\n深度：23.76 厘米 (9.35 英寸)\n宽度：34.04 厘米 (13.40 英寸)\n高度：1.15 厘米 (0.45 英寸)'),
 Document(page_content='包装内容\n\n13 英寸 MacBook Air\n30W USB-C 电源适配器\n(8 核图形处理器的 M2 机型和 M3 机型)\n或\n35W 双 USB-C 端口小型电源适配器\n(10 核图形处理器、512GB 存储容量的 M2 机型和 M3 机型)\nUSB-C 转 MagSafe 3 连接线\n(2 米)')]

### 使用 retriever 从向量数据库中获取结果

#### 使用参数 `k` 指定返回结果数量

In [6]:
topK_retriever = db.as_retriever(
    search_kwargs={"k": 3}
)


In [7]:
docs = topK_retriever.invoke(query)
docs

[Document(page_content='# MacBook Air15寸\n\n## 外观\n\n银色、星光色、深空灰色、午夜色\n\n## 价格\n\nRMB 10,499\nRMB 11,999\nRMB 13,499'),
 Document(page_content='# MacBook Air13寸\n\n## 外观\n\n银色 星光色 深空灰色 午夜色\n\n## 价格\n\nRMB 7999 (8 核图形处理器，256GB 固态硬盘)\nRMB 9499 (10 核图形处理器，512GB 固态硬盘)\nRMB 8999\nRMB 10,499\nRMB 11,999'),
 Document(page_content='尺寸和重量\n\n高度：1.15 厘米 (0.45 英寸)\n宽度：34.04 厘米 (13.40 英寸)\n深度：23.76 厘米 (9.35 英寸)\n重量：1.51 千克 (3.3 磅)^{5}\n深度：23.76 厘米 (9.35 英寸)\n宽度：34.04 厘米 (13.40 英寸)\n高度：1.15 厘米 (0.45 英寸)')]

#### 使用 similarity_score_threshold 设置阈值，提升结果的相关性质量

In [8]:
retriever = db.as_retriever(
     search_type="similarity_score_threshold",
    search_kwargs={"score_threshold": 0.8}
)

In [9]:
docs = retriever.invoke(query)
docs



[]

### 不带任何参数的查询 

In [10]:
retriever = db.as_retriever()

In [11]:
docs = retriever.invoke(query)
docs

[Document(page_content='# MacBook Air15寸\n\n## 外观\n\n银色、星光色、深空灰色、午夜色\n\n## 价格\n\nRMB 10,499\nRMB 11,999\nRMB 13,499'),
 Document(page_content='# MacBook Air13寸\n\n## 外观\n\n银色 星光色 深空灰色 午夜色\n\n## 价格\n\nRMB 7999 (8 核图形处理器，256GB 固态硬盘)\nRMB 9499 (10 核图形处理器，512GB 固态硬盘)\nRMB 8999\nRMB 10,499\nRMB 11,999'),
 Document(page_content='尺寸和重量\n\n高度：1.15 厘米 (0.45 英寸)\n宽度：34.04 厘米 (13.40 英寸)\n深度：23.76 厘米 (9.35 英寸)\n重量：1.51 千克 (3.3 磅)^{5}\n深度：23.76 厘米 (9.35 英寸)\n宽度：34.04 厘米 (13.40 英寸)\n高度：1.15 厘米 (0.45 英寸)'),
 Document(page_content='包装内容\n\n13 英寸 MacBook Air\n30W USB-C 电源适配器\n(8 核图形处理器的 M2 机型和 M3 机型)\n或\n35W 双 USB-C 端口小型电源适配器\n(10 核图形处理器、512GB 存储容量的 M2 机型和 M3 机型)\nUSB-C 转 MagSafe 3 连接线\n(2 米)')]