In [1]:
!pip install faiss-cpu

[0m

In [2]:
# 需要 CUDA 7.5+ 版本支持的 GPU
#!pip install faiss-gpu 

# Faiss 向量数据库

In [2]:
from langchain_openai import OpenAIEmbeddings
from langchain.text_splitter import CharacterTextSplitter
from langchain.vectorstores import FAISS
from langchain.document_loaders import TextLoader

In [25]:
# 实例化文档加载器
loader = TextLoader("/Users/xiangyufan/code/sales_chatbot/llm_case_sales_data.txt")
# 加载文档
documents = loader.load()

In [26]:
# 实例化文本分割器
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
# 分割文本
docs = text_splitter.split_documents(documents)

In [27]:
docs

[Document(page_content='1. [客户问题]：这个课程适合我吗？\n   [销售回答]：这个课程设计得非常全面，无论您是初学者还是有一些基础，都能在课程中找到适合您的部分。\n\n2. [客户问题]：这个课程的学习时间长吗？\n   [销售回答]：这个课程的学习时间取决于您的学习进度，但它的模块设计灵活，您可以根据自己的时间安排进行学习。\n\n3. [客户问题]：我能从这个课程中学到什么？\n   [销售回答]：这个课程涵盖了大模型的基础知识、实践应用和最新的研究进展，您将有机会掌握大模型的全面知识。\n\n4. [客户问题]：这个课程的教学质量如何？\n   [销售回答]：我们的课程由行业专家授课，他们在大模型领域有丰富的经验和深厚的理论基础，我们对教学质量有着严格的把控。\n\n5. [客户问题]：我需要哪些预备知识才能学习这个课程？\n   [销售回答]：这个课程需要一些基础的编程知识，但即使您是初学者，我们也提供了入门模块帮助您建立基础。\n\n6. [客户问题]：这个课程的价格如何？\n   [销售回答]：我们的课程定价非常公平，考虑到了课程的内容、教学质量和市场情况。同时，我们也提供了一些优惠政策，如学生优惠等。\n\n7. [客户问题]：完成这个课程后，我能得到证书吗？\n   [销售回答]：是的，完成课程并通过考核后，您将获得我们提供的课程完成证书，这将是您专业技能的有力证明。\n\n8. [客户问题]：我可以试听一下这个课程吗？\n   [销售回答]：当然，我们为您提供了试听课程，您可以先体验一下我们的教学风格和课程内容。\n\n9. [客户问题]：我有问题可以咨询谁？\n   [销售回答]：我们有专门的学习支持团队，您在学习过程中遇到任何问题，都可以随时联系他们。\n\n10. [客户问题]：我可以分期付款吗？\n    [销售回答]：我们提供了多种付款方式，包括分期付款，我们希望每一位学员都能无压力地学习。\n\n11. [客户问题]：我已经有一些基础了，这个课程是不是会太简单？\n    [销售回答]：这个课程设计得非常全面，不仅有适合初学者的基础模块，也有适合有经验学员的深度模块。\n\n12. [客户问题]：我没有编程基础，能学吗？\n    [销售回答]：当然可以，我们的课程会从最基础的部分开始教起，让您有足够的

In [28]:
# OpenAI Embedding 模型
embeddings = OpenAIEmbeddings()

In [29]:
# FAISS 向量数据库，使用 docs 的向量作为初始化存储
db = FAISS.from_documents(docs, embeddings)

In [30]:
# 构造提问 Query
query = "学这个需要有基础吗"

## 相似度搜索

In [31]:
# 在 Faiss 中进行相似度搜索，找出与 query 最相似结果
docs = db.similarity_search(query)

In [32]:
# 输出 Faiss 中最相似结果
print(docs[0].page_content)

1. [客户问题]：这个课程适合我吗？
   [销售回答]：这个课程设计得非常全面，无论您是初学者还是有一些基础，都能在课程中找到适合您的部分。

2. [客户问题]：这个课程的学习时间长吗？
   [销售回答]：这个课程的学习时间取决于您的学习进度，但它的模块设计灵活，您可以根据自己的时间安排进行学习。

3. [客户问题]：我能从这个课程中学到什么？
   [销售回答]：这个课程涵盖了大模型的基础知识、实践应用和最新的研究进展，您将有机会掌握大模型的全面知识。

4. [客户问题]：这个课程的教学质量如何？
   [销售回答]：我们的课程由行业专家授课，他们在大模型领域有丰富的经验和深厚的理论基础，我们对教学质量有着严格的把控。

5. [客户问题]：我需要哪些预备知识才能学习这个课程？
   [销售回答]：这个课程需要一些基础的编程知识，但即使您是初学者，我们也提供了入门模块帮助您建立基础。

6. [客户问题]：这个课程的价格如何？
   [销售回答]：我们的课程定价非常公平，考虑到了课程的内容、教学质量和市场情况。同时，我们也提供了一些优惠政策，如学生优惠等。

7. [客户问题]：完成这个课程后，我能得到证书吗？
   [销售回答]：是的，完成课程并通过考核后，您将获得我们提供的课程完成证书，这将是您专业技能的有力证明。

8. [客户问题]：我可以试听一下这个课程吗？
   [销售回答]：当然，我们为您提供了试听课程，您可以先体验一下我们的教学风格和课程内容。

9. [客户问题]：我有问题可以咨询谁？
   [销售回答]：我们有专门的学习支持团队，您在学习过程中遇到任何问题，都可以随时联系他们。

10. [客户问题]：我可以分期付款吗？
    [销售回答]：我们提供了多种付款方式，包括分期付款，我们希望每一位学员都能无压力地学习。

11. [客户问题]：我已经有一些基础了，这个课程是不是会太简单？
    [销售回答]：这个课程设计得非常全面，不仅有适合初学者的基础模块，也有适合有经验学员的深度模块。

12. [客户问题]：我没有编程基础，能学吗？
    [销售回答]：当然可以，我们的课程会从最基础的部分开始教起，让您有足够的时间和资源掌握所需的编程技能。


## 持久化存储 Faiss DB

In [33]:
db.save_local("llm_case_sale")

## 加载 Faiss DB

In [37]:
new_db = FAISS.load_local("llm_case_sale", embeddings, allow_dangerous_deserialization=True)

In [38]:
docs = new_db.similarity_search(query)

In [39]:
print(docs[0].page_content)

1. [客户问题]：这个课程适合我吗？
   [销售回答]：这个课程设计得非常全面，无论您是初学者还是有一些基础，都能在课程中找到适合您的部分。

2. [客户问题]：这个课程的学习时间长吗？
   [销售回答]：这个课程的学习时间取决于您的学习进度，但它的模块设计灵活，您可以根据自己的时间安排进行学习。

3. [客户问题]：我能从这个课程中学到什么？
   [销售回答]：这个课程涵盖了大模型的基础知识、实践应用和最新的研究进展，您将有机会掌握大模型的全面知识。

4. [客户问题]：这个课程的教学质量如何？
   [销售回答]：我们的课程由行业专家授课，他们在大模型领域有丰富的经验和深厚的理论基础，我们对教学质量有着严格的把控。

5. [客户问题]：我需要哪些预备知识才能学习这个课程？
   [销售回答]：这个课程需要一些基础的编程知识，但即使您是初学者，我们也提供了入门模块帮助您建立基础。

6. [客户问题]：这个课程的价格如何？
   [销售回答]：我们的课程定价非常公平，考虑到了课程的内容、教学质量和市场情况。同时，我们也提供了一些优惠政策，如学生优惠等。

7. [客户问题]：完成这个课程后，我能得到证书吗？
   [销售回答]：是的，完成课程并通过考核后，您将获得我们提供的课程完成证书，这将是您专业技能的有力证明。

8. [客户问题]：我可以试听一下这个课程吗？
   [销售回答]：当然，我们为您提供了试听课程，您可以先体验一下我们的教学风格和课程内容。

9. [客户问题]：我有问题可以咨询谁？
   [销售回答]：我们有专门的学习支持团队，您在学习过程中遇到任何问题，都可以随时联系他们。

10. [客户问题]：我可以分期付款吗？
    [销售回答]：我们提供了多种付款方式，包括分期付款，我们希望每一位学员都能无压力地学习。

11. [客户问题]：我已经有一些基础了，这个课程是不是会太简单？
    [销售回答]：这个课程设计得非常全面，不仅有适合初学者的基础模块，也有适合有经验学员的深度模块。

12. [客户问题]：我没有编程基础，能学吗？
    [销售回答]：当然可以，我们的课程会从最基础的部分开始教起，让您有足够的时间和资源掌握所需的编程技能。
