In [2]:
deployment = "gpt4"
model = "gpt-4"
embedding_deployment = "embedding"

In [2]:
!pip install chromadb



In [3]:
! pip install unstructured



# 加载文档 （Document Loader）

In [3]:
from langchain.document_loaders import DirectoryLoader
loader = DirectoryLoader('./', glob="spotmax_intro.txt")
docs = loader.load()

In [5]:
!pip install pypdf



In [4]:
from langchain.document_loaders import PyPDFLoader

loader = PyPDFLoader("Spotmax_intro_cn_2020.pdf")
docs = loader.load()

# 切割文档
这个文本分割器是通用文本的推荐分割器。它由一个字符列表参数化。它会按顺序尝试在这些字符上进行分割，直到分块足够小。默认列表是["\n\n", "\n", " ", “"]。这样做的效果是尽可能地保持所有段落（然后是句子，然后是单词）在一起。

In [5]:
from langchain.text_splitter import RecursiveCharacterTextSplitter
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size = 200,
    chunk_overlap = 10
)

In [6]:
splits = text_splitter.split_documents(docs)

In [7]:
persist_directory = 'data/'
!rm -rf ./data  

# 将数据存入向量数据库

In [8]:
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.vectorstores import Chroma
# embedding = OpenAIEmbeddings() #如何直接调用OpenAI的 GPT 服务
embedding = OpenAIEmbeddings(deployment=embedding_deployment) #通过Azure的OpenAI GPT服务
vectordb = Chroma.from_documents(
    documents=splits,
    collection_name="spotmax",
    embedding=embedding,
    persist_directory=persist_directory
)
vectordb.persist()
print(vectordb._collection.count())

8


In [9]:
docs = vectordb.similarity_search("如何提高可用性",k=2)

In [8]:
docs[0]

Document(page_content='降低中断带来的服务器容量变化带来的服务能⼒影响，实现服务及数据的提前迁移。 4.MaxGroup将根据现货价格和终⽌率的变化持续优化集群结构。  5.⽀持智能的动态负载均衡，由于集群为多机型混合，不同机型的处理能⼒有差异，智能的动态负载均衡将实现按处理能⼒的负载分配，实现集群资源利⽤的最⼤化。', metadata={'page': 1, 'source': 'Spotmax_intro_cn_2020.pdf'})

# 利用向量数据库进行QA

https://github.com/langchain-ai/langchain/blob/master/libs/langchain/langchain/chains/retrieval_qa/prompt.py

In [10]:
from langchain.chains import RetrievalQA
from langchain.chat_models import AzureChatOpenAI
# from langchain.chat_models import ChatOpenAI #直接访问OpenAI的GPT服务

#llm = ChatOpenAI(model_name="gpt-4", temperature=0) #直接访问OpenAI的GPT服务
llm = AzureChatOpenAI(deployment_name = deployment, model_name=model, temperature=0.7, max_tokens=1000) #通过Azure的OpenAI服务
retriever=vectordb.as_retriever(
    search_type="mmr", search_kwargs={"k": 3}
    #search_type="similarity", search_kwargs={"k": 3}
)
qa = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=retriever,
                                 return_source_documents=False, verbose=True)



In [11]:
result = qa({"query": "什么是SpotMax?"})
print(result["result"])




[1m> Entering new RetrievalQA chain...[0m

[1m> Finished chain.[0m
SpotMax是一个利用弹性计算资源进行云端系统成本优化的体系，包括相关产品和解决方案。SpotMax的目标是帮助用户使用云平台提供的弹性资源（例如：AWS Spot Instance）在保证系统可用性，甚至获取更高可用性的前提下，实现成本的最大化节省。这个系统是由Mobvista基于其自身降低成本的成功实践所创建的。


In [12]:
result = qa({"query": "SpotMax如何降低成本"})
print(result["result"])



[1m> Entering new RetrievalQA chain...[0m

[1m> Finished chain.[0m
SpotMax通过利用弹性计算资源来进行云端系统成本优化。它使用户能够使用云平台提供的弹性资源（如：AWS Spot Instance）在保证系统可用性，甚至获得更高可用性的前提下，实现成本的最大化节省。也就是说，SpotMax能够调配和管理这些弹性资源，以最低的成本满足系统运行的需求，从而降低整体运行成本。
