### ChatPDF

将上一节的代码整合成面向对象实现方式

In [2]:
import os
os.environ["OPENAI_API_KEY"] = "sk-xxx"
os.environ["OPENAI_API_BASE"] = "https://api.chatanywhere.tech/v1"
os.environ["OPENAI_API_MODEL"] = "gpt-4-turbo"

In [8]:
from langchain_openai import ChatOpenAI
from langchain_community.document_loaders import PyPDFLoader
from langchain_openai import OpenAIEmbeddings
from langchain_chroma import Chroma
from langchain_core.prompts import ChatPromptTemplate


class ChatPDF:
    def __init__(self, pdf_path):
        self.pdf_path = pdf_path
        self.template =  [
            ("system","你是一个专门处理文档的秘书,你从不暴露自己是AI的身份,你会根据下面提供的上下文内容来继续回答问题.\n 上下文内容\n {context} \n"),
            ("human","你好！"),
            ("ai","你好"),
            ("human","{question}"),
        ]
        self.documents = []
        self.db = None
    
    def loadFile(self):
      loader = PyPDFLoader("test.pdf")
      # 加载并分割
      self.documents = loader.load_and_split()

    def embeddingAndStore(self):
      self.db = Chroma.from_documents(self.documents, OpenAIEmbeddings())
      
      
    def querySearch(self, question):
      # 查询
      docs = self.db.similarity_search(question)
      return docs
    
    def main(self):
      self.loadFile()
      self.embeddingAndStore()
      
    def chatWithQuestion(self, question):
        try:
          
          context = self.querySearch(question)
          print('_context', context)
          chat = ChatOpenAI(model="gpt-3.5-turbo")
          
          prompt = ChatPromptTemplate.from_messages(self.template)
          messages = prompt.format_messages(context=context, question=question)
          
          res =  chat.invoke(messages)
          return res.content
        
        except Exception as e: 
            print(f"Error loading {Exception} files:{e}") 
      
      

运行代码

In [9]:
chat_pdf = ChatPDF('test.pdf')
chat_pdf.main()

In [10]:
res = chat_pdf.chatWithQuestion("公司对于员工的制服搭配有什么要求吗")
print(res)

_context [Document(page_content='易速鲜花集团 \n 13 衣扣、裤扣要扣好。内衣与制服搭配得体。内衣的衣领和袖子等不\n能露出制服。衬衣要干净，下摆扎进裤内。衣袖或裤管不可卷起，\n工作证佩戴于前胸。  \n2. 袜子要求  \n① 男员工深色，与裤子、鞋颜色一致。  \n② 女员工（穿裙子的）必须穿着肉色长筒丝袜，袜子不可破\n洞、脱丝，袜口不可外露。  \n③ 工作袜（指女员工穿着的肉色连裤丝袜 及羊毛袜）应保持\n整洁。 \n3. 鞋子要求  \n穿黑色制式皮鞋，保持干净光亮，款式大方，系好鞋带。不可\n穿凉鞋，女员工鞋跟应以 1－5cm高为宜。  \n4. 个人卫生要求   \n员工应保持个人清洁及口腔卫生，上班前不能饮酒，不能吃大\n蒜、韭菜等有异味的食物，防止口臭；只能使用清淡香水，用量适\n中，不能使客人感到刺鼻。  \n5. 坐姿要求  \n① 入座要轻缓，上身正直，抬头挺胸，双肩放松放平，双眼\n平视，面带笑容。  \n② 就座时不要把椅子坐满，坐椅子的三分之二，双膝并拢，\n手自然放在膝上，当客人走来时，应立即起立，热情招呼。  \n6. 站姿要求', metadata={'page': 13, 'source': 'test.pdf'}), Document(page_content='易速鲜花集团 \n 13 衣扣、裤扣要扣好。内衣与制服搭配得体。内衣的衣领和袖子等不\n能露出制服。衬衣要干净，下摆扎进裤内。衣袖或裤管不可卷起，\n工作证佩戴于前胸。  \n2. 袜子要求  \n① 男员工深色，与裤子、鞋颜色一致。  \n② 女员工（穿裙子的）必须穿着肉色长筒丝袜，袜子不可破\n洞、脱丝，袜口不可外露。  \n③ 工作袜（指女员工穿着的肉色连裤丝袜 及羊毛袜）应保持\n整洁。 \n3. 鞋子要求  \n穿黑色制式皮鞋，保持干净光亮，款式大方，系好鞋带。不可\n穿凉鞋，女员工鞋跟应以 1－5cm高为宜。  \n4. 个人卫生要求   \n员工应保持个人清洁及口腔卫生，上班前不能饮酒，不能吃大\n蒜、韭菜等有异味的食物，防止口臭；只能使用清淡香水，用量适\n中，不能使客人感到刺鼻。  \n5. 坐姿要求  \n① 入座要轻缓，上身正直，抬头挺胸，双肩放松放平，双眼\n平视，面带笑容。  \n② 就座时不要把椅子坐