In [4]:
# chatbot
from langchain.chat_models import ChatOpenAI
from langchain.schema import AIMessage, HumanMessage, SystemMessage

# llm
from langchain import PromptTemplate, LLMChain
from langchain.llms import OpenAI

import gradio as gr
import os
import os

os.environ["OPENAI_API_KEY"] = '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'

from langchain.document_loaders import PyPDFLoader
from langchain.vectorstores import Chroma
from langchain.chat_models import ChatOpenAI
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.chains import RetrievalQA, ConversationalRetrievalChain

chat_template = """
나는 개인정보 유출 관련 상담을 진행하는 챗봇이다

0. 사용자의 상담내용에 집중하고 그에 맞는 답변을 자세히 알려줘야한다.
1. 사례를 들어서 설명한다.
2. 친절하게 답변한다.

"""

chat_ai = ChatOpenAI(temperature=0.5, model="gpt-3.5-turbo")


# Retrieval QA Chain 생성
loader = PyPDFLoader("data/2021.pdf")
# Split the text in chunks, using LangChain Recursive Character Text Splitter
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000,
    chunk_overlap=200
    )

pages = loader.load_and_split(text_splitter)

directory = 'data'
vector_index = Chroma.from_documents(
    pages, # Documents
    OpenAIEmbeddings(), # Text embedding model
    persist_directory=directory # persists the vectors to the file system
    )

vector_index.persist()

retriever = vector_index.as_retriever(
    search_type="similarity", # Cosine Similarity
    search_kwargs={
        "k": 3, # Select top k search results
    }
)

qa_chain = RetrievalQA.from_chain_type(
    llm=ChatOpenAI(temperature=0, model="gpt-4"),
    chain_type="stuff",
    retriever=retriever,
    return_source_documents=True # source document which were used as source files
)


# 이전 대화 내용을 저장할 변수
previous_conversations = []

def qa_response(message, history):
    global previous_conversations  # 전역 변수를 함수 내에서 사용하기 위해 선언

    # 대화가 계속될 경우 이전 대화 내용에 추가하고 응답 생성
    chats = qa_chain.invoke(message)
    previous_conversations.append(("사용자", message))
    previous_conversations.append(("AI", chats["result"]))

    # 대화종료를 입력하면 최종 요약 출력
    if message == "대화종료":
        # 최종 요약 생성
        summary = summarize(previous_conversations)
        return summary

    return chats["result"]

# 요약 llm 모델 추가
# summarize_llm과 history로 출력
def summarize(history):
    # 사용자의 대화와 AI 대답을 모두 정리해서 요약
    conversation_text = "\n".join([f"{speaker} : {utterance}" for speaker, utterance in history])

    summarize_llm = OpenAI(
        temperature=0.3, model="gpt-3.5-turbo-instruct", max_tokens=512
    )

    summarize_template = """
    필수 : 사용자의 대화와 AI 대답을 모두 정리해서 요약해줘.
    """

    summarize_prompt = PromptTemplate(
        template=summarize_template, input_variables=["texts"]
    )
    summarize_chain = LLMChain(prompt=summarize_prompt, llm=summarize_llm)

    return summarize_chain.run(conversation_text)




gr.ChatInterface(
    fn=qa_response, 
    textbox=gr.Textbox(placeholder="채팅을 입력해주세요..", container=False, scale=7),
    # 채팅창의 크기를 조절한다.
    chatbot=gr.Chatbot(height=1000),
    title="개인정보 유출 피해 상담 챗봇",
    description='대화가 끝나면 "대화종료" 를 입력해주세요',
    theme="soft",
    examples=[["공공기관에서 동의 없이 개인정보를 경찰서 같은 수사기관에 제공했는데 이 행위에 대해서 손해배상을 요구할 수 있나요?"], ["저작권 관련해서"]],
    retry_btn="다시보내기 ↩",
    undo_btn="이전챗 삭제 ❌",
    clear_btn="전챗 삭제 💫",
).launch(share=True)

Running on local URL:  http://127.0.0.1:7860

Could not create share link. Please check your internet connection or our status page: https://status.gradio.app.


