In [21]:
from langchain.agents import Tool, AgentExecutor, LLMSingleActionAgent, AgentOutputParser
from langchain.prompts import StringPromptTemplate
from langchain.llms import OpenAI
from langchain.chains import LLMChain
from typing import List, Union
from langchain.schema import AgentAction, AgentFinish, OutputParserException
import re

from langchain.prompts import PromptTemplate, ChatPromptTemplate
from langchain.chat_models import ChatOpenAI

import chromadb
from chromadb.utils import embedding_functions

import warnings
warnings.filterwarnings('ignore')

In [28]:

client = chromadb.PersistentClient(path="/home/RAG_Chatbot/DB/chroma_storage")
sentence_transformer_ef = embedding_functions.SentenceTransformerEmbeddingFunction(model_name="paraphrase-multilingual-mpnet-base-v2")
collection = client.get_or_create_collection(name="documents_collection", embedding_function=sentence_transformer_ef)

# collection = Chroma(persist_directory="/home/RAG_Chatbot/DB/chroma_storage", embedding_function=sentence_transformer_ef, collection_name="documents_collection")

In [29]:
def semantic_query(query):
    result = collection.query(
        query_texts=query,
        n_results=3
    )

    return " ".join(result['documents'][0]).strip()

In [30]:
result = collection.query(
    query_texts="이유식",
    n_results=3
    )

In [42]:
semantic_query('이유식은 언제부터 줘야 될까요?')

'9~11개월에 후기 이유식을 먹이는데 이때는 죽이 아닌 소화가 가능한 무른 밥을 줄 수 있어. 이 시기의 주의할 점은 염분이 들어있는 음식은 피해야 한다는 거야. 아이 키우기도 벅찬데 이유식까지 하려면 엄두가 안나긴 하겠지만 이유식에 너무 스트레스 받지마. 물론 이유식도 초기, 중기로 나뉘어져 권장되는 음식이 있는데 간단히 알아만 둬. 아이가 지금 6개월은 됐다고 했지? 미음부터 시작해서 8개월이 되면 5배 죽을 먹이면 돼. 그 후 야채와 고기, 과일 등을 먹여야 한다는 얘기가 있지만 꼭 지켜야 하는건 아니니 마음 편히 가져. 얼추 근접했어. 이유식 후기는 만 10개월에서 12개월 사이에 먹이면 돼. 1일 3회먹이면 되는데, 씹고 소화시키는 능력이 높아졌기 때문에 영양소를 생각해서 다양한 재료로 이유식을 만들면 돼. 알갱이도 커지고 농도도 높아졌기 때문에 이유식에 부족할 수 있는 장 건강 영양소를 잘 먹이면서 진행하면 돼.'

In [4]:
tools = [
    Tool.from_function(
        func= semantic_query,
        name= "semantic_query",
        description="입력된 질문과 가장 유사한 문서 반환.",
        coroutine= None
    )
]

# PromptTemplate

In [46]:
# Set up the base template
template = """Answer the following questions as best you can, but speaking as a pirate might speak. You have access to the following tools:

{tools}

Use the following format:

Question: the input question you must answer
Thought: you should always think about what to do
Action: the action to take, should be one of [{tool_names}]
Action Input: the input to the action
Observation: the result of the action
... (this Thought/Action/Action Input/Observation can repeat N times)
Thought: I now know the final answer
Final Answer: the final answer to the original input question

Begin! Remember to speak as a pirate when giving your final answer. And you must speak only Korean!

Question: {input}
{agent_scratchpad}"""

In [77]:
# Set up the base template
template_ko = """Answer the following questions as best you can, but speaking as a pirate might speak. You have access to the following tools:

{tools}

Use the following format:

Question: the input question you must answer
Thought: you should always think about what to do
Action: the action to take, should be one of [{tool_names}]
Action Input: {input}
Observation: the result of the action
... (this Thought/Action/Action Input/Observation can repeat N times)
Thought: I now know the final answer
Final Answer: the final answer to the original input question

Begin! Speak as a kind Assistant. And you must speak only Korean! 

Question: {input}
{agent_scratchpad}"""

In [5]:
template_RAG = """Answer the question based only on the following context:
{context}

Question: {question}

Answer in the following language: {language}
"""

In [72]:
with open('./prompt_ex.txt', 'r') as f:
    text = f.read()

print(text)

Answer the question based only on the following context:
{context}

Question: {question}

Answer in the following language: {language}


In [6]:
# Set up a prompt template
class CustomPromptTemplate(StringPromptTemplate):
    # The template to use
    template: str
    # The list of tools available
    tools: List[Tool]

    def format(self, **kwargs) -> str:
        # Get the intermediate steps (AgentAction, Observation tuples)
        # Format them in a particular way
        intermediate_steps = kwargs.pop("intermediate_steps")
        thoughts = ""
        for action, observation in intermediate_steps:
            thoughts += action.log
            thoughts += f"\nObservation: {observation}\nThought: "
        # Set the agent_scratchpad variable to that value
        kwargs["agent_scratchpad"] = thoughts
        # Create a tools variable from the list of tools provided
        kwargs["tools"] = "\n".join([f"{tool.name}: {tool.description}" for tool in self.tools])
        # Create a list of tool names for the tools provided
        kwargs["tool_names"] = ", ".join([tool.name for tool in self.tools])
        return self.template.format(**kwargs)

In [57]:
# Set up a prompt template
class RAGPromptTemplate(StringPromptTemplate):
    # The template to use
    template: str
    # The list of tools available

    def format(self, question: str) -> str:

        str_inputs = {}
        # Set the agent_scratchpad variable to that value
        str_inputs["context"] = semantic_query(question)
        # Create a tools variable from the list of tools provided
        str_inputs["question"] = question
        # Create a list of tool names for the tools provided
        str_inputs["language"] = "korean"
        return self.template.format(**str_inputs)

In [64]:
prompt_rag = PromptTemplate.from_template(template_RAG)

In [9]:
prompt = CustomPromptTemplate(
    template=template_RAG,
    tools=tools,
    # This omits the `agent_scratchpad`, `tools`, and `tool_names` variables because those are generated dynamically
    # This includes the `intermediate_steps` variable because that is needed
    input_variables=["input", "intermediate_steps"]
)

In [65]:
prompt_rag

PromptTemplate(input_variables=['context', 'language', 'question'], template='Answer the question based only on the following context:\n{context}\n\nQuestion: {question}\n\nAnswer in the following language: {language}\n')

# Custon Output parser

In [10]:
class CustomOutputParser(AgentOutputParser):

    def parse(self, llm_output: str) -> Union[AgentAction, AgentFinish]:
        # Check if agent should finish
        if "Final Answer:" in llm_output:
            return AgentFinish(
                # Return values is generally always a dictionary with a single `output` key
                # It is not recommended to try anything else at the moment :)
                return_values={"output": llm_output.split("Final Answer:")[-1].strip()},
                log=llm_output,
            )
        # Parse out the action and action input
        regex = r"Action\s*\d*\s*:(.*?)\nAction\s*\d*\s*Input\s*\d*\s*:[\s]*(.*)"
        match = re.search(regex, llm_output, re.DOTALL)
        if not match:
            raise OutputParserException(f"Could not parse LLM output: `{llm_output}`")
        action = match.group(1).strip()
        action_input = match.group(2)
        # Return the action and action input
        return AgentAction(tool=action, tool_input=action_input.strip(" ").strip('"'), log=llm_output)

In [11]:
output_parser = CustomOutputParser()

# LLM

In [8]:
api_key = "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"

In [79]:
llm = ChatOpenAI(model_name='gpt-3.5-turbo', temperature=0, openai_api_key=api_key)

# Agent

In [66]:
# LLM chain consisting of the LLM and a prompt
llm_chain = LLMChain(llm=llm, prompt=prompt_rag)

In [67]:
que1 = "이유식은 언제부터 줘도 될까요?"
que2 = "세계 최초의 전자게임은 무엇인가요?"

In [68]:
llm_chain.run({'question':que1, "context": semantic_query(que1), 'language': 'korean'})

'이유식은 아기가 4개월 이상일 때부터 줄 수 있습니다.'

In [15]:
tool_names = [tool.name for tool in tools]
agent = LLMSingleActionAgent(
    llm_chain=llm_chain,
    output_parser=output_parser,
    stop=["\nObservation:"],
    allowed_tools=tool_names
)

In [16]:
agent_executor = AgentExecutor.from_agent_and_tools(agent=agent, tools=tools, verbose=True, handle_parsing_errors=True)

In [17]:
agent_executor.run("이유식은 언제부터 줄까요?")



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mThought: 이유식은 아기가 성장하고 영양을 얻을 수 있는 중요한 식사입니다. 언제부터 이유식을 시작해야 할지 알아보아야겠습니다.
Action: semantic_query
Action Input: 이유식 시작 시기[0m

Observation:[36;1m[1;3m김치 담글 때 찹쌀 풀을 넣으면 발효에도 도움이 되고 남은 풋내도 잡아줘. 혹시 그때 열무를 많이 뒤적거린 것 아닐까? 열무는 살살 다뤄야 풋내가 덜 해. 맞아, 절임배추 잎을 한 장씩 들춰가면서 만들어 놓은 김치소를 넣어 버무려 김치통에 가지런하게 담아주면 끝이야. 호박은 박과의 호박속에 속하며, 한해살이 덩굴채소 및 그 열매를 말하죠.[0m
[32;1m[1;3m이유식 시작 시기에 대한 정보가 아니라 김치 담는 방법과 호박에 대한 설명이 나왔습니다. 다시 시도해보겠습니다.

Action: semantic_query
Action Input: 이유식 시작 시기[0m

Observation:[36;1m[1;3m김치 담글 때 찹쌀 풀을 넣으면 발효에도 도움이 되고 남은 풋내도 잡아줘. 혹시 그때 열무를 많이 뒤적거린 것 아닐까? 열무는 살살 다뤄야 풋내가 덜 해. 맞아, 절임배추 잎을 한 장씩 들춰가면서 만들어 놓은 김치소를 넣어 버무려 김치통에 가지런하게 담아주면 끝이야. 호박은 박과의 호박속에 속하며, 한해살이 덩굴채소 및 그 열매를 말하죠.[0m
[32;1m[1;3m이번에도 이유식 시작 시기에 대한 정보가 아니라 김치 담는 방법과 호박에 대한 설명이 나왔습니다. 다시 시도해보겠습니다.

Action: semantic_query
Action Input: 이유식 시작 시기[0m

Observation:[36;1m[1;3m김치 담글 때 찹쌀 풀을 넣으면 발효에도 도움이 되고 남은 풋내도 잡아줘. 혹시 그때 열무를 많이 뒤적거린 것 아닐까? 열무는 살살 다뤄야 풋내가 덜 

KeyboardInterrupt: 

In [101]:
semantic_query("이유식 시작 시기")

'김치 담글 때 찹쌀 풀을 넣으면 발효에도 도움이 되고 남은 풋내도 잡아줘. 혹시 그때 열무를 많이 뒤적거린 것 아닐까? 열무는 살살 다뤄야 풋내가 덜 해. 맞아, 절임배추 잎을 한 장씩 들춰가면서 만들어 놓은 김치소를 넣어 버무려 김치통에 가지런하게 담아주면 끝이야. 호박은 박과의 호박속에 속하며, 한해살이 덩굴채소 및 그 열매를 말하죠.'

In [70]:
agent_executor.run("안녕하세요")



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mThought: 이 질문은 인사하는 내용이다.
Action: 생각해보자.
Final Answer: 안녕하세요! 어떻게 도와드릴까요?[0m

[1m> Finished chain.[0m


'안녕하세요! 어떻게 도와드릴까요?'