# Task Oriented Dialogue System with LLM

In [None]:
!pip install openai==1.6.0 langchain==0.0.350

In [51]:
import os
from datetime import datetime, timedelta

from langchain.chat_models import ChatOpenAI
from langchain.chains import LLMChain
from langchain.prompts import (
    ChatPromptTemplate,
    HumanMessagePromptTemplate,
    MessagesPlaceholder,
    SystemMessagePromptTemplate,
    AIMessagePromptTemplate
)
from langchain.chains import create_extraction_chain

In [52]:
api_key = os.environ.get("OPENAI_API_KEY")

## Prompt

### NLU Prompt

In [53]:
nlu_prompt_text = """당신은 일정관리 시스템 입니다. 일정관리를 위해 필요한 slot, value를 추출합니다.

event_name이 확실하지 않을 땐 추출하지 않습니다.
time은 HH:MM 형식으로 출력합니다.
date는 YYYY-MM-DD 형식으로 출력합니다.

현재날짜: {today}
"""

### DST Prompt

In [54]:
dst_prompt_text = """당신은 일정관리 시스템의 Dialog State Tracker 입니다. 
일정관리를 위해 nlu_result를 분석하여 dialog_state를 업데이트 하세요.
read를 수행하기 위해서는 1개 이상의 db가 필요합니다.
update, delete를 수행하기 위해서는 오직 1개의 db만 필요합니다.
업데이트 된 dialog_state에는 현재 dialog_state db에 있는 값 중 slot, value 조건에 맞는 값만 남겨놓습니다.


# data
nlu_result: {nlu_result}
dialog_state: {dialog_state}
현재날짜: {today}

# 응답
- 업데이트된 dialog_state 를 dict 형태로 출력
"""

### DP Prompt

In [None]:
dp_prompt_text = """당신은 일정관리 시스템의 Dialog Policy 입니다.
dialog_state를 분석하여 system_action을 결정하세요.

# data
dialog_state: {dialog_state}
현재날짜: {today}

# 응답
- 형식: system_action을 dict 형태로 출력
- keys:
  - system_action: (Required) 
    - inform: 정보를 알려줄 때
    - request: 부족한 정보를 물어볼 때 slot을 함께 출력
    - run_action: 필요한 정보를 충족할 경우 dialog_state의 action을 수행
  - slot: event_name, date, time (Optional)
  - value: str (Optional)
"""

### NLG Prompt

In [56]:
nlg_prompt_text = """당신은 일정관리 시스템의 Natural Language Generator 입니다.
system_stater값을 이용하여 user에게 자연어 형태로 응답하세요.

# data
system_state: {system_state}
현재날짜: {today}

# 응답
- 자연어 형태로 출력
"""

## Agent

In [57]:
class PromptAgent:
    def __init__(self, llm, verbose=False):
        self.dp_chain = None
        self.nlu_chain = None
        self.dst_chain = None
        self.nlg_chain = None
        self.llm = llm
        self.verbose = verbose

        self.init_nlu_chain()
        self.init_dst_chain()
        self.init_nlg_chain()
        self.init_dp_chain()

        self.today = datetime.today().strftime("%Y-%m-%d %H:%M")

    def init_nlu_chain(self):
        schema = {
            "properties": {
                "event_name": {"type": "string"},
                "action": {"type": "string", "enum": ["create", "read", "update", "delete", "inform", "request"]},
                "date": {"type": "string", "description": "날짜"},
                "time": {"type": "string", "description": "시간"},
            },
            "required": ["action"],
        }

        nlu_prompt = ChatPromptTemplate(
            messages=[
                AIMessagePromptTemplate.from_template(nlu_prompt_text),
                HumanMessagePromptTemplate.from_template("{user_input}"),
            ]
        )

        self.nlu_chain = create_extraction_chain(schema, self.llm, prompt=nlu_prompt, verbose=True)

    def run_nlu_chain(self, inp):
        response = self.nlu_chain.run({'user_input': inp, 'today': self.today})
        return response[0]

    def init_dst_chain(self):
        dst_prompt = ChatPromptTemplate(
            messages=[
                AIMessagePromptTemplate.from_template(dst_prompt_text),
                # HumanMessagePromptTemplate.from_template("{user_input}"),
            ],
            input_variables=["nlu_result", "dialog_state", "today"],
        )
        self.dst_chain = LLMChain(llm=self.llm, prompt=dst_prompt, verbose=True)

    def run_dst_chain(self, dialog_state, nlu_result):
        response = self.dst_chain.run({'dialog_state': dialog_state, 'nlu_result': nlu_result, 'today': self.today})
        return eval(response)

    def init_dp_chain(self):
        dp_prompt = ChatPromptTemplate(
            messages=[
                AIMessagePromptTemplate.from_template(dp_prompt_text),
                # HumanMessagePromptTemplate.from_template("{user_input}"),
            ]
        )
        self.dp_chain = LLMChain(llm=self.llm, prompt=dp_prompt, verbose=True)

    def run_dp_chain(self, dialog_state):
        response = self.dp_chain.run({'dialog_state': dialog_state, 'today': self.today})
        return eval(response)

    def init_nlg_chain(self):
        nlg_prompt = ChatPromptTemplate(
            messages=[
                AIMessagePromptTemplate.from_template(nlg_prompt_text),
                # HumanMessagePromptTemplate.from_template("{user_input}"),
            ]
        )
        self.nlg_chain = LLMChain(llm=self.llm, prompt=nlg_prompt, verbose=True)

    def run_nlg_chain(self, system_state):
        response = self.nlg_chain.run({'system_state': system_state, 'today': self.today})
        return response

    def update_dialog_state(self, dialog_state, db=None):
        action = dialog_state['action']

        if db:
            dialog_state.update({'db': db})

        if action == 'read':
            pass

        elif action == 'update':
            db = dialog_state['db']

            if len(db) == 1:
                for key, val in db[0].items():
                    if key in dialog_state.keys():
                        if dialog_state[key] == '':
                            dialog_state[key] = val

        return dialog_state

    def update_system_state(self, system_state, dialog_state):
        action = dialog_state['action']
        db = dialog_state['db']
        system_action = system_state['system_action']

        if system_action == 'inform':
            pass
        elif system_action == 'request':
            pass
        elif system_action == 'run_action':
            if action == 'read':
                system_state['db'] = db
            elif action == 'update':
                # update DB
                for key, val in db[0].items():
                    system_state[key] = val
                for key, val in dialog_state.items():
                    if key != 'db':
                        system_state[key] = val

        system_state['action'] = action
        return system_state

## TOD Example

### LangChain Model 생성

In [58]:
llm = ChatOpenAI(temperature=0, model="gpt-3.5-turbo", api_key=api_key)
prompt_agent = PromptAgent(llm=llm, verbose=True)

### Dialog State 초기화

In [None]:
dialog_state = {'event_name': '', 'action': '', 'date': '', 'time': '', 'db': []}

### 모의 DB 생성

In [None]:
date_today = datetime.today().strftime("%Y-%m-%d")
date_tomorrow = (datetime.today() + timedelta(days=1)).strftime("%Y-%m-%d")
schedule_list = [
    {
        'event_name': '산책가기',
        'date': date_today,
        'time': '10:00'
    },
    {
        'event_name': '데이트',
        'date': date_tomorrow,
        'time': '12:00'
    }
]

### Run NLU Chain

In [None]:
inp = '내일 일정을 조회해줘'
nlu_result = prompt_agent.run_nlu_chain(inp=inp)



[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3mAI: 당신은 일정관리 시스템 입니다. 일정관리를 위해 필요한 slot, value를 추출합니다.

event_name이 확실하지 않을 땐 추출하지 않습니다.
time은 HH:MM 형식으로 출력합니다.
date는 YYYY-MM-DD 형식으로 출력합니다.

현재날짜: 2023-12-22 01:38

Human: 내일 일정을 조회해줘[0m

[1m> Finished chain.[0m


In [62]:
nlu_result

{'event_name': '', 'action': 'read', 'date': '2023-12-23', 'time': ''}

#### Update Dialog State

In [63]:
user_action = nlu_result['action']

if user_action == 'read':
    schedule_db = schedule_list
else:
    schedule_db = []

dialog_state = prompt_agent.update_dialog_state(dialog_state=dialog_state, db=schedule_db)

In [64]:
dialog_state

{'event_name': '',
 'action': '',
 'date': '',
 'time': '',
 'db': [{'event_name': '산책가기', 'date': '2023-12-22', 'time': '10:00'},
  {'event_name': '데이트', 'date': '2023-12-23', 'time': '12:00'}]}

### Run DST Chain

In [65]:
dst_result = prompt_agent.run_dst_chain(dialog_state=dialog_state, nlu_result=nlu_result)
dialog_state = dst_result



[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3mAI: 당신은 일정관리 시스템의 Dialog State Tracker 입니다. 
일정관리를 위해 nlu_result를 분석하여 dialog_state를 업데이트 하세요.
read를 수행하기 위해서는 1개 이상의 db가 필요합니다.
update, delete를 수행하기 위해서는 오직 1개의 db만 필요합니다.
업데이트 된 dialog_state에는 현재 dialog_state db에 있는 값 중 slot, value 조건에 맞는 값만 남겨놓습니다.


# data
nlu_result: {'event_name': '', 'action': 'read', 'date': '2023-12-23', 'time': ''}
dialog_state: {'event_name': '', 'action': '', 'date': '', 'time': '', 'db': [{'event_name': '산책가기', 'date': '2023-12-22', 'time': '10:00'}, {'event_name': '데이트', 'date': '2023-12-23', 'time': '12:00'}]}
현재날짜: 2023-12-22 01:38

# 응답
- 업데이트된 dialog_state 를 dict 형태로 출력
[0m

[1m> Finished chain.[0m


In [66]:
dialog_state

{'event_name': '',
 'action': 'read',
 'date': '2023-12-23',
 'time': '',
 'db': [{'event_name': '데이트', 'date': '2023-12-23', 'time': '12:00'}]}

#### Update Dialog State

In [67]:
dialog_state = prompt_agent.update_dialog_state(dialog_state=dialog_state)

In [68]:
dialog_state

{'event_name': '',
 'action': 'read',
 'date': '2023-12-23',
 'time': '',
 'db': [{'event_name': '데이트', 'date': '2023-12-23', 'time': '12:00'}]}

### Run DP Chain

In [69]:
system_state = prompt_agent.run_dp_chain(dialog_state=dialog_state)



[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3mAI: 당신은 일정관리 시스템의 Dialog Policy 입니다.
dialog_state를 분석하여 system_action을 결정하세요.

# data
dialog_state: {'event_name': '', 'action': 'read', 'date': '2023-12-23', 'time': '', 'db': [{'event_name': '데이트', 'date': '2023-12-23', 'time': '12:00'}]}
현재날짜: 2023-12-22 01:38

# 응답
- 형식: system_action을 dict 형태로 출력
- keys:
  - system_action: (Required) 
    - inform: 정보를 알려줄 때
    - request: 부족한 정보를 물어볼 때 slot을 함께 출력
    - run_action: 필요한 정보를 충족할 경우 dialog_state의 action을 수행
  - slot: event_name, date, time (Optional)
  - value: str (Optional)
[0m

[1m> Finished chain.[0m


In [70]:
system_state

{'system_action': 'run_action'}

#### Update System State

In [71]:
system_state = prompt_agent.update_system_state(system_state=system_state, dialog_state=dialog_state)

In [72]:
system_state

{'system_action': 'run_action',
 'db': [{'event_name': '데이트', 'date': '2023-12-23', 'time': '12:00'}],
 'action': 'read'}

### Run NLG Chain

In [73]:
nlg_result = prompt_agent.run_nlg_chain(system_state)



[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3mAI: 당신은 일정관리 시스템의 Natural Language Generator 입니다.
system_stater값을 이용하여 user에게 자연어 형태로 응답하세요.

# data
system_state: {'system_action': 'run_action', 'db': [{'event_name': '데이트', 'date': '2023-12-23', 'time': '12:00'}], 'action': 'read'}
현재날짜: 2023-12-22 01:38

# 응답
- 자연어 형태로 출력
[0m

[1m> Finished chain.[0m


In [74]:
nlg_result

'당신의 데이트 일정은 2023년 12월 23일 12시에 예정되어 있습니다.'

### Run NLU Chain (2nd turn)

In [75]:
inp = '일정을 이틀 후로 변경해줘'
nlu_result = prompt_agent.run_nlu_chain(inp=inp)



[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3mAI: 당신은 일정관리 시스템 입니다. 일정관리를 위해 필요한 slot, value를 추출합니다.

event_name이 확실하지 않을 땐 추출하지 않습니다.
time은 HH:MM 형식으로 출력합니다.
date는 YYYY-MM-DD 형식으로 출력합니다.

현재날짜: 2023-12-22 01:38

Human: 일정을 이틀 후로 변경해줘[0m

[1m> Finished chain.[0m


In [76]:
nlu_result

{'action': 'update', 'date': '2023-12-24'}

In [77]:
user_action = nlu_result['action']

if user_action == 'read':
    schedule_db = schedule_list
else:
    schedule_db = []

dialog_state = prompt_agent.update_dialog_state(dialog_state=dialog_state, db=schedule_db)

In [78]:
dialog_state

{'event_name': '',
 'action': 'read',
 'date': '2023-12-23',
 'time': '',
 'db': [{'event_name': '데이트', 'date': '2023-12-23', 'time': '12:00'}]}

### Run DST Chain (2nd turn)

In [79]:
dst_result = prompt_agent.run_dst_chain(dialog_state=dialog_state, nlu_result=nlu_result)
dialog_state = dst_result



[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3mAI: 당신은 일정관리 시스템의 Dialog State Tracker 입니다. 
일정관리를 위해 nlu_result를 분석하여 dialog_state를 업데이트 하세요.
read를 수행하기 위해서는 1개 이상의 db가 필요합니다.
update, delete를 수행하기 위해서는 오직 1개의 db만 필요합니다.
업데이트 된 dialog_state에는 현재 dialog_state db에 있는 값 중 slot, value 조건에 맞는 값만 남겨놓습니다.


# data
nlu_result: {'action': 'update', 'date': '2023-12-24'}
dialog_state: {'event_name': '', 'action': 'read', 'date': '2023-12-23', 'time': '', 'db': [{'event_name': '데이트', 'date': '2023-12-23', 'time': '12:00'}]}
현재날짜: 2023-12-22 01:38

# 응답
- 업데이트된 dialog_state 를 dict 형태로 출력
[0m

[1m> Finished chain.[0m


In [80]:
dialog_state

{'event_name': '',
 'action': 'update',
 'date': '2023-12-24',
 'time': '',
 'db': [{'event_name': '데이트', 'date': '2023-12-23', 'time': '12:00'}]}

In [81]:
dialog_state = prompt_agent.update_dialog_state(dialog_state=dialog_state)

In [82]:
dialog_state

{'event_name': '데이트',
 'action': 'update',
 'date': '2023-12-24',
 'time': '12:00',
 'db': [{'event_name': '데이트', 'date': '2023-12-23', 'time': '12:00'}]}

### Run DP Chain (2nd turn)

In [83]:
system_state = prompt_agent.run_dp_chain(dialog_state=dialog_state)



[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3mAI: 당신은 일정관리 시스템의 Dialog Policy 입니다.
dialog_state를 분석하여 system_action을 결정하세요.

# data
dialog_state: {'event_name': '데이트', 'action': 'update', 'date': '2023-12-24', 'time': '12:00', 'db': [{'event_name': '데이트', 'date': '2023-12-23', 'time': '12:00'}]}
현재날짜: 2023-12-22 01:38

# 응답
- 형식: system_action을 dict 형태로 출력
- keys:
  - system_action: (Required) 
    - inform: 정보를 알려줄 때
    - request: 부족한 정보를 물어볼 때 slot을 함께 출력
    - run_action: 필요한 정보를 충족할 경우 dialog_state의 action을 수행
  - slot: event_name, date, time (Optional)
  - value: str (Optional)
[0m

[1m> Finished chain.[0m


In [84]:
system_state

{'system_action': 'run_action'}

In [85]:
system_state = prompt_agent.update_system_state(system_state=system_state, dialog_state=dialog_state)

In [86]:
system_state

{'system_action': 'run_action',
 'event_name': '데이트',
 'date': '2023-12-24',
 'time': '12:00',
 'action': 'update'}

### Run NLG Chain (2nd turn)

In [87]:
nlg_result = prompt_agent.run_nlg_chain(system_state)



[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3mAI: 당신은 일정관리 시스템의 Natural Language Generator 입니다.
system_stater값을 이용하여 user에게 자연어 형태로 응답하세요.

# data
system_state: {'system_action': 'run_action', 'event_name': '데이트', 'date': '2023-12-24', 'time': '12:00', 'action': 'update'}
현재날짜: 2023-12-22 01:38

# 응답
- 자연어 형태로 출력
[0m

[1m> Finished chain.[0m


In [88]:
nlg_result

'데이트 일정이 2023년 12월 24일 12시로 업데이트되었습니다.'