# Agent 개요

- Agent 대형 언어 모델(LLM)과 다양한 도구(Tool)를 결합하여 복잡한 작업을 처리할 수 있도록 설계된 사용자 요청 처리 인공지능 시스템이다.
    - Agent는 주어진 목표를 달성하기 위해 환경(toolkit)과 상호작용하며 의사 결정을 내리고 행동을 취하는 자율적인 개체이다.
    - Agent의 자율적인 의사 결정은 LLM 이 담당하여 사람의 개입이 최소화 된다.

## Agent의 주요 특징
- **자율성**: 사전 정의된 규칙 없이도 스스로 결정을 내리고 행동할 수 있다.
- **목표 지향성**: 특정 목표나 작업을 달성하기 위해 설계되어 있다.
- **도구 활용**: 다양한 도구나 API를 활용하여 작업을 수행한다.

## Agent 기본 동작 원리

![agent_concept](figures/agent_concept.png)

### ReAct
- Reasoning and Acting의 약자로, 에이전트가 문제를 해결할 때 추론과 행동을 결합하는 방식이다.

#### 동작 단계
- **사용자 입력 수신**: 
    - 에이전트는 사용자가 입력한 질문이나 명령을 받는다.
- **추론(Reasoning)**
    - 입력된 내용을 분석하여 문제를 이해하고, 해결 방안을 계획합니다. 
- **행동 결정 및 도구 실행(Action)**: 
    - 계획에 따라 어떤 도구를 사용할지 결정하고 그 도구를 호출하여 작업을 수행한다.
- **결과 평가 및 추가 행동 결정**: 
    - 도구 실행 결과를 바탕으로 추가로 도구를 사용할지, 아니면 최종 답변을 생성할지를 결정한다.
    - 추가로 도구를 사용하기로 결정한 경우 도구를 실행한다.
- **최종 답변 반환**: 
    - 최종 결과를 사용자에게 제공한다.

# TOOL
# Tool Calling 개요
- LLM이 외부 도구나 API를 활용하여 작업을 수행할 수 있게 하는 기능이다.
	- 예) LLM이 수학 계산을 수행해야 할 때, 직접 계산하는 대신 미리 정의된 '계산' 도구를 호출하여 정확한 결과를 얻을 수 있다.
	- 예) LLM에 최신 정보를 요청하는 질문이 들어왔을 때 '검색' 도구나 'Database 연동' 도구를 사용해 최신 뉴스를 검색하거나, 특정 데이터베이스에서 정보를 조회하는 등의 작업을 수행할 수 있다.
- LLM은 도구를 이용해 자체 지식의 한계를 넘어서는 정보를 제공할 수 있습니다.
- Tool calling은 OpenAI, Anthropic 등 여러 LLM 제공업체에서 지원한다.
- LangChain은 이러한 다양한 모델들의 도구 호출 방식을 표준화하여 일관된 인터페이스로 제공한다. 이를 통해 개발자들은 다양한 모델과 도구들을 쉽게 통합할 수있다.
- Tool Calling Concept: https://python.langchain.com/docs/concepts/tool_calling/
- Langchain 지원 tools (Builtin Tool)
    -  https://python.langchain.com/docs/integrations/tools/#search
- **Agent:**
	- LLM 모델이 목표한 결과를 얻기 위해 적절한 도구를 선택하고, 이를 활용하여 작업을 수행하는 시스템을 **Agent**라고 한다.

# 랭체인 내장 도구(tools) 사용
- Tavily 웹 검색 도구 사용해 Tool calling을 이해한다.


## Tavily
- 웹 검색 API.
- https://tavily.com/
-  LLM과 RAG 시스템에 최적화된 검색 엔진.
   -  기존의 일반 검색 엔진들과 달리, Tavily는 AI 애플리케이션의 요구사항에 맞춰 설계되었다.
   -  Tavily는 검색 결과에서 검색 query와 관련 콘텐츠를 추출하여 제공한다.
   -  월 1000회 무료 사용 가능.
### Tavily API Key 받기
- 로그인 한다.
- Overview 화면에서 API Key 생성
  
- **API Keys \[+\] 클릭**

![apikey1](figures/travily_apikey1.png)

- **Key Name을 입력하고 생성**

![apikey1](figures/travily_apikey2.png)

- **API Key를 복사**

![apikey1](figures/travily_apikey3.png)

- 환경변수에 등록한다.
    - 변수이름: "TAVILY_API_KEY"

## TavilySearchResults
- Langchain에서 제공하는 tool로 Tavily 의 검색 엔진 API를 사용해 검색을 수행한다.
- 모듈: `langchain_community.tools` 
- https://python.langchain.com/docs/integrations/tools/tavily_search/

In [17]:
from pprint import pprint
from dotenv import load_dotenv
from langchain_community.tools import TavilySearchResults

load_dotenv()

True

## Tool 호출

In [3]:
tavily_search = TavilySearchResults(
    max_results=3 # 최대 몇개 결과를 반환할지.(검색할지.)
)
query = "2024년 한국 시리즈 우승팀은 어디인가요?"
result = tavily_search.invoke(query) # Tool객체들은 Runnable 타입.

In [6]:
print(type(result), len(result))
print(type(result[0]))  # 응답: JSON 으로 온다. 이것을 dict로 반환.
print(result[0].keys())

<class 'list'> 3
<class 'dict'>
dict_keys(['url', 'content'])


In [9]:
print("검색 URL:", result[0]['url'])

검색 URL: https://m.blog.naver.com/baekhw1/223631292469


In [10]:
print("검색결과:")
print(result[0]["content"])

검색결과:
2024년 한국시리즈가 시작되었다. 이번 우승팀은 과연 어디가 될지 . ... 김도영은 2차전에서 한국시리즈 . 첫 홈런까지 만들어내며 . 좋은 모습을 이어갔다. 결과는 8:3으로 기아가 승리했다. 오늘은 2024 한국시리즈 .


In [12]:
# TOOL의 정보 -> 이 정보들이 LLM이 도구를 선택하는 기준
print('tool의 이름:', tavily_search.name)

tool의 이름: tavily_search_results_json


In [13]:
print('tool에 대한 설명:')
print(tavily_search.description)

tool에 대한 설명:
A search engine optimized for comprehensive, accurate, and trusted results. Useful for when you need to answer questions about current events. Input should be a search query.


In [18]:
from pprint import pprint
print("tool의 schema(전체 구조)")
pprint(tavily_search.args_schema.model_json_schema())

tool의 schema(전체 구조)
{'description': 'Input for the Tavily tool.',
 'properties': {'query': {'description': 'search query to look up',
                          'title': 'Query',
                          'type': 'string'}},
 'required': ['query'],
 'title': 'TavilyInput',
 'type': 'object'}


```bash
{'description': 'Input for the Tavily tool.',
 # 입력 파라미터(tool이 호출될 때때 전달되는 값을 받을 변수.)
 # {변수명: {변수 정보보}}
 'properties': {'query': {'description': 'search query to look up', # 변수 설명(어떤 값을 받을 지 설명명)
                          'title': 'Query',  # 이 변수 설정정의 식별값
                          'type': 'string'}}, # Datatype
 'required': ['query'],  # 입력 파라미터 중 필수인 것을 지정정
 'title': 'TavilyInput', # TOOL 의 이름.
 'type': 'object'}
```

## LLM tool callings
![toolcalling_concept](figures/toolcalling_concept.png)
1. Tool 생성
2. 생성한 Tool을 tool calling을 지원하는 LLM 모델에 연결(binding)
   - LLM 이 사용할 수있는 tool들을 등록(bind) 한다.
    - `Model.bind([tool_1, tool_2, ...]): RunnableBinding`
    - Model에 tool을 bind 하면 `Runnable` 타입의 `RunnableBinding` 객체가 반환된다.
3. 질의가 들어오면 모델(LLM + tool) 은 tool calling 정보(어떤 툴을 어떤 query로 호출할지 schema 에 맞게 만든 정보)를 응답.
    - 질의에 대해 tool 요청이 **필요하다고** 결정한 경우 tool들 중 어떤 tool을 어떤 query로 호출해야 하는지를 응답한다.
    - 질의에 대해 tool 요청이 **필요 없다고** 결정한 경우는 LLM API를 호출한다.(모델이 직접 응답)
5. 3에서 응답한 tool calling 정보를 이용해 tool 호출

### LLM Model에 tool binding
- `LLM.bind_tools(tools=[tool_1, tool_2, ...])`

In [37]:
from langchain_openai import ChatOpenAI
from langchain_community.tools import TavilySearchResults

# 1. tool 생성
tavily_search = TavilySearchResults(
    max_results=3,
    include_answer=True,
    include_images=True, # 검색 페이지의 이미지들 경로.
    include_raw_content=True, # 원본 내용을 포함해서 응답. (False: 요약내용만 반환.)
)

# 모델 생성 + tool binding
model = ChatOpenAI(model="gpt-4o-mini") # Agent에서 사용하는 모델은 성능 좋은 것을 쓴다.
tool_model = model.bind_tools(tools=[tavily_search])

print(type(model), type(tool_model))

<class 'langchain_openai.chat_models.base.ChatOpenAI'> <class 'langchain_core.runnables.base.RunnableBinding'>


In [38]:
# 도구호출이 필요없는 query를 전송.
result1 = tool_model.invoke("안녕하세요.")
print(type(result1))

<class 'langchain_core.messages.ai.AIMessage'>


In [40]:
dict(result1)

{'content': '안녕하세요! 어떻게 도와드릴까요?',
 'additional_kwargs': {'refusal': None},
 'response_metadata': {'token_usage': {'completion_tokens': 11,
   'prompt_tokens': 82,
   'total_tokens': 93,
   'completion_tokens_details': {'accepted_prediction_tokens': 0,
    'audio_tokens': 0,
    'reasoning_tokens': 0,
    'rejected_prediction_tokens': 0},
   'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}},
  'model_name': 'gpt-4o-mini-2024-07-18',
  'system_fingerprint': 'fp_6fc10e10eb',
  'finish_reason': 'stop',
  'logprobs': None},
 'type': 'ai',
 'name': None,
 'id': 'run-2bc2464a-abf2-4c1a-91e9-1f58944d2897-0',
 'example': False,
 'tool_calls': [],
 'invalid_tool_calls': [],
 'usage_metadata': {'input_tokens': 82,
  'output_tokens': 11,
  'total_tokens': 93,
  'input_token_details': {'audio': 0, 'cache_read': 0},
  'output_token_details': {'audio': 0, 'reasoning': 0}}}

In [41]:
result1.content  # LLM 응답 (값이 있으면 LLM 최종 응답을 함.)

'안녕하세요! 어떻게 도와드릴까요?'

In [42]:
result1.tool_calls # Tool 호출 정보 (비어있으면 LLM 이 최종응답을 함.)

[]

In [43]:
####### tool 호출이 필요한 요청
query = "2024년 프로야구 한국 시리즈 우승팀은 어디인지 알려주세요."
result2 = tool_model.invoke(query)

In [44]:
result2.content

''

In [45]:
result2.tool_calls

[{'name': 'tavily_search_results_json',
  'args': {'query': '2024년 프로야구 한국 시리즈 우승팀'},
  'id': 'call_AZfQdyw0SGSxXUnRcvcxuPBY',
  'type': 'tool_call'}]

In [47]:
tavily_search.args_schema.model_json_schema()
tavily_search.name

'tavily_search_results_json'

## tool_calls 를 이용해 Tool 호출
- LLM 모델이 tool 요청을 결정한 경우 어떤 tool을 어떻게 호출할 지 tool_calls를 반환한다.
- tool_calls를 이용해 TOOL을 호출한다.

### 방법
1. tool_calls의 query만 추출해서 호출
   - `tool.invoke(tool_calls['args'])`
   - **반환타입**: list[dict]
2. tool_calls 정보를 넣어 호출
   - **반환타입**: `ToolMessage`
   - tool의 처리결과를 담는 Message Type 이다.

#### tool_calls의 query만 추출해서 호출

In [51]:
query = result2.tool_calls[0]['args']
search_result = tavily_search.invoke(query)

In [55]:
print(type(search_result), type(search_result[0]))
len(search_result)

<class 'list'> <class 'dict'>


3

In [54]:
pprint(search_result[0])

{'content': '프로야구의 출발점: 1982년 첫 한국시리즈는 한국 프로야구의 시작을 알리는 기념비적인 사건이었습니다. 이는 한국 '
            '스포츠 산업의 발전을 이끌고, 프로 스포츠의 대중화를 촉진하는 계기가 되었습니다. ... 2024년: Kia 타이거즈 '
            '. 24년 한국시리즈 우승팀 KIA',
 'url': 'https://galaxy0715.com/entry/한국시리즈-영광의-순간들-역대-한국시리즈-우승팀24년-한국시리즈-우승팀'}


#### tool_call 정보를 넣어 Tool 호출

In [58]:
search_result2 = tavily_search.invoke(result2.tool_calls[0])

In [60]:
print(type(search_result2))

<class 'langchain_core.messages.tool.ToolMessage'>


In [62]:
dict(search_result2)

{'content': '[{"url": "https://namu.wiki/w/KBO+한국시리즈", "content": "1988년 한국시리즈 우승팀 해태 ... 결국 2014년을 끝으로 한국프로야구 리그의 명칭이 \'kbo 리그\'로 리브랜딩되고 한국시리즈 명칭 역시 \'kbo 한국시리즈\'로 개칭되면서 이 우승기 디자인도 더 이상 쓰이지 않게 됐다. ... 2024년 한국시리즈 mvp"}, {"url": "https://namu.wiki/w/2024+신한+SOL+Bank+KBO+한국시리즈", "content": "2024년 kbo 한국시리즈 우승팀. ... 올 시즌 kia는 한국프로야구 43년 역사상 단일 시즌 최다 실책을 기록했을 만큼 매우 불안한 수비를 보여주고 있다. ... 가을야구 경험 부족 2017년 한국시리즈 이후 포스트시즌이 단 2번 뿐이고, 그마저도 전부 5위로 진출해서 와일드"}, {"url": "https://m.blog.naver.com/dicasub/223637908357", "content": "프로야구 한국시리즈 역대 우승팀 및 팀별 우승 횟수(~2024년까지) : 네이버 블로그 본문 바로가기 카테고리 이동 디카섭(DiCaSub)의 스포츠 통계 이야기 야구[국내일반] [공지] 프로야구 한국시리즈 역대 우승팀 및 팀별 우승 횟수(~2024년까지) 디카섭 DiCaSub 이웃추가 본문 기타 기능 공유하기 국내 프로야구(KBO) 한국시리즈 역대 우승팀 정리 삼성과의 상대전적 4승 1패로 KIA가 한국시리즈 우승 트로피를 들어올렸습니다!! 역대 한국시리즈 우승팀 현황을 아래 <표>와 <그림>으로 정리해보았습니다. 국내 프로야구(KBO) 구단(팀)별 한국시리즈 우승 횟수<표> 국내 프로야구(KBO) 구단(팀)별 한국시리즈 우승 횟수<그림> [그림1] 국내 프로야구(KBO) 구단(팀)별 한국시리즈 우승 횟수 (막대형) [그림2] 국내 프로야구(KBO) 구단(팀)별 한국시리즈 우승 횟수 (원형) https://blog.naver.com/dicasu

#### tool_call 이 여러개일 경우 
- 질의에 대해 tool을 여러번 호출 해야 하는 경우 tool_calling 정보를 여러개 반환할 수 있다.
    - 예) 검색할 키워드가 여러개인 경우. 
- `tool.batch([tool_call1, tool_call2, ..])`

In [64]:
tavily_search.batch(result2.tool_calls)

[ToolMessage(content='[{"url": "https://namu.wiki/w/KBO+한국시리즈", "content": "1988년 한국시리즈 우승팀 해태 ... 결국 2014년을 끝으로 한국프로야구 리그의 명칭이 \'kbo 리그\'로 리브랜딩되고 한국시리즈 명칭 역시 \'kbo 한국시리즈\'로 개칭되면서 이 우승기 디자인도 더 이상 쓰이지 않게 됐다. ... 2024년 한국시리즈 mvp"}, {"url": "https://namu.wiki/w/2024+신한+SOL+Bank+KBO+한국시리즈", "content": "2024년 kbo 한국시리즈 우승팀. ... 올 시즌 kia는 한국프로야구 43년 역사상 단일 시즌 최다 실책을 기록했을 만큼 매우 불안한 수비를 보여주고 있다. ... 가을야구 경험 부족 2017년 한국시리즈 이후 포스트시즌이 단 2번 뿐이고, 그마저도 전부 5위로 진출해서 와일드"}, {"url": "https://m.blog.naver.com/dicasub/223637908357", "content": "프로야구 한국시리즈 역대 우승팀 및 팀별 우승 횟수(~2024년까지) : 네이버 블로그 본문 바로가기 카테고리 이동 디카섭(DiCaSub)의 스포츠 통계 이야기 야구[국내일반] [공지] 프로야구 한국시리즈 역대 우승팀 및 팀별 우승 횟수(~2024년까지) 디카섭 DiCaSub 이웃추가 본문 기타 기능 공유하기 국내 프로야구(KBO) 한국시리즈 역대 우승팀 정리 삼성과의 상대전적 4승 1패로 KIA가 한국시리즈 우승 트로피를 들어올렸습니다!! 역대 한국시리즈 우승팀 현황을 아래 <표>와 <그림>으로 정리해보았습니다. 국내 프로야구(KBO) 구단(팀)별 한국시리즈 우승 횟수<표> 국내 프로야구(KBO) 구단(팀)별 한국시리즈 우승 횟수<그림> [그림1] 국내 프로야구(KBO) 구단(팀)별 한국시리즈 우승 횟수 (막대형) [그림2] 국내 프로야구(KBO) 구단(팀)별 한국시리즈 우승 횟수 (원형) https://blog.naver.c

## Tool 의 처리(응답) 결과를 LLM 요청시 사용
- ToolMessage를 prompt 에 추가하여 LLM에 요청한다.
- ToolMessage 는 Tool Calling 정보를 가진 AIMessage 다음에 들어와야 한다.
- Prompt 순서
    1. 일반 prompt (system, 대화 history, .., human)
    2. AIMessage: tool calling 정보를 가진 AIMessage. (tool_model에 질의 받은 tool calling 정보가 있는 응답)
    3. ToolMessage:  Tool의 처리 결과

In [68]:
from datetime import datetime
datetime.now().strftime("%Y-%m-%d")
# datetime.today()

'2024년12-13'

In [89]:
from datetime import datetime
from langchain_core.runnables import chain
from langchain.prompts import ChatPromptTemplate, MessagesPlaceholder
from textwrap import dedent
# tool 들 생성
# model 생성
# model에 tool들을 binding.
today = datetime.now().strftime("%Y-%m-%d")
prompt_template = ChatPromptTemplate(
    [
        ("system", dedent("""
            당신은 유능한 AI 비서입니다. 
            오늘 날짜는 {today}입니다. 
            답변을 할 때 오늘 날짜와 가장 가까운 정보를 검색해서 대답해 주세요.
            """)),
        ("human", "{user_input}"), # 질문
        MessagesPlaceholder("message", optional=True) 
        # AIMessage(tool_calls정보) - ToolMessage
    ],
    partial_variables={"today":today}
)
# MessagesPlaceholder("message", optional=True) == ("placeholder", "{message}")

tool_model_chain = prompt_template | tool_model  # tool_model = model + tool들

@chain
def web_search_chain(input):
    # input: 사용자 질의의
    ai_message = tool_model_chain.invoke({"user_input":input})
    if ai_message.tool_calls: # Tool을 호출 -> query + Tool결과 -> llm 요청청
        tool_messages = tavily_search.batch(ai_message.tool_calls)#list[ToolMessage
        input_dict = {
            "user_input":input, 
            "message":[ai_message, *tool_messages]
        }
        return tool_model_chain.invoke(input_dict).content
    else: # LLM이 답변을 한 경우 -> 답변을 응답.
        return ai_message.content


In [90]:
result = web_search_chain.invoke({"user_input":"2024년 한국시리즈 우승팀은 어디에요?"})

In [88]:
result

'2024년 한국시리즈에서 KIA 타이거즈가 우승했습니다. KIA는 삼성 라이온즈를 상대로 5차전에서 7대5로 승리하며 통산 12번째 우승을 차지했습니다. 이번 우승은 KIA에게 7년 만의 통합 우승이기도 하며, 2017년 이후 처음입니다.'

# 사용자 정의 Tool 구현

## @tool 사용
- 함수로 구현하고 `@tool` 데코레이터를 사용해 tool(StructuredTool)로 정의한다.
    - `langchain_core.tools` 모듈에 있다.
- tool name
    - 함수의 이름이 tool의 이름이 된다.
- parameters
    - 함수의 파라미터가 tool의 파라미터가 된다.
    - **type hint**를 이용해 타입을 지정한다.  
- description
    - doctring이 description이 된다.
    - RunnableBinding이 tool을 잘 찾을 수 있도록 하려면 **tool의 기능을 최대한 구체적**으로 작성한다.
- **@tool이 적용된 함수(StructuredTool)이 tool**이므로 model에 binding 한다.

In [43]:
from langchain_core.tools import tool #tool decorator import

@tool
def plus(num1:int|float, num2:int|float) -> int|float:
    """입력받은 두 수를 더한 결과를 반환하는 tool."""
    
    return num1 + num2

@tool
def multiply(num1:int|float, num2:int|float) -> int|float:
    """입력받은 두 수를 곱한 결과를 반환하는 tool."""
    return num1 * num2

In [33]:
type(multiply)

langchain_core.tools.structured.StructuredTool

In [44]:
from langchain_openai import ChatOpenAI
from dotenv import load_dotenv
load_dotenv()

model = ChatOpenAI(model="gpt-4o-mini")
# model에 tool을 연결
## tool 함수를 등록한다.
tool_model = model.bind_tools(tools=[plus,  multiply])

result1 = tool_model.invoke("3 X 10 의 결과는?")

In [45]:
print(result1)
print(result1.content)
print(result1.tool_calls[0])
# print(multiply.invoke(result1.tool_calls[0]))

content='' additional_kwargs={'tool_calls': [{'id': 'call_h7uZZwxVgmD6f2ieDXai3cPs', 'function': {'arguments': '{"num1":3,"num2":10}', 'name': 'multiply'}, 'type': 'function'}], 'refusal': None} response_metadata={'token_usage': {'completion_tokens': 19, 'prompt_tokens': 106, 'total_tokens': 125, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_6fc10e10eb', 'finish_reason': 'tool_calls', 'logprobs': None} id='run-816fca74-6e15-4c51-803c-8525b9fa9965-0' tool_calls=[{'name': 'multiply', 'args': {'num1': 3, 'num2': 10}, 'id': 'call_h7uZZwxVgmD6f2ieDXai3cPs', 'type': 'tool_call'}] usage_metadata={'input_tokens': 106, 'output_tokens': 19, 'total_tokens': 125, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}}

{'nam

In [46]:
result2 = tool_model.invoke("20에 50을 더하면 얼마일까요?")

In [21]:
print(result2)
print(result2.content)
print(result2.tool_calls[0])
print(plus.invoke(result2.tool_calls[0]))

content='' additional_kwargs={'tool_calls': [{'id': 'call_BwEO23juWsqxmqs4GRmIvtgl', 'function': {'arguments': '{"num1":20,"num2":50}', 'name': 'plus'}, 'type': 'function'}], 'refusal': None} response_metadata={'token_usage': {'completion_tokens': 19, 'prompt_tokens': 109, 'total_tokens': 128, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_6fc10e10eb', 'finish_reason': 'tool_calls', 'logprobs': None} id='run-a142ca7f-7eda-444d-804f-7096d8e1b0b0-0' tool_calls=[{'name': 'plus', 'args': {'num1': 20, 'num2': 50}, 'id': 'call_BwEO23juWsqxmqs4GRmIvtgl', 'type': 'tool_call'}] usage_metadata={'input_tokens': 109, 'output_tokens': 19, 'total_tokens': 128, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}}

{'name': 'p

In [22]:
result3 = tool_model.invoke("20과 5를 더한 결과와 곱한 결과를 알려주세요.")

In [24]:
print(result3)
print(result3.content)
result3.tool_calls

content='' additional_kwargs={'tool_calls': [{'id': 'call_JHm8vZDWYBoq20jgVrH4EZua', 'function': {'arguments': '{"num1": 20, "num2": 5}', 'name': 'plus'}, 'type': 'function'}, {'id': 'call_GdR9sDM8jnLcAmAPKwtQg7Y5', 'function': {'arguments': '{"num1": 20, "num2": 5}', 'name': 'multiply'}, 'type': 'function'}], 'refusal': None} response_metadata={'token_usage': {'completion_tokens': 54, 'prompt_tokens': 115, 'total_tokens': 169, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_6fc10e10eb', 'finish_reason': 'tool_calls', 'logprobs': None} id='run-c4e67509-ccd0-462f-b0e3-b460496b488e-0' tool_calls=[{'name': 'plus', 'args': {'num1': 20, 'num2': 5}, 'id': 'call_JHm8vZDWYBoq20jgVrH4EZua', 'type': 'tool_call'}, {'name': 'multiply', 'args': {'num1': 20, 'num2': 5}, 'id': 'ca

[{'name': 'plus',
  'args': {'num1': 20, 'num2': 5},
  'id': 'call_JHm8vZDWYBoq20jgVrH4EZua',
  'type': 'tool_call'},
 {'name': 'multiply',
  'args': {'num1': 20, 'num2': 5},
  'id': 'call_GdR9sDM8jnLcAmAPKwtQg7Y5',
  'type': 'tool_call'}]

In [29]:
print("tool 이름:", plus.name) #함수이름 == tool 이름
print("tool 설명:", plus.description) # 함수 docstring == tool description(설명)
print("tool schema:")
plus.args_schema.model_json_schema()

tool 이름: plus
tool 설명: 입력받은 두 수를 더한 결과를 반환하는 tool.
tool schema:


{'description': '입력받은 두 수를 더한 결과를 반환하는 tool.',
 'properties': {'num1': {'anyOf': [{'type': 'integer'}, {'type': 'number'}],
   'title': 'Num1'},
  'num2': {'anyOf': [{'type': 'integer'}, {'type': 'number'}],
   'title': 'Num2'}},
 'required': ['num1', 'num2'],
 'title': 'plus',
 'type': 'object'}

In [49]:
# TavilySearch로 검색한 결과를 Document에 담아서 반환하는 tool을 생성.
from langchain_community.tools import TavilySearchResults
from langchain_core.documents import Document
from langchain_core.tools import tool

@tool
def search_web(query:str, max_results:int=2) -> list[Document]|str:
    """
    가지고 있지 않은 정보나 최신 정보를 찾기 위해 인터넷 검색을 하는 툴입니다.
    검색할 내용은 query 로 입력 받습니다.
    검색 개수는 max_results로 받습니다. 입력되지 않은 경우에는 2개를 검색합니다.
    검색 결과는 Document 객체에 담아 list로 묶어서 반환합니다.
    """
    tavily_search = TavilySearchResults(max_results=max_results)
    docs = tavily_search.invoke(query) # list[dict]
    # print(docs)
    # list[dict] => list[Document(page_content:검색결과, metadata={url:검색 url})]
    document_list = []
    for doc in docs:
        _doc = Document(
            page_content=doc['content'],
            metadata={"url":doc['url'], "question":query}
        )
        document_list.append(_doc)
    if document_list: # True: 원소 한개 이상 있는 경우.
        return document_list
    else: #False: 검색결과가 없는 경우.
        return "관련된 정보를 검색할 수 없습니다."



In [None]:
query = "한우 등심 100g당 가격은 어떻게 되나요?"
search_web.invoke(query)

[Document(metadata={'url': 'https://item.gmarket.co.kr/Item?goodscode=2518692425', 'question': '한우 등심 100g당 가격은 어떻게 되나요?'}, page_content='한우 등심 구이용 1+등급 (100g) (팩) 포장단위별 내용물의 용량(중량), 수량, 크기: 100g: 생산자/수입자 (주)이마트 미트센터: 원산지 (국내산) 제조연월일, 소비기한 또는 품질유지기한: 점포상품으로 지점별 정보가 상이합니다.'),
 Document(metadata={'url': 'https://wisely.store/product/1등급-한우-등심-구이용-200g-100g당-7995원-매일-22시-재입고/2078/', 'question': '한우 등심 100g당 가격은 어떻게 되나요?'}, page_content='상품 상세 정보  1+등급 한우 등심 구이용 200g (100g당 6,495원) | 마지막재고 입니다.상품명풍부한 육즙과 마블링이 예술인 1+ 한우 등심상품요약정보프레시메이커스브랜드27,990원 일반가12,990원제로마진가냉동배송공급사43 상품 옵션   배송국내배송 해외배송옵션 선택1+등급 한우 등심 구이용 200g (100g당 6,495원) | 마지막재고 입니다. - 월~금요일 오후 6시 이전 결제 시 : 당일 출고 후 1~2일 내 도착 - 금요일 오후 6시 이후 ~ 일요일 오후 6시 이전 결제 시 : 일요일 출고 후 1~2일 내 도착   상품 상세 정보  상품명1+등급 한우 등심 구이용 200g (100g당 6,495원) | 마지막재고 입니다.상품요약정보풍부한 육즙과 마블링이 예술인 1+ 한우 등심브랜드프레시메이커스일반가27,990원 제로마진가12,990원공급사냉동배송43 - 월~금요일 오후 6시 이전 결제 시 : 당일 출고 후 1~2일 내 도착 - 금요일 오후 6시 이후 ~ 일요일 오후 6시 이전 결제 시 : 일요일 출고 후 1~2일 내 도착  ')]

In [54]:
print(search_web.name)
print(search_web.description)
search_web.args_schema.model_json_schema()

search_web
가지고 있지 않은 정보나 최신 정보를 찾기 위해 인터넷 검색을 하는 툴입니다.
검색할 내용은 query 로 입력 받습니다.
검색 개수는 max_results로 받습니다. 입력되지 않은 경우에는 2개를 검색합니다.
검색 결과는 Document 객체에 담아 list로 묶어서 반환합니다.


{'description': '가지고 있지 않은 정보나 최신 정보를 찾기 위해 인터넷 검색을 하는 툴입니다.\n검색할 내용은 query 로 입력 받습니다.\n검색 개수는 max_results로 받습니다. 입력되지 않은 경우에는 2개를 검색합니다.\n검색 결과는 Document 객체에 담아 list로 묶어서 반환합니다.',
 'properties': {'query': {'title': 'Query', 'type': 'string'},
  'max_results': {'default': 2, 'title': 'Max Results', 'type': 'integer'}},
 'required': ['query'],
 'title': 'search_web',
 'type': 'object'}

In [68]:
# llm 모델 연동
model = ChatOpenAI(model="gpt-4o-mini")
tool_model = model.bind_tools(tools=[search_web])
query = "한우 등심 100g당 가격은 어떻게 되나요?"
# query = "안녕하세요"
result = tool_model.invoke(query)
result.tool_calls
if result.tool_calls: 
    # tool을 호출
    # 호출 파라미터 값을 변경 - max_result를 추가.
    result.tool_calls[0]["args"]["max_results"] = 1   #  result.tool_calls[0].args: tool의 파라미터에 전달할 argument
    # print(result.tool_calls)
    # tool 호출
    tool_result = search_web.invoke(result.tool_calls[0])
    print(tool_result)
else: #LLM이 바로 응답
    print(result.content)

content='[Document(metadata={\'url\': \'https://department.ssg.com/search.ssg?query=한우등심\', \'question\': \'한우 등심 100g 가격\'}, page_content=\'신세계백화점에서 한우등심 최저가 상품부터 한우등심 추천•인기 상품까지, 할인 가격으로 만나보세요! ... 가격 상세보기. 판매가 59,900 세일가 42,900 ssg money 할인쿠폰 4,290원 최적가 38,610 (100g당:15,444원)\'), Document(metadata={\'url\': \'https://wisely.store/product/1등급-한우-등심-구이용-200g-100g당-7995원-매일-22시-재입고/2078/\', \'question\': \'한우 등심 100g 가격\'}, page_content=\'상품 상세 정보  1+등급 한우 등심 구이용 200g (100g당 6,495원) | 마지막재고 입니다.상품명풍부한 육즙과 마블링이 예술인 1+ 한우 등심상품요약정보프레시메이커스브랜드27,990원 일반가12,990원제로마진가냉동배송공급사43 상품 옵션   배송국내배송 해외배송옵션 선택1+등급 한우 등심 구이용 200g (100g당 6,495원) | 마지막재고 입니다. - 월~금요일 오후 6시 이전 결제 시 : 당일 출고 후 1~2일 내 도착 - 금요일 오후 6시 이후 ~ 일요일 오후 6시 이전 결제 시 : 일요일 출고 후 1~2일 내 도착   상품 상세 정보  상품명1+등급 한우 등심 구이용 200g (100g당 6,495원) | 마지막재고 입니다.상품요약정보풍부한 육즙과 마블링이 예술인 1+ 한우 등심브랜드프레시메이커스일반가27,990원 제로마진가12,990원공급사냉동배송43 - 월~금요일 오후 6시 이전 결제 시 : 당일 출고 후 1~2일 내 도착 - 금요일 오후 6시 이후 ~ 일요일 오후 6시 이전 결제 시 : 일요일 출고 후 1~2일 내 도착  \'), Document(meta

## Runnable을 tool로 정의
- `Runnable객체.as_tool()`
    - name, description, args_schema 파라미터를 이용해 tool의 이름, 설명, 스키마를 설정한다.

In [None]:
# pip install wikipedia

In [80]:
# WikipediaLoader: Document loader -> wikipedia 백과사전에서 검색한 결과를 문서로 loading.
from langchain_community.document_loaders import WikipediaLoader
from langchain_core.documents import Document
from langchain_core.runnables import RunnableLambda 
from pydantic import BaseModel, Field
from textwrap import dedent

# Runnable로 만들 함수
def wikipedia_search(input_data:dict) -> list[Document]:
    """
    사용자 query(검색 키워드)를 위키백과사전(wikipedia)에서 검색한 결과 k개를 Document로 반환
    parameter:
        input_data: dict dict[str:query, int:검색개수-max_results]
    return:
        list[Document] - 개별 검색결과: Document
    """
    query = input_data['query']
    k = input_data.get('max_results', 2)
    # Document Loader 생성
    wiki_loader = WikipediaLoader(query=query, load_max_docs=k, lang='ko')
    # 문서 로드.
    wiki_docs = wiki_loader.load() # list[Document]
    return wiki_docs

wiki_runnable = RunnableLambda(wikipedia_search)
#### runnable을 tool로 정의
# tool 관련 schema를 정의 한 뒤에서 runnable.as_tool() 메소드를 이용해 생성.
## parameter schema는 pydantic으로 정의
## description 등은 as_tool() 에 직접 정의
class WikiSearchSchema(BaseModel):
    # ... 시작: required(필수), description: parameter 설명명
    query:str = Field(..., description="Wikipedia에서 검색할 keyword") 
    # ... 으로 시작하지 않으면 optional, default: 값이 없을 경우 사용할 기본값.
    max_results:int = Field(default=2, description="검색할 문서 개수")

# Runnable -> tool 
search_wiki = wiki_runnable.as_tool(
    args_schema=WikiSearchSchema, # 필수
    name="search_wiki", #생략-함수명이 이름이 됨.
    description=dedent("""
        이 도구는 위키피디아(wikipedia)에서 정보를 검색해야 할 때 사용합니다.
        사용자의 질문과 관련된 위키피디아 문서를 지정된 개수 만큼 검색해서 반환합니다.
        일반적인 지식이나 배경 정보가 필요한 경우 사용할 수있는 도구 입니다.
        """) # 생략: 함수의 docstring이 description이됨.
)

  search_wiki = wiki_runnable.as_tool(


In [83]:
print(search_wiki.name)
print(search_wiki.description)
search_wiki.args_schema.model_json_schema()

search_wiki
이 도구는 위키피디아(wikipedia)에서 정보를 검색해야 할 때 사용합니다.
사용자의 질문과 관련된 위키피디아 문서를 지정된 개수 만큼 검색해서 반환합니다.
일반적인 지식이나 배경 정보가 필요한 경우 사용할 수있는 도구 입니다.


{'properties': {'query': {'description': 'Wikipedia에서 검색할 keyword',
   'title': 'Query',
   'type': 'string'},
  'max_results': {'default': 2,
   'description': '검색할 문서 개수',
   'title': 'Max Results',
   'type': 'integer'}},
 'required': ['query'],
 'title': 'WikiSearchSchema',
 'type': 'object'}

In [None]:
search_wiki.invoke({"query":"한국 프로야구"})

[Document(metadata={'title': 'KBO 리그', 'summary': 'KBO 리그(영어: KBO League)는 대한민국의 프로 야구 리그이다. 1981년 12월 11일 6개 구단이 한국프로야구창립총회에 참가하여 프로야구 출범을 공표하여 구체화되었다.\n\n', 'source': 'https://ko.wikipedia.org/wiki/KBO_%EB%A6%AC%EA%B7%B8'}, page_content='KBO 리그(영어: KBO League)는 대한민국의 프로 야구 리그이다. 1981년 12월 11일 6개 구단이 한국프로야구창립총회에 참가하여 프로야구 출범을 공표하여 구체화되었다.\n\n\n== 배경과 역사 ==\n\n1979년 12·12 반란과 1980년 5·18 계엄령으로 정권을 잡아 집권한 전두환은 소위 \'3S 정책\'을 이용했다. 1981년 당시 대통령 전두환은 청와대 수석비서관 회의에서 국민정서, 이야기를 하다가 "프로 스포츠 한번 해봐라"라고 지시를 내렸다. 실무를 담당한 이상주 당시 대통령비서실 교육문화수석 비서관은 대통령의 지시대로 대한야구협회와 대한축구협회에 프로화를 타진하고, 당시 야구 선수인이었던 이호헌과 이용일이 18쪽 분량의 \'프로야구창립계획서\'를 만들게 되었다. 축구계가 프로화에 막대한 비용이 든다고 보고한 것과 달리 야구계는 "정부 보조 한 푼 없이 프로 야구를 출범시킬 수 있다"라고 보고했고, 이 제안이 당시 집권자들의 구미를 당기게 되었다. 이후 각 지역을 연고지별로 분할하고 창단 기업을 물색하게 되었다.\n프로 야구에 참여할 기업을 선정할 때는 모기업의 조건은 재무구조가 건실한 상시노동자 3만명 이상의 대기업이었다. 초기 기획단계에서 연고지 배정은 서울은 MBC, 부산은 롯데였다. 정치인들은 자신의 혈연, 지연, 학연들을 모조리 동원해 그룹총수들을 설득하기 시작했고 그에 의해 두산그룹이 자사 주류 OB의 이름을 내걸고 충청권에 들어오게 되었다. 그리고 역시 정계인물들과 관계가 돈독했던 해태의 박건배 

In [99]:
# LLM 연동
model = ChatOpenAI(model="gpt-4o-mini")
tool_model = model.bind_tools(tools=[search_web, search_wiki])
ai_message = tool_model.invoke("서울의 파스타 맛집을 알려주세요. 파스타에 대해서 설명해주세요. 오늘 날씨를 알려주세요.")
tool_message_list = []
for tool_call in ai_message.tool_calls:
    tool_name = tool_call['name']
    if tool_name == "search_wiki":
        _msg = search_wiki.invoke(tool_call)
    elif tool_name == "search_web":
        _msg = search_web.invoke(tool_call)
    # print(_msg)
    tool_message_list.append(_msg.content)


In [100]:
len(tool_message_list)

3

In [101]:
tool_message_list

['[Document(metadata={\'title\': \'파스타\', \'summary\': \'파스타(이탈리아어: pasta)는 이탈리아의 밀 식품이다. 듀럼밀 세몰라에 물을 섞거나 밀가루에 달걀을 섞어 부풀리지 않고 반대기를 지어서 국수 등의 형태로 만든 음식이며, 삶거나 구워 먹는다. 이탈리아의 주식이며, 국민 음식 가운데 하나로 여겨진다.\', \'source\': \'https://ko.wikipedia.org/wiki/%ED%8C%8C%EC%8A%A4%ED%83%80\'}, page_content=\'파스타(이탈리아어: pasta)는 이탈리아의 밀 식품이다. 듀럼밀 세몰라에 물을 섞거나 밀가루에 달걀을 섞어 부풀리지 않고 반대기를 지어서 국수 등의 형태로 만든 음식이며, 삶거나 구워 먹는다. 이탈리아의 주식이며, 국민 음식 가운데 하나로 여겨진다.\\n\\n\\n== 이름 ==\\n이탈리아어 "파스타(pasta)"는 "반죽, 페이스트"를 뜻하는 명사이다.\\n\\n\\n== 역사 ==\\n\\n2세기경 그리스의 의사 갈레노스의 저서에는 밀가루와 물을 함께 혼합해서 만든 itrion이라는 말이 언급되어 있다. 예루살렘 탈무드에 기록된 itrium은 삶은 반죽 종류로, 팔레스타인에서 3세기부터 5세기까지 먹었으며, 9세기의 시리아의 의사이자 사서학자인 Isho bar Ali가 편찬한 사전에는 아라비아 어원을 가지고 있으며, 세몰리나로 만들어 말려서 요리하는 끈같은 모양의 itriyya에 대해서 설명하고 있다. 무함마드 알 이드리시의 지리학 저서에는 1154년 시칠리아 로저 2세 시대의 자료를 편찬하면서 노르만 시칠리아에서 생산하고 수출하는 이트리야 (itriyya)에 대해 언급하고 있다.\\n\\n말단의 서부에는 Trabia라고 불리는 즐거운 곳이 있다. 이곳의 영원히 흐르는 강은 많은 밀을 흘러갈 수 있게 한다. 이 지방의 거대한 건물에서는 사람들이 칼라브리아, 무슬림과 기독교 국가에 보낼 막대한 양의 이트리야를 만든다. 매우 많은 양이 배로 수

In [90]:
ai_message.content
ai_message.tool_calls
# search_wiki.batch(ai_message.tool_calls)

[{'name': 'search_wiki',
  'args': {'query': '파스타', 'max_results': 2},
  'id': 'call_8HIDlnDMQxoAxqEV7baZcmNg',
  'type': 'tool_call'},
 {'name': 'search_web',
  'args': {'query': '서울 파스타 맛집', 'max_results': 2},
  'id': 'call_piCMndew6yivPMZozEXahP6m',
  'type': 'tool_call'},
 {'name': 'search_web',
  'args': {'query': '서울 날씨', 'max_results': 2},
  'id': 'call_XP044Y6S6hXXbGifdF9tx1w4',
  'type': 'tool_call'}]

## tool을 사용하는 chain을 구성.

In [1]:
from datetime import datetime
from langchain.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.runnables import chain
from langchain_openai import ChatOpenAI

from tools import search_web, search_wiki
from dotenv import load_dotenv
load_dotenv()

True

In [4]:
prompt_template = ChatPromptTemplate(
    [
        ("system", "당신은 유능한 AI 비서입니다. 주어진 context를 바탕으로 대답해 주세요. 정보는 최신 정보를 검색해서 대답해 주세요. 오늘 날짜는 {today} 입니다."),
        ("human", "{query}"),
        ("placeholder", "{tool_message}") # MessagesPlaceholder() 와 동일.
    ], 
    partial_variables={"today":datetime.now().strftime("%Y-%m-%d")}
)
tool_model = ChatOpenAI(model="gpt-4o-mini").bind_tools(
    tools=[search_web, search_wiki]
)

tool_model_chain = prompt_template | tool_model

@chain
def search_chain(query:str):
    # query -> too_model_chain
    ## tool calls 가 반환 된 경: tool_calls -> tool -검색결과 -> tool_model_chain

    ai_message = tool_model_chain.invoke({"query":query})

    if ai_message.tool_calls: # tool 호출
        tool_message_list = []
        for tool_call in ai_message.tool_calls:
            tool_name = tool_call['name']
            if tool_name == "search_wiki":
                tool_result = search_wiki.invoke(tool_call)
            elif tool_name == "search_web":
                tool_result = search_web.invoke(tool_call)
            tool_message_list.extend(tool_result) if isinstance(tool_result, list) else tool_message_list.append(tool_result)
        # LLM에 요청(tool_model_chain)
        result = tool_model_chain.invoke({
                "query":query, 
                "tool_message":[ai_message, *tool_message_list]
            }
        )
        return result
    
    else: # 응답
        return ai_message

In [5]:
query = "파스타의 종류와 유래에 대해서 알려주고 서울의 파스타로 유명한 식당을 소개해주세요."
result = search_chain.invoke(query)

In [7]:
print(result.content)

### 파스타의 종류와 유래

파스타는 이탈리아 요리의 대표적인 음식으로, 다양한 형태와 조리법이 존재합니다. 파스타는 주로 밀가루와 물로 만들어지며, 때로는 계란이 추가되기도 합니다. 파스타의 종류는 매우 다양하지만, 대표적인 몇 가지를 소개하자면:

1. **스파게티(Spaghetti)**: 가늘고 긴 형태로 가장 널리 알려진 파스타입니다.
2. **펜네(Penne)**: 직사각형의 관 모양으로, 양쪽 끝이 비스듬히 잘려 있습니다.
3. **리가토니(Rigatoni)**: 넓고 굵은 관 모양의 파스타로, 표면에 홈이 있어 소스와 잘 어울립니다.
4. **파르팔레(Farfalle)**: 나비 모양의 파스타로, 주로 샐러드나 크림 소스와 함께 사용됩니다.
5. **라자냐(Lasagna)**: 넓고 평평한 면으로, 여러 겹으로 쌓아 구워 먹는 요리입니다.

**유래**: 파스타의 기원은 고대 로마와 그리스의 음식에서 찾을 수 있으며, 12세기부터 이탈리아에서 본격적으로 발전했습니다. 특히, 나폴리 지역에서의 파스타 제조 방식이 현재의 형태로 자리 잡게 되었습니다. 19세기에는 산업화로 인해 파스타 생산이 대량화되면서 전 세계적으로 인기를 얻게 되었습니다.

### 서울의 파스타 맛집

서울에는 다양한 파스타 레스토랑이 있습니다. 몇 가지 추천하는 맛집은 다음과 같습니다:

1. **리틀 이태리 (Little Italy)** 
   - 주소: 서울특별시 강남구
   - 특징: 정통 이탈리아식 파스타와 피자를 전문으로 하며, 아늑한 분위기가 매력적입니다.

2. **파스타365**
   - 주소: 서울특별시 마포구
   - 특징: 매일 새롭게 변경되는 파스타 메뉴를 제공하며, 신선한 재료를 사용해 요리합니다.

3. **오 마이 파스타 (Oh My Pasta)**
   - 주소: 서울특별시 강남구
   - 특징: 다양한 종류의 파스타와 소스를 선택할 수 있으며, 분위기가 좋고 데이트 장소로도 적합합니다.

더 많은 정보는 [Tripadvisor](https://ww

## Vector Store(Vector 저장소) tool

### text loading -> Document 생성
- 레스토랑 메뉴를 vector store에 저장한다.
1. 메뉴 text 를 로딩한다.
2. 각 메뉴의 내용(음식이름, 메뉴설명, 파일명)을 넣어 Document를 생성한다.

In [19]:
menu_file_path = 'data/restaurant_menu.txt'
with open(menu_file_path, 'rt', encoding="utf-8") as fr:
    menu = fr.read()

print(menu[:300])

1. 라따뚜이
   - 가격: 17,000원
   - 주요 재료: 가지, 호박, 파프리카, 토마토 소스, 올리브 오일
   - 메뉴 설명: 프랑스 남부를 대표하는 전통 요리로, 신선한 채소를 얇게 썰어 층층이 쌓아 올리고 허브와 토마토 소스를 더해 구워냅니다. 채소 본연의 단맛과 상큼한 소스가 조화를 이룹니다. 비건 고객도 즐길 수 있는 건강한 메뉴입니다. 따뜻한 바게트와 함께 제공됩니다.

2. 카르보나라
   - 가격: 20,000원
   - 주요 재료: 스파게티 면, 판체타, 달걀 노른자, 파르미지아노 치즈
   - 메뉴 설명


In [13]:
# menu_item = """1. 라따뚜이
#    - 가격: 17,000원
#    - 주요 재료: 가지, 호박, 파프리카, 토마토 소스, 올리브 오일
#    - 메뉴 설명: 프랑스 남부를 대표하는 전통 요리로, 신선한 채소를 얇게 썰어 층층이 쌓아 """
# import re
# r = re.match(r"(\d+\. )(\w+)", menu_item)
# r.group(1), r.group(2)

('1. ', '라따뚜이')

In [26]:
from langchain_core.documents import Document
import re

def menu_split(menu_all: str) -> list[Document]:
    """메뉴별로 나눠서 Document를 생성. Document metadata에 메뉴이름, 메뉴 번호를 추가"""
    # split
    menu_list = menu_all.split("\n\n")
    menu_document_list = [] # 결과를 담을 리스트
    for i, menu_item in enumerate(menu_list):
        menu_name = re.match(r"(\d+\. )([\w ]+)", menu_item).group(2)
        _doc = Document(
            page_content=menu_item,
            metadata={
                "menu_num":i+1,
                "menu_name":menu_name
            }
        )
        menu_document_list.append(_doc)
    return menu_document_list

In [25]:
document_list = menu_split(menu)
print(len(document_list))
print(document_list[0])

15
page_content='1. 라따뚜이
   - 가격: 17,000원
   - 주요 재료: 가지, 호박, 파프리카, 토마토 소스, 올리브 오일
   - 메뉴 설명: 프랑스 남부를 대표하는 전통 요리로, 신선한 채소를 얇게 썰어 층층이 쌓아 올리고 허브와 토마토 소스를 더해 구워냅니다. 채소 본연의 단맛과 상큼한 소스가 조화를 이룹니다. 비건 고객도 즐길 수 있는 건강한 메뉴입니다. 따뜻한 바게트와 함께 제공됩니다.' metadata={'menu_num': 1, 'menu_name': '라따뚜이'}


### vector store(Chroma), Retriever 생성

In [27]:
from langchain_chroma import Chroma
from langchain_openai import OpenAIEmbeddings, ChatOpenAI
from dotenv import load_dotenv
load_dotenv()

COLLECTION_NAME = "restaurant_menu_2"
PERSIST_DIRECTORY = "vector_store/restaurant_menu_db"
# DB 연결 하면서 Doc들 저장
embedding_model = OpenAIEmbeddings(model='text-embedding-3-small')
vector_store = Chroma.from_documents(
    documents=document_list,
    embedding=embedding_model,
    collection_name=COLLECTION_NAME,
    persist_directory=PERSIST_DIRECTORY
)

In [28]:
# 테스트
ret = vector_store.as_retriever()
ret.invoke("화이트 와인과 어울리는 요리를 추천해주세요.")

[Document(metadata={'menu_name': '해산물 링귀니', 'menu_num': 9}, page_content='9. 해산물 링귀니\n   - 가격: 24,000원\n   - 주요 재료: 링귀니 면, 홍합, 새우, 오징어, 화이트 와인\n   - 메뉴 설명: 신선한 해산물과 화이트 와인을 곁들여 만든 이탈리아 대표 파스타입니다. 면과 해산물이 풍부하게 어우러져 깊고 풍성한 맛을 자랑합니다. 바다의 풍미를 그대로 담은 특별한 메뉴입니다.'),
 Document(metadata={'menu_name': '바질 페스토 뇨끼', 'menu_num': 12}, page_content='12. 바질 페스토 뇨끼\n    - 가격: 19,000원\n    - 주요 재료: 감자 뇨끼, 바질 페스토, 파르미지아노 치즈\n    - 메뉴 설명: 부드럽고 쫀득한 감자 뇨끼에 향긋한 바질 페스토를 곁들인 이탈리아 대표 요리입니다. 신선한 치즈와 허브가 요리의 맛을 풍부하게 만듭니다. 가벼운 식사로 적합합니다.'),
 Document(metadata={'menu_name': '트러플 피자', 'menu_num': 6}, page_content='6. 트러플 피자\n   - 가격: 26,000원\n   - 주요 재료: 트러플 오일, 모짜렐라 치즈, 얇은 피자 도우, 루꼴라\n   - 메뉴 설명: 얇고 바삭한 도우 위에 고급 트러플 오일과 모짜렐라 치즈를 얹어 구워낸 피자입니다. 루꼴라를 더해 신선하고 고소한 맛이 특징입니다. 고급스러운 한 끼를 즐기기에 완벽한 선택입니다.'),
 Document(metadata={'menu_name': '부르기뇽 스튜', 'menu_num': 3}, page_content='3. 부르기뇽 스튜\n   - 가격: 28,000원\n   - 주요 재료: 쇠고기, 적포도주, 양파, 당근, 베이컨\n   - 메뉴 설명: 프랑스 부르고뉴 지방에서 유래된 스튜 요리로, 고기를 적포도주와 함께 오랜 시간 푹 끓여 부드럽고 진한 풍미를 자랑합니다.

### Vector Store를 Tool로 정의

In [31]:
from langchain_core.tools import tool

COLLECTION_NAME = "restaurant_menu_2"
PERSIST_DIRECTORY = "vector_store/restaurant_menu_db"
# 연결
embedding_model = OpenAIEmbeddings(model='text-embedding-3-small')
v_store = Chroma(
    embedding_function=embedding_model,
    collection_name=COLLECTION_NAME,
    persist_directory=PERSIST_DIRECTORY
)
retriver = v_store.as_retriever()

@tool
def search_menu(query:str) -> list[Document]:
    """
    Vector Store에 저장된 restaurant의 메뉴를 검색한다. 
    이 도구는 restaurant의 메뉴 관련 질문에 대해 실행한다.
    """
    result = retriver.invoke(query)
    if len(result): #검색결과가 있다면
        return result
    else:
        return [Document(page_content="검색 결과가 없습니다.")]

In [35]:
search_menu.name
search_menu.description
search_menu.args_schema.model_json_schema()
search_menu.invoke("해산물 요리를 추천해 주세요.")

[Document(metadata={'menu_name': '해산물 링귀니', 'menu_num': 9}, page_content='9. 해산물 링귀니\n   - 가격: 24,000원\n   - 주요 재료: 링귀니 면, 홍합, 새우, 오징어, 화이트 와인\n   - 메뉴 설명: 신선한 해산물과 화이트 와인을 곁들여 만든 이탈리아 대표 파스타입니다. 면과 해산물이 풍부하게 어우러져 깊고 풍성한 맛을 자랑합니다. 바다의 풍미를 그대로 담은 특별한 메뉴입니다.'),
 Document(metadata={'menu_name': '트러플 피자', 'menu_num': 6}, page_content='6. 트러플 피자\n   - 가격: 26,000원\n   - 주요 재료: 트러플 오일, 모짜렐라 치즈, 얇은 피자 도우, 루꼴라\n   - 메뉴 설명: 얇고 바삭한 도우 위에 고급 트러플 오일과 모짜렐라 치즈를 얹어 구워낸 피자입니다. 루꼴라를 더해 신선하고 고소한 맛이 특징입니다. 고급스러운 한 끼를 즐기기에 완벽한 선택입니다.'),
 Document(metadata={'menu_name': '부르기뇽 스튜', 'menu_num': 3}, page_content='3. 부르기뇽 스튜\n   - 가격: 28,000원\n   - 주요 재료: 쇠고기, 적포도주, 양파, 당근, 베이컨\n   - 메뉴 설명: 프랑스 부르고뉴 지방에서 유래된 스튜 요리로, 고기를 적포도주와 함께 오랜 시간 푹 끓여 부드럽고 진한 풍미를 자랑합니다. 신선한 허브와 채소가 맛을 풍부하게 하고, 바게트와 함께 제공됩니다.'),
 Document(metadata={'menu_name': '밀라노풍 송아지 커틀렛', 'menu_num': 7}, page_content='7. 밀라노풍 송아지 커틀렛\n   - 가격: 30,000원\n   - 주요 재료: 송아지 고기, 빵가루, 파르미지아노 치즈, 루꼴라 샐러드\n   - 메뉴 설명: 얇게 저민 송아지 고기를 바삭하게 튀겨 낸 이탈리아 전통 요리입니다. 레몬을 곁

# Agent 구현

- `create_tool_calling_agent()` 를 이용해 Agent 생성
    - 파라미터
        - llm: 에이전트로 사용할 LLM.
        - tools: 에이전트가 접근할 수 있는 도구들의 목록.
        - prompt: 에이전트의 동작을 안내하는 프롬프트 템플릿.
- AgentExecutor를 이용해 Agent 실행
    - Agent의 동작을 관리하는 클래스.
    - AgentExecutor는 사용자 요청을 처리할 때 까지 적절한 tool들을 호출하고 최종 결과를 생성해 반환하는 작업을 처리한다.
    - 파라미터
        - agent: 실행할 Agent.
        - tools: Agent가 사용할 tool들 목록.

In [36]:
# 계산기 Agent 생성
## 1. tool 들
from langchain_core.tools import tool
@tool
def plus(num1:int|float, num2:int|float) -> int|float:
    """두 수를 입력받아서 덧셈 계산한 결과를 반환하는 도구."""
    return num1 + num2

@tool
def minus(num1:int|float, num2:int|float) -> int|float:
    """두 수를 입력받아서 뺄셈셈 계산한 결과를 반환하는 도구."""
    return num1 - num2

@tool
def multiply(num1:int|float, num2:int|float) -> int|float:
    """두 수를 입력받아서 곱곱셈 계산한 결과를 반환하는 도구."""
    return num1 * num2

@tool
def divide(num1:int|float, num2:int|float) -> int|float:
    """두 수를 입력받아서 나눗셈 계산한 결과를 반환하는 도구."""
    return num1 / num2

toolkit = [plus, minus, multiply, divide]

In [42]:
from langchain.agents import create_tool_calling_agent, AgentExecutor
from langchain.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_openai import ChatOpenAI
from textwrap import dedent
from dotenv import load_dotenv
load_dotenv()

model = ChatOpenAI(model="gpt-4o-mini")  # Agent에서는 LLM 모델을 성능 좋은 것을 사용해야 한다.

# 1. Agent가 어떤 일을 하는지 설명을 추가. - system message
# 2. MessagesPlaceholder:  "agent_scratchpad" 이름으로 추가. -> 호출된 tool이 반환한 ToolMessage를 추가할 placeholder
prompt_template = ChatPromptTemplate([
        ("system", dedent("""
                당신은 계산기 Agent입니다. 사칙연산을 할 수있는 tool들을 가지고 있습니다.
                두개의 수들을 받아서 사칙연산하는 작업은 toolkit의 plus, minus, multipy, divide tool을 사용합니다.
                연산이 복잡한 경우는 단계적으로 나눠서 계산하도록 합니다.
        """)),
        ("human", "{query}"),
        MessagesPlaceholder(variable_name="agent_scratchpad")
    ]
)

# Agent를 생성
agent = create_tool_calling_agent(
    model, toolkit, prompt_template
)
# Agent를 실행시켜 주는 객체를 생성 - AgentExecuter
agent_executor = AgentExecutor(
    agent=agent,
    tools=toolkit,
    verbose=True  # LLM 실행하는 단계를 log로 출력.
)

In [46]:
## 실행 - agent_executor를 chain 처럼 호출 한다.
### agent결과 {input, output}
query = "3 + 2 = "
query = "사과가 3개 있는데 그 중 2개를 먹었다. 몇개가 남았을까?"
query = "사과가 3개 있는데 그 중 2개를 먹었다. 그리고 10개를 더 사왔다. 그럼 몇개가 남았을까?"
# query = "사람이 총 12명 있고 방은 3개 있다. 한 방에 몇명씩 들어가면 될까요?"
agent_executor.invoke({"query":query})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `minus` with `{'num1': 3, 'num2': 2}`


[0m[33;1m[1;3m1[0m[32;1m[1;3m
Invoking: `plus` with `{'num1': 1, 'num2': 10}`


[0m[36;1m[1;3m11[0m[32;1m[1;3m사과가 3개 중 2개를 먹어서 1개가 남았고, 10개를 더 사와서 총 11개가 남았습니다.[0m

[1m> Finished chain.[0m


{'query': '사과가 3개 있는데 그 중 2개를 먹었다. 그리고 10개를 더 사왔다. 그럼 몇개가 남았을까?',
 'output': '사과가 3개 중 2개를 먹어서 1개가 남았고, 10개를 더 사와서 총 11개가 남았습니다.'}

In [1]:
from tools import search_menu, search_web, search_wiki
from langchain.agents import create_tool_calling_agent, AgentExecutor
from langchain.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_openai import ChatOpenAI
from textwrap import dedent
from dotenv import load_dotenv

load_dotenv()

True

In [7]:
model = ChatOpenAI(model="gpt-4o-mini")
prompt_template = ChatPromptTemplate(
    [   ("system", dedent("""
            당신은 레스토랑 메뉴 정보와 일반적인 음식 관련 지식을 제공하는 AI Agent입니다. 
            주요 목표는 사용자의 요청에 대한 정확한 정보를 제공하고 메뉴를 추천하는 것입니다.
            
            주요 지침들(guidelines):
            1. 레스토랑의 메뉴관련 정보를 확인하려면 search_menu 도구를 사용하십시오. 이 도구는 레스토랑의 메뉴들의 가격, 음식의 특징들에 대한 정보를 제공합니다.
            2. 일반적인 음식 정보, 그 음식의 유래, 문화적 배경에 대한 정보는 search_wiki 도구를 사용하십시오. 이 도구는 wikipedia 에서 정보를 검색해서 제공합니다.
            3. 추가적인 웹 검색이 필요하거나 최신 정보를 얻고 싶을 때는 search_web 도구를 사용하십시오. 이 도구는 인터넷 검색을 통해 정보를 검색해서 제공합니다.
            4. 검색 결과를 기반으로 명확하고 간결한 답변을 제공하십시오.
            5. 요청 받은 질문이 모호하거나 필요한 정보가 부족한 경우 정중하게 설명을 요청하세요.
            6. 메뉴 정보를 제공할 때는 가격, 주재료, 특징 순으로 설명하세요
            7. 메뉴를 추천 할 때는 간단하게 추천 이유를 설명해주세요.
            8. 최종 응답은 챗봇과 같은 대화형 스타일을 유지하세요. 친근하고 매력적이며 자연스럽게 소통하되 전문성을 보이는 어조를 유지하세요.
            9. 메뉴 추천은 반드시 search_menu 도구를 통해 검색한 메뉴안에서만 추천해주세요.

            각 도구의 목적과 기능을 정확하게 이해하고 각 적절한 상황에서 사용하세요.
            각 도구들을 결합해서 사용자의 요청에 정확한 대답을 하세요.
            항상 가장 최신의 정확한 정보를 제공하기 위해 노력하세요.
            """)
        ),
        ("human", "{query}"),
        MessagesPlaceholder(variable_name="agent_scratchpad")
    ]
)

agent = create_tool_calling_agent(
    llm=model,
    tools=[search_web, search_wiki, search_menu],
    prompt=prompt_template
)

agent_executor = AgentExecutor(
    agent=agent,
    tools=[search_web, search_wiki, search_menu],
    verbose=True
)

In [8]:
query = "레드 와인에 잘 어울리는 메뉴를 추천해 주세요. 추천한 음식의 레시피를 알려주세요."
result = agent_executor.invoke({"query":query})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `search_menu` with `{'query': '레드 와인과 어울리는 메뉴'}`


[0m[38;5;200m[1;3m[Document(metadata={'menu_name': '레몬 타르트', 'menu_num': 15}, page_content='15. 레몬 타르트\n    - 가격: 9,000원\n    - 주요 재료: 레몬 커드, 타르트 크러스트, 슈거 파우더\n    - 메뉴 설명: 상큼한 레몬 커드와 바삭한 타르트 크러스트가 완벽한 조화를 이루는 디저트입니다. 달콤한 맛과 상큼한 맛이 균형을 이루며, 가볍게 즐기기 좋은 메뉴입니다. 애프터눈 티와 잘 어울립니다.'), Document(metadata={'menu_name': '해산물 링귀니', 'menu_num': 9}, page_content='9. 해산물 링귀니\n   - 가격: 24,000원\n   - 주요 재료: 링귀니 면, 홍합, 새우, 오징어, 화이트 와인\n   - 메뉴 설명: 신선한 해산물과 화이트 와인을 곁들여 만든 이탈리아 대표 파스타입니다. 면과 해산물이 풍부하게 어우러져 깊고 풍성한 맛을 자랑합니다. 바다의 풍미를 그대로 담은 특별한 메뉴입니다.'), Document(metadata={'menu_name': '니스 샐러드', 'menu_num': 4}, page_content='4. 니스 샐러드\n   - 가격: 18,000원\n   - 주요 재료: 참치, 방울토마토, 올리브, 삶은 달걀, 그린빈\n   - 메뉴 설명: 프랑스 니스 지방의 상큼한 샐러드로, 다양한 채소와 참치를 사용해 풍성한 맛과 식감을 제공합니다. 발사믹 비네거 드레싱이 가미되어 가볍게 즐기기 좋은 요리입니다. 신선함과 영양을 동시에 잡은 메뉴입니다.'), Document(metadata={'menu_name': '크렘 브륄레', 'menu_num': 14}, page_co

In [5]:
result.keys()

dict_keys(['query', 'output'])

In [9]:
result['query']

'레드 와인에 잘 어울리는 메뉴를 추천해 주세요. 추천한 음식의 레시피를 알려주세요.'

In [10]:
print(result['output'])

레드 와인과 잘 어울리는 메뉴로 **해산물 링귀니**를 추천드립니다. 이 메뉴는 신선한 해산물과 화이트 와인을 곁들여 만든 이탈리아 대표 파스타로, 깊고 풍성한 맛이 특징입니다. 가격은 24,000원이며, 주요 재료는 링귀니 면, 홍합, 새우, 오징어, 화이트 와인입니다.

해산물 링귀니의 레시피는 아래와 같습니다:

### 해산물 링귀니 레시피

**재료:**
- 링귀니 면 250g
- 홍합 200g
- 새우 200g
- 오징어 100g (슬라이스)
- 화이트 와인 100ml
- 마늘 2쪽 (다진 것)
- 올리브 오일 2큰술
- 소금, 후추 (간 맞추기)
- 파슬리 (장식용)

**조리 방법:**
1. **면 삶기:** 큰 냄비에 물을 끓이고 소금을 넣은 후 링귀니 면을 알 덴테로 삶아줍니다. 삶은 후 체에 걸러 물기를 제거합니다.
2. **해산물 준비:** 팬에 올리브 오일을 두르고 다진 마늘을 넣어 볶아 향을 내줍니다.
3. **해산물 조리:** 마늘이 노릇해지면 홍합, 새우, 오징어를 넣고 볶습니다. 해산물이 익으면 화이트 와인을 추가하고 알콜이 날아가도록 몇 분간 끓입니다.
4. **혼합하기:** 삶은 링귀니를 팬에 넣고 잘 섞어줍니다. 필요에 따라 소금과 후추로 간을 맞춥니다.
5. **서빙:** 접시에 담고 파슬리로 장식하여 제공합니다.

레드 와인의 풍미와 잘 어울리는 해산물 링귀니를 즐겨보세요! 궁금한 점이 있으면 언제든지 물어보세요.
