# Agent 개요

- Agent 대형 언어 모델(LLM)과 다양한 도구(Tool)를 결합하여 복잡한 작업을 처리할 수 있도록 설계된 사용자 요청 처리 인공지능 시스템이다.
    - Agent는 주어진 목표를 달성하기 위해 환경(toolkit)과 상호작용하며 의사 결정을 내리고 행동을 취하는 자율적인 개체이다.
    - Agent의 자율적인 의사 결정은 LLM 이 담당하여 사람의 개입이 최소화 된다.

## Agent의 주요 특징
- **자율성**: 사전 정의된 규칙 없이도 스스로 결정을 내리고 행동할 수 있다.
- **목표 지향성**: 특정 목표나 작업을 달성하기 위해 설계되어 있다.
- **도구 활용**: 다양한 도구나 API를 활용하여 작업을 수행한다.

## Agent 기본 동작 원리

![agent_concept](figures/agent_concept.png)

### ReAct
- Reasoning and Acting의 약자로, 에이전트가 문제를 해결할 때 추론과 행동을 결합하는 방식이다.

#### 동작 단계
- **사용자 입력 수신**: 
    - 에이전트는 사용자가 입력한 질문이나 명령을 받는다.
- **추론(Reasoning)**
    - 입력된 내용을 분석하여 문제를 이해하고, 해결 방안을 계획합니다. 
- **행동 결정 및 도구 실행(Action)**: 
    - 계획에 따라 어떤 도구를 사용할지 결정하고 그 도구를 호출하여 작업을 수행한다.
- **결과 평가 및 추가 행동 결정**: 
    - 도구 실행 결과를 바탕으로 추가로 도구를 사용할지, 아니면 최종 답변을 생성할지를 결정한다.
    - 추가로 도구를 사용하기로 결정한 경우 도구를 실행한다.
- **최종 답변 반환**: 
    - 최종 결과를 사용자에게 제공한다.

# TOOL
# Tool Calling 개요
- LLM이 외부 도구나 API를 활용하여 작업을 수행할 수 있게 하는 기능이다.
	- 예) LLM이 수학 계산을 수행해야 할 때, 직접 계산하는 대신 미리 정의된 '계산' 도구를 호출하여 정확한 결과를 얻을 수 있다.
	- 예) LLM에 최신 정보를 요청하는 질문이 들어왔을 때 '검색' 도구나 'Database 연동' 도구를 사용해 최신 뉴스를 검색하거나, 특정 데이터베이스에서 정보를 조회하는 등의 작업을 수행할 수 있다.
- LLM은 도구를 이용해 자체 지식의 한계를 넘어서는 정보를 제공할 수 있습니다.
- Tool calling은 OpenAI, Anthropic 등 여러 LLM 제공업체에서 지원한다.
- LangChain은 이러한 다양한 모델들의 도구 호출 방식을 표준화하여 일관된 인터페이스로 제공한다. 이를 통해 개발자들은 다양한 모델과 도구들을 쉽게 통합할 수있다.
- Tool Calling Concept: https://python.langchain.com/docs/concepts/tool_calling/
- Langchain 지원 tools (Builtin Tool)
    -  https://python.langchain.com/docs/integrations/tools/#search
- **Agent:**
	- LLM 모델이 목표한 결과를 얻기 위해 적절한 도구를 선택하고, 이를 활용하여 작업을 수행하는 시스템을 **Agent**라고 한다.

# 랭체인 내장 도구(tools) 사용
- Tavily 웹 검색 도구 사용해 Tool calling을 이해한다.


## Tavily
- 웹 검색 API.
- https://tavily.com/
-  LLM과 RAG 시스템에 최적화된 검색 엔진.
   -  기존의 일반 검색 엔진들과 달리, Tavily는 AI 애플리케이션의 요구사항에 맞춰 설계되었다.
   -  Tavily는 검색 결과에서 검색 query와 관련 콘텐츠를 추출하여 제공한다.
   -  월 1000회 무료 사용 가능.
### Tavily API Key 받기
- 로그인 한다.
- Overview 화면에서 API Key 생성
  
- **API Keys \[+\] 클릭**

![apikey1](figures/travily_apikey1.png)

- **Key Name을 입력하고 생성**

![apikey1](figures/travily_apikey2.png)

- **API Key를 복사**

![apikey1](figures/travily_apikey3.png)

- 환경변수에 등록한다.
    - 변수이름: "TAVILY_API_KEY"

## TavilySearchResults
- Langchain에서 제공하는 tool로 Tavily 의 검색 엔진 API를 사용해 검색을 수행한다.
- 모듈: `langchain_community.tools` 
- https://python.langchain.com/docs/integrations/tools/tavily_search/

In [17]:
from pprint import pprint
from dotenv import load_dotenv
from langchain_community.tools import TavilySearchResults

load_dotenv()

True

## Tool 호출

In [3]:
tavily_search = TavilySearchResults(
    max_results=3 # 최대 몇개 결과를 반환할지.(검색할지.)
)
query = "2024년 한국 시리즈 우승팀은 어디인가요?"
result = tavily_search.invoke(query) # Tool객체들은 Runnable 타입.

In [6]:
print(type(result), len(result))
print(type(result[0]))  # 응답: JSON 으로 온다. 이것을 dict로 반환.
print(result[0].keys())

<class 'list'> 3
<class 'dict'>
dict_keys(['url', 'content'])


In [9]:
print("검색 URL:", result[0]['url'])

검색 URL: https://m.blog.naver.com/baekhw1/223631292469


In [10]:
print("검색결과:")
print(result[0]["content"])

검색결과:
2024년 한국시리즈가 시작되었다. 이번 우승팀은 과연 어디가 될지 . ... 김도영은 2차전에서 한국시리즈 . 첫 홈런까지 만들어내며 . 좋은 모습을 이어갔다. 결과는 8:3으로 기아가 승리했다. 오늘은 2024 한국시리즈 .


In [12]:
# TOOL의 정보 -> 이 정보들이 LLM이 도구를 선택하는 기준
print('tool의 이름:', tavily_search.name)

tool의 이름: tavily_search_results_json


In [13]:
print('tool에 대한 설명:')
print(tavily_search.description)

tool에 대한 설명:
A search engine optimized for comprehensive, accurate, and trusted results. Useful for when you need to answer questions about current events. Input should be a search query.


In [18]:
from pprint import pprint
print("tool의 schema(전체 구조)")
pprint(tavily_search.args_schema.model_json_schema())

tool의 schema(전체 구조)
{'description': 'Input for the Tavily tool.',
 'properties': {'query': {'description': 'search query to look up',
                          'title': 'Query',
                          'type': 'string'}},
 'required': ['query'],
 'title': 'TavilyInput',
 'type': 'object'}


```bash
{'description': 'Input for the Tavily tool.',
 # 입력 파라미터(tool이 호출될 때때 전달되는 값을 받을 변수.)
 # {변수명: {변수 정보보}}
 'properties': {'query': {'description': 'search query to look up', # 변수 설명(어떤 값을 받을 지 설명명)
                          'title': 'Query',  # 이 변수 설정정의 식별값
                          'type': 'string'}}, # Datatype
 'required': ['query'],  # 입력 파라미터 중 필수인 것을 지정정
 'title': 'TavilyInput', # TOOL 의 이름.
 'type': 'object'}
```

## LLM tool callings
![toolcalling_concept](figures/toolcalling_concept.png)
1. Tool 생성
2. 생성한 Tool을 tool calling을 지원하는 LLM 모델에 연결(binding)
   - LLM 이 사용할 수있는 tool들을 등록(bind) 한다.
    - `Model.bind([tool_1, tool_2, ...]): RunnableBinding`
    - Model에 tool을 bind 하면 `Runnable` 타입의 `RunnableBinding` 객체가 반환된다.
3. 질의가 들어오면 모델(LLM + tool) 은 tool calling 정보(어떤 툴을 어떤 query로 호출할지 schema 에 맞게 만든 정보)를 응답.
    - 질의에 대해 tool 요청이 **필요하다고** 결정한 경우 tool들 중 어떤 tool을 어떤 query로 호출해야 하는지를 응답한다.
    - 질의에 대해 tool 요청이 **필요 없다고** 결정한 경우는 LLM API를 호출한다.(모델이 직접 응답)
5. 3에서 응답한 tool calling 정보를 이용해 tool 호출

### LLM Model에 tool binding
- `LLM.bind_tools(tools=[tool_1, tool_2, ...])`

In [37]:
from langchain_openai import ChatOpenAI
from langchain_community.tools import TavilySearchResults

# 1. tool 생성
tavily_search = TavilySearchResults(
    max_results=3,
    include_answer=True,
    include_images=True, # 검색 페이지의 이미지들 경로.
    include_raw_content=True, # 원본 내용을 포함해서 응답. (False: 요약내용만 반환.)
)

# 모델 생성 + tool binding
model = ChatOpenAI(model="gpt-4o-mini") # Agent에서 사용하는 모델은 성능 좋은 것을 쓴다.
tool_model = model.bind_tools(tools=[tavily_search])

print(type(model), type(tool_model))

<class 'langchain_openai.chat_models.base.ChatOpenAI'> <class 'langchain_core.runnables.base.RunnableBinding'>


In [38]:
# 도구호출이 필요없는 query를 전송.
result1 = tool_model.invoke("안녕하세요.")
print(type(result1))

<class 'langchain_core.messages.ai.AIMessage'>


In [40]:
dict(result1)

{'content': '안녕하세요! 어떻게 도와드릴까요?',
 'additional_kwargs': {'refusal': None},
 'response_metadata': {'token_usage': {'completion_tokens': 11,
   'prompt_tokens': 82,
   'total_tokens': 93,
   'completion_tokens_details': {'accepted_prediction_tokens': 0,
    'audio_tokens': 0,
    'reasoning_tokens': 0,
    'rejected_prediction_tokens': 0},
   'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}},
  'model_name': 'gpt-4o-mini-2024-07-18',
  'system_fingerprint': 'fp_6fc10e10eb',
  'finish_reason': 'stop',
  'logprobs': None},
 'type': 'ai',
 'name': None,
 'id': 'run-2bc2464a-abf2-4c1a-91e9-1f58944d2897-0',
 'example': False,
 'tool_calls': [],
 'invalid_tool_calls': [],
 'usage_metadata': {'input_tokens': 82,
  'output_tokens': 11,
  'total_tokens': 93,
  'input_token_details': {'audio': 0, 'cache_read': 0},
  'output_token_details': {'audio': 0, 'reasoning': 0}}}

In [41]:
result1.content  # LLM 응답 (값이 있으면 LLM 최종 응답을 함.)

'안녕하세요! 어떻게 도와드릴까요?'

In [42]:
result1.tool_calls # Tool 호출 정보 (비어있으면 LLM 이 최종응답을 함.)

[]

In [43]:
####### tool 호출이 필요한 요청
query = "2024년 프로야구 한국 시리즈 우승팀은 어디인지 알려주세요."
result2 = tool_model.invoke(query)

In [44]:
result2.content

''

In [45]:
result2.tool_calls

[{'name': 'tavily_search_results_json',
  'args': {'query': '2024년 프로야구 한국 시리즈 우승팀'},
  'id': 'call_AZfQdyw0SGSxXUnRcvcxuPBY',
  'type': 'tool_call'}]

In [47]:
tavily_search.args_schema.model_json_schema()
tavily_search.name

'tavily_search_results_json'

## tool_calls 를 이용해 Tool 호출
- LLM 모델이 tool 요청을 결정한 경우 어떤 tool을 어떻게 호출할 지 tool_calls를 반환한다.
- tool_calls를 이용해 TOOL을 호출한다.

### 방법
1. tool_calls의 query만 추출해서 호출
   - `tool.invoke(tool_calls['args'])`
   - **반환타입**: list[dict]
2. tool_calls 정보를 넣어 호출
   - **반환타입**: `ToolMessage`
   - tool의 처리결과를 담는 Message Type 이다.

#### tool_calls의 query만 추출해서 호출

In [51]:
query = result2.tool_calls[0]['args']
search_result = tavily_search.invoke(query)

In [55]:
print(type(search_result), type(search_result[0]))
len(search_result)

<class 'list'> <class 'dict'>


3

In [54]:
pprint(search_result[0])

{'content': '프로야구의 출발점: 1982년 첫 한국시리즈는 한국 프로야구의 시작을 알리는 기념비적인 사건이었습니다. 이는 한국 '
            '스포츠 산업의 발전을 이끌고, 프로 스포츠의 대중화를 촉진하는 계기가 되었습니다. ... 2024년: Kia 타이거즈 '
            '. 24년 한국시리즈 우승팀 KIA',
 'url': 'https://galaxy0715.com/entry/한국시리즈-영광의-순간들-역대-한국시리즈-우승팀24년-한국시리즈-우승팀'}


#### tool_call 정보를 넣어 Tool 호출

In [58]:
search_result2 = tavily_search.invoke(result2.tool_calls[0])

In [60]:
print(type(search_result2))

<class 'langchain_core.messages.tool.ToolMessage'>


In [62]:
dict(search_result2)

{'content': '[{"url": "https://namu.wiki/w/KBO+한국시리즈", "content": "1988년 한국시리즈 우승팀 해태 ... 결국 2014년을 끝으로 한국프로야구 리그의 명칭이 \'kbo 리그\'로 리브랜딩되고 한국시리즈 명칭 역시 \'kbo 한국시리즈\'로 개칭되면서 이 우승기 디자인도 더 이상 쓰이지 않게 됐다. ... 2024년 한국시리즈 mvp"}, {"url": "https://namu.wiki/w/2024+신한+SOL+Bank+KBO+한국시리즈", "content": "2024년 kbo 한국시리즈 우승팀. ... 올 시즌 kia는 한국프로야구 43년 역사상 단일 시즌 최다 실책을 기록했을 만큼 매우 불안한 수비를 보여주고 있다. ... 가을야구 경험 부족 2017년 한국시리즈 이후 포스트시즌이 단 2번 뿐이고, 그마저도 전부 5위로 진출해서 와일드"}, {"url": "https://m.blog.naver.com/dicasub/223637908357", "content": "프로야구 한국시리즈 역대 우승팀 및 팀별 우승 횟수(~2024년까지) : 네이버 블로그 본문 바로가기 카테고리 이동 디카섭(DiCaSub)의 스포츠 통계 이야기 야구[국내일반] [공지] 프로야구 한국시리즈 역대 우승팀 및 팀별 우승 횟수(~2024년까지) 디카섭 DiCaSub 이웃추가 본문 기타 기능 공유하기 국내 프로야구(KBO) 한국시리즈 역대 우승팀 정리 삼성과의 상대전적 4승 1패로 KIA가 한국시리즈 우승 트로피를 들어올렸습니다!! 역대 한국시리즈 우승팀 현황을 아래 <표>와 <그림>으로 정리해보았습니다. 국내 프로야구(KBO) 구단(팀)별 한국시리즈 우승 횟수<표> 국내 프로야구(KBO) 구단(팀)별 한국시리즈 우승 횟수<그림> [그림1] 국내 프로야구(KBO) 구단(팀)별 한국시리즈 우승 횟수 (막대형) [그림2] 국내 프로야구(KBO) 구단(팀)별 한국시리즈 우승 횟수 (원형) https://blog.naver.com/dicasu

#### tool_call 이 여러개일 경우 
- 질의에 대해 tool을 여러번 호출 해야 하는 경우 tool_calling 정보를 여러개 반환할 수 있다.
    - 예) 검색할 키워드가 여러개인 경우. 
- `tool.batch([tool_call1, tool_call2, ..])`

In [64]:
tavily_search.batch(result2.tool_calls)

[ToolMessage(content='[{"url": "https://namu.wiki/w/KBO+한국시리즈", "content": "1988년 한국시리즈 우승팀 해태 ... 결국 2014년을 끝으로 한국프로야구 리그의 명칭이 \'kbo 리그\'로 리브랜딩되고 한국시리즈 명칭 역시 \'kbo 한국시리즈\'로 개칭되면서 이 우승기 디자인도 더 이상 쓰이지 않게 됐다. ... 2024년 한국시리즈 mvp"}, {"url": "https://namu.wiki/w/2024+신한+SOL+Bank+KBO+한국시리즈", "content": "2024년 kbo 한국시리즈 우승팀. ... 올 시즌 kia는 한국프로야구 43년 역사상 단일 시즌 최다 실책을 기록했을 만큼 매우 불안한 수비를 보여주고 있다. ... 가을야구 경험 부족 2017년 한국시리즈 이후 포스트시즌이 단 2번 뿐이고, 그마저도 전부 5위로 진출해서 와일드"}, {"url": "https://m.blog.naver.com/dicasub/223637908357", "content": "프로야구 한국시리즈 역대 우승팀 및 팀별 우승 횟수(~2024년까지) : 네이버 블로그 본문 바로가기 카테고리 이동 디카섭(DiCaSub)의 스포츠 통계 이야기 야구[국내일반] [공지] 프로야구 한국시리즈 역대 우승팀 및 팀별 우승 횟수(~2024년까지) 디카섭 DiCaSub 이웃추가 본문 기타 기능 공유하기 국내 프로야구(KBO) 한국시리즈 역대 우승팀 정리 삼성과의 상대전적 4승 1패로 KIA가 한국시리즈 우승 트로피를 들어올렸습니다!! 역대 한국시리즈 우승팀 현황을 아래 <표>와 <그림>으로 정리해보았습니다. 국내 프로야구(KBO) 구단(팀)별 한국시리즈 우승 횟수<표> 국내 프로야구(KBO) 구단(팀)별 한국시리즈 우승 횟수<그림> [그림1] 국내 프로야구(KBO) 구단(팀)별 한국시리즈 우승 횟수 (막대형) [그림2] 국내 프로야구(KBO) 구단(팀)별 한국시리즈 우승 횟수 (원형) https://blog.naver.c

## Tool 의 처리(응답) 결과를 LLM 요청시 사용
- ToolMessage를 prompt 에 추가하여 LLM에 요청한다.
- ToolMessage 는 Tool Calling 정보를 가진 AIMessage 다음에 들어와야 한다.
- Prompt 순서
    1. 일반 prompt (system, 대화 history, .., human)
    2. AIMessage: tool calling 정보를 가진 AIMessage. (tool_model에 질의 받은 tool calling 정보가 있는 응답)
    3. ToolMessage:  Tool의 처리 결과

In [68]:
from datetime import datetime
datetime.now().strftime("%Y-%m-%d")
# datetime.today()

'2024년12-13'

In [89]:
from datetime import datetime
from langchain_core.runnables import chain
from langchain.prompts import ChatPromptTemplate, MessagesPlaceholder
from textwrap import dedent
# tool 들 생성
# model 생성
# model에 tool들을 binding.
today = datetime.now().strftime("%Y-%m-%d")
prompt_template = ChatPromptTemplate(
    [
        ("system", dedent("""
            당신은 유능한 AI 비서입니다. 
            오늘 날짜는 {today}입니다. 
            답변을 할 때 오늘 날짜와 가장 가까운 정보를 검색해서 대답해 주세요.
            """)),
        ("human", "{user_input}"), # 질문
        MessagesPlaceholder("message", optional=True) 
        # AIMessage(tool_calls정보) - ToolMessage
    ],
    partial_variables={"today":today}
)
# MessagesPlaceholder("message", optional=True) == ("placeholder", "{message}")

tool_model_chain = prompt_template | tool_model  # tool_model = model + tool들

@chain
def web_search_chain(input):
    # input: 사용자 질의의
    ai_message = tool_model_chain.invoke({"user_input":input})
    if ai_message.tool_calls: # Tool을 호출 -> query + Tool결과 -> llm 요청청
        tool_messages = tavily_search.batch(ai_message.tool_calls)#list[ToolMessage
        input_dict = {
            "user_input":input, 
            "message":[ai_message, *tool_messages]
        }
        return tool_model_chain.invoke(input_dict).content
    else: # LLM이 답변을 한 경우 -> 답변을 응답.
        return ai_message.content


In [90]:
result = web_search_chain.invoke({"user_input":"2024년 한국시리즈 우승팀은 어디에요?"})

In [88]:
result

'2024년 한국시리즈에서 KIA 타이거즈가 우승했습니다. KIA는 삼성 라이온즈를 상대로 5차전에서 7대5로 승리하며 통산 12번째 우승을 차지했습니다. 이번 우승은 KIA에게 7년 만의 통합 우승이기도 하며, 2017년 이후 처음입니다.'

In [26]:
# !pip install -U duckduckgo-search

# 사용자 정의 Tool 구현

## @tool 사용
- 함수로 구현하고 `@tool` 데코레이터를 사용해 tool(StructuredTool)로 정의한다.
    - `langchain_core.tools` 모듈에 있다.
- tool name
    - 함수의 이름이 tool의 이름이 된다.
- parameters
    - 함수의 파라미터가 tool의 파라미터가 된다.
    - **type hint**를 이용해 타입을 지정한다.  
- description
    - doctring이 description이 된다.
    - RunnableBinding이 tool을 잘 찾을 수 있도록 하려면 **tool의 기능을 최대한 구체적**으로 작성한다.
- **@tool이 적용된 함수(StructuredTool)이 tool**이므로 model에 binding 한다.

## Runnable을 tool로 정의
- `Runnable객체.as_tool()`
    - name, description, args_schema 파라미터를 이용해 tool의 이름, 설명, 스키마를 설정한다.

## Vector Store(Vector 저장소) tool

### text loading -> Document 생성
- 레스토랑 메뉴를 vector store에 저장한다.
1. 메뉴 text 를 로딩한다.
2. 각 메뉴의 내용(음식이름, 메뉴설명, 파일명)을 넣어 Document를 생성한다.

### vector store(Chroma), Retriever 생성

### Vector Store를 Tool로 정의

# Agent 구현

- `create_tool_calling_agent()` 를 이용해 Agent 생성
    - 파라미터
        - llm: 에이전트로 사용할 LLM.
        - tools: 에이전트가 접근할 수 있는 도구들의 목록.
        - prompt: 에이전트의 동작을 안내하는 프롬프트 템플릿.
- AgentExecutor를 이용해 Agent 실행
    - Agent의 동작을 관리하는 클래스.
    - AgentExecutor는 사용자 요청을 처리할 때 까지 적절한 tool들을 호출하고 최종 결과를 생성해 반환하는 작업을 처리한다.
    - 파라미터
        - agent: 실행할 Agent.
        - tools: Agent가 사용할 tool들 목록.