# OpenAI Function Calling


<img src='./images/fig_01_01.png' width=800>

- OpenAI는 함수 호출을 위한 추가 매개변수를 수락하도록 최신 모델 중 일부를 미세 조정했습니다.
- 이 모델들은 함수 호출이 관련이 있는지 여부를 결정하기 위해 미세 조정되었습니다.

In [1]:
import os

- 이 강의에서는 OpenAI SDK를 직접 사용할 것입니다.
- 이 예제를 진행하기 위해 언어 모델에 제공하기에 흥미로운 함수가 있다고 가정해 보겠습니다.
- 나중에 흥미로운 것이 무엇을 의미하는지 설명하겠지만, 이 새로운 매개변수에는 다양한 사용 사례가 있습니다.
- 여기에서 getCurrentWeather 함수를 정의할 것입니다.
- 이는 OpenAI가 이 기능을 처음 출시할 때 제공한 예제입니다.
- 현재 날씨를 얻는 것은 언어 모델이 자체적으로 할 수 없는 작업이기 때문에 사용하기 좋은 예제입니다.
- 따라서 언어 모델을 함수에 연결하고 싶을 때가 많습니다.

In [2]:
import json

# 예시 더미 함수는 항상 동일한 날씨 정보를 반환하도록 하드코딩
# 실제 환경에서는 백엔드 API 또는 외부 API를 호출할 수 있습니다.
def get_current_weather(location, unit="fahrenheit"):
    """Get the current weather in a given location"""
    weather_info = {
        "location": location,
        "temperature": "72",
        "unit": unit,
        "forecast": ["sunny", "windy"],
    }
    return json.dumps(weather_info)

- 이 예제에서는 반환되는 정보를 하드 코딩하지만, 실제 환경에서는 날씨 API 또는 외부 지식 소스를 사용할 수 있습니다.
- OpenAI는 함수 정의 목록을 전달할 수 있는 함수라는 새로운 매개변수를 노출했습니다.
- 위의 전체 함수 정의는 바로 여기에 있습니다. 보시다시피 목록이고 목록에 있는 요소는 하나뿐이며, 여기에는 몇 가지 다른 매개변수를 가진 JSON 객체가 있습니다.

In [3]:
# define a function
functions = [
    {
        "name": "get_current_weather",
        "description": "Get the current weather in a given location",
        "parameters": {
            "type": "object",
            "properties": {
                "location": {
                    "type": "string",
                    "description": "The city and state, e.g. San Francisco, CA",
                },
                "unit": {"type": "string", "enum": ["celsius", "fahrenheit"]},
            },
            "required": ["location"],
        },
    }
]

In [4]:
messages = [
    {
        "role": "user",
        "content": "What's the weather like in Boston?"
    }
]

In [5]:
from openai import OpenAI

- OpenAI SDK를 가져오고 채팅 완료 엔드포인트를 호출합니다.
- 먼저 모델을 지정할 것입니다. 이 기능이 있는 최신 모델을 지정해야 합니다.
- 그런 다음 위에서 정의한 메시지를 전달할 것입니다. 실행해보고 결과를 확인해봅시다.

In [6]:
client = OpenAI()
response = client.chat.completions.create(
      model="gpt-3.5-turbo",
    messages=messages,
    functions=functions
)

- 전체 응답을 봅시다. 반환된 메시지에는 assistant 역할이 있고, content는 null이며 대신 name 및 arguments라는 두 개의 객체가 있는 함수 호출 매개변수가 있습니다.
- name은 getCurrentWeather입니다. 이는 우리가 전달한 함수의 이름과 동일하며, arguments는 이 JSON blob입니다.

In [7]:
print(response)

ChatCompletion(id='chatcmpl-9fH2HgVYPmuUsZk6FBm9yfa19AtLD', choices=[Choice(finish_reason='function_call', index=0, logprobs=None, message=ChatCompletionMessage(content=None, role='assistant', function_call=FunctionCall(arguments='{"location":"Boston","unit":"celsius"}', name='get_current_weather'), tool_calls=None))], created=1719623961, model='gpt-3.5-turbo-0125', object='chat.completion', system_fingerprint=None, usage=CompletionUsage(completion_tokens=20, prompt_tokens=82, total_tokens=102))


In [8]:
response.choices[0].message

ChatCompletionMessage(content=None, role='assistant', function_call=FunctionCall(arguments='{"location":"Boston","unit":"celsius"}', name='get_current_weather'), tool_calls=None)

In [9]:
response_message =response.choices[0].message

In [10]:
response_message

ChatCompletionMessage(content=None, role='assistant', function_call=FunctionCall(arguments='{"location":"Boston","unit":"celsius"}', name='get_current_weather'), tool_calls=None)

- 응답 메시지를 자세히 살펴보겠습니다. 다시 content는 비어 있습니다.

In [11]:
response_message.content

- function_call은 dictionary 입니다.. function_call의 arguments 매개변수 자체는 JSON 사전이므로 JSON.loads를 사용하여 이를 Python 사전으로 로드할 수 있습니다.

In [12]:
response_message.function_call

FunctionCall(arguments='{"location":"Boston","unit":"celsius"}', name='get_current_weather')

In [13]:
json.loads(response_message.function_call.arguments)

{'location': 'Boston', 'unit': 'celsius'}

- 반환된 arguments를 직접 전달할 수 있습니다. 

In [14]:
args = json.loads(response_message.function_call.arguments)

- OpenAI는 함수를 직접 호출하지 않습니다.
- 우리가 직접 해야 합니다. 대신 호출할 함수의 이름과 해당 함수에 전달할 인수를 알려줍니다.
- 또한 이것이 JSON blob을 반환하도록 학습되었지만 엄격히 적용되지는 않는다는 점도 주목할 가치가 있습니다.

In [16]:
get_current_weather(args)

'{"location": {"location": "Boston", "unit": "celsius"}, "temperature": "72", "unit": "fahrenheit", "forecast": ["sunny", "windy"]}'

- 전달한 메시지가 함수와 관련이 없는 경우에는 어떻게 될까요? 한번 시도해보고 어떤 일이 일어나는지 봅시다.
- 이번에는 반환된 메시지에 일반적인 내용이 있고 함수 호출 매개변수가 없는 새 메시지 집합을 만들어 보겠습니다.
- 내부적으로 모델이 함수를 사용할지 여부를 결정하고 있습니다.

In [17]:
messages = [
    {
        "role": "user",
        "content": "hi!",
    }
]

In [19]:
response = client.chat.completions.create(
    model="gpt-3.5-turbo-0613",
    messages=messages,
    functions=functions,
)

In [20]:
print(response.choices[0].message.content)

Hello! How can I assist you today?


- 함수를 사용하거나 사용하지 않도록 모델을 강제할 수 있는 추가 매개변수가 있습니다.
- 이를 살펴보겠습니다. 추가 매개변수는 함수 호출 매개변수입니다. 기본적으로 auto로 설정되어 있습니다. 이는 언어 모델이 선택함을 의미합니다. 우리가 지금까지 해온 일입니다.
- 다른 두 가지 모드가 있습니다. 첫 번째 모드에서는 함수를 호출하도록 강제할 수 있습니다. 항상 함수를 반환하고 싶을 때 유용합니다. 나중에 이 수업에서 그 사용 사례를 살펴보겠습니다.
- auto를 사용하고 언어 모델이 무엇을 할지 선택하도록 하므로 여기서 함수 호출이 필요하지 않음을 인식하고 이전과 같이 역할과 내용만 응답하고 있습니다.

In [21]:
messages = [
    {
        "role": "user",
        "content": "hi!",
    }
]
response = client.chat.completions.create(
    model="gpt-3.5-turbo-0613",
    messages=messages,
    functions=functions,
    function_call="auto",
)
print(response.choices[0].message.content)

Hello! How can I assist you today?


- 함수 호출에 사용할 수 있는 또 다른 모드는 none입니다.
- 제공된 함수 중 아무 것도 사용하지 않도록 언어 모델을 강제합니다.
- 이 예제에서는 내용이 함수 호출을 필요로 하지 않기 때문에 상관없습니다.
- 그러나 메시지가 여기서 함수를 호출해야 할 때는 어떻게 될까요? getCurrentWeather 함수를 호출해야 합니다.
- 그러나 아래를 보면 여전히 일반적인 역할과 내용이 보입니다. 이는 함수를 호출하지 않도록 강제하고 있기 때문입니다.

In [22]:
messages = [
    {
        "role": "user",
        "content": "hi!",
    }
]
response = client.chat.completions.create(
    model="gpt-3.5-turbo-0613",
    messages=messages,
    functions=functions,
    function_call="none",
)
print(response.choices[0].message.content)

Hello! How can I assist you today?


In [26]:
messages = [
    {
        "role": "user",
        "content": "What's the weather in Boston?",
    }
]
response = client.chat.completions.create(
    model="gpt-3.5-turbo-0613",
    messages=messages,
    functions=functions,
    function_call="none",
)
print(response.choices[0].message.content)

The current weather in Boston is currently unavailable. Please try again later.


- 함수 호출 매개변수의 마지막 옵션은 함수를 호출하도록 강제하는 것입니다.
- 이를 수행하는 방법을 살펴보겠습니다. 응답을 보면 실제로 함수 호출 객체가 반환되었으며 이름이 getCurrentWeather이고 몇 가지 인수가 포함되어 있습니다.
- 재미로 함수 호출이 필요 없는 메시지를 전달하지만 강제로 호출하도록 하면 어떻게 되는지 봅시다.

In [27]:
messages = [
    {
        "role": "user",
        "content": "hi!",
    }
]
response = client.chat.completions.create(
    model="gpt-3.5-turbo-0613",
    messages=messages,
    functions=functions,
    function_call={"name": "get_current_weather"},
)
print(response)

ChatCompletion(id='chatcmpl-9fH6kjk3a5lQ1hMyDUZ75erpqDeyc', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content=None, role='assistant', function_call=FunctionCall(arguments='{\n  "location": "San Francisco, CA"\n}', name='get_current_weather'), tool_calls=None))], created=1719624238, model='gpt-3.5-turbo-0613', object='chat.completion', system_fingerprint=None, usage=CompletionUsage(completion_tokens=12, prompt_tokens=83, total_tokens=95))


In [28]:
print(response.choices[0].message.content)

None


- 여기서 San Francisco, California를 생성하고 있습니다. 다시 실행하면 계속해서 San Francisco, California를 호출합니다.

In [34]:
print(response.choices[0].message.function_call.arguments)

{
  "location": "San Francisco, CA"
}


- 마지막으로 몇 가지 사항을 정리하겠습니다.
- 첫째, 함수 자체와 설명이 OpenAI에 전달하는 토큰 사용 한도에 포함됩니다.
- 함수와 함수 호출을 주석 처리하면 프롬프트 토큰 수가 15로 감소하는 것을 볼 수 있습니다.
- 이 특정 예제에서는 함수 정의와 함수 설명이 많은 토큰을 차지하고 있습니다.
- 이는 OpenAI 모델에 토큰 한도가 있기 때문에 중요합니다.
- 따라서 OpenAI에 전달할 메시지를 구성할 때 이를 염두에 두어야 합니다.

In [38]:
messages = [
    {
        "role": "user",
        "content": "What's the weather like in Boston!",
    }
]
response = client.chat.completions.create(
    model="gpt-3.5-turbo-0613",
    messages=messages,
    functions=functions,
    function_call={"name": "get_current_weather"},
)
print(response)

ChatCompletion(id='chatcmpl-9dBKcaRgxv6AbtK1dEvVns2WMK7O0', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content=None, role='assistant', function_call=FunctionCall(arguments='{\n"location": "Boston, MA"\n}', name='get_current_weather'), tool_calls=None))], created=1719125378, model='gpt-3.5-turbo-0613', object='chat.completion', system_fingerprint=None, usage=CompletionUsage(completion_tokens=10, prompt_tokens=89, total_tokens=99))


In [39]:
print(response.choices[0].message.function_call.arguments)

{
"location": "Boston, MA"
}


In [40]:
messages.append(response.choices[0].message)

- 마지막으로 이러한 함수 호출 중 일부와 실제로 함수 호출을 수행한 결과를 언어 모델에 다시 전달하는 방법을 살펴보겠습니다.
- 이는 종종 언어 모델을 사용하여 호출할 함수를 결정한 다음 해당 함수를 실행하고 그 결과를 언어 모델에 다시 전달하여 최종 응답을 얻고 싶을 때 중요합니다.

In [41]:
args = json.loads(response.choices[0].message.function_call.arguments)
observation = get_current_weather(args)
print(observation)

{"location": {"location": "Boston, MA"}, "temperature": "72", "unit": "fahrenheit", "forecast": ["sunny", "windy"]}


- 이 메시지를 가져와 메시지 목록에 추가할 것입니다.
- 언어 모델이 제공하는 인수로 getCurrentWeather 함수를 호출하는 것을 시뮬레이션할 수 있습니다.
- 이를 변수에 저장한 다음 방금 호출한 함수의 응답을 나타내는 새 메시지를 목록에 추가할 수 있습니다.

In [42]:
messages.append(
        {
            "role": "function",
            "name": "get_current_weather",
            "content": observation,
        }
)

- 새로운 유형의 메시지로 이를 수행합니다. 역할이 함수와 동일합니다.
- 이는 함수 호출의 응답임을 언어 모델에 전달하는 데 사용됩니다. 그런 다음 이름도 전달하는데, 이는 함수의 이름입니다.
- 그리고 위에서 계산한 observation과 동일하게 설정할 수 있는 content 변수를 전달합니다.
- 이 메시지 목록으로 언어 모델을 호출하면 언어 모델이 observation의 응답이 생성됩니다.

In [43]:
response = client.chat.completions.create(
    model="gpt-3.5-turbo-0613",
    messages=messages,
)
print(response.choices[0].message.content)

The current weather in Boston, MA is sunny and windy with a temperature of 72°F.


# LangChain Expression Language (LCEL)

<img src='./images/fig_02_01.png' width=800>

<img src='./images/fig_02_03.png' width=800>

In [29]:
import os
# import openai

# from dotenv import load_dotenv, find_dotenv
# _ = load_dotenv(find_dotenv()) # read local .env file
# openai.api_key = os.environ['OPENAI_API_KEY']

In [30]:
#!pip install pydantic==1.10.8

In [31]:
from langchain.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain.schema.output_parser import StrOutputParser

## Simple Chain

- 단순 체인을 설정합니다. 

In [35]:
prompt = ChatPromptTemplate.from_template(
    "{topic}에 대한 짧은 농담을 말해줘."
)
model = ChatOpenAI()
output_parser = StrOutputParser()

In [39]:
chain = prompt | model | output_parser

In [40]:
response = chain.invoke({"topic": "bears"})
print(response)

왜 곰들이 항상 떨고 있는가? 

- 왜냐하면, 그들이 항상 뚜루루루루~하는거야!


## More complex chain

- And Runnable Map to supply user-provided inputs to the prompt.
- 이제 더 복잡한 체인을 만들어 보겠습니다. 여기서는 검색 기능이 추가된 생성을 구현합니다.

In [41]:
from langchain_openai import OpenAIEmbeddings
from langchain.vectorstores import DocArrayInMemorySearch

In [43]:
vectorstore = DocArrayInMemorySearch.from_texts(
    ["harrison worked at kensho", "bears like to eat honey"],
    embedding=OpenAIEmbeddings()
)
retriever = vectorstore.as_retriever()

In [44]:
results = retriever.invoke( "where did harrison work?")
print(results)

[Document(page_content='harrison worked at kensho'), Document(page_content='bears like to eat honey')]


In [45]:
results = retriever.invoke("what do bears like to eat?")
print(results)

[Document(page_content='bears like to eat honey'), Document(page_content='harrison worked at kensho')]


In [48]:
template = """Answer the question based only on the following context:
{context}

Question: {question}
"""
prompt = ChatPromptTemplate.from_template(template)

In [49]:
from langchain.schema.runnable import RunnableMap

- RunnableMap을 사용하여 검색된 문맥과 질문을 매핑합니다.

In [50]:
chain = RunnableMap({
    "context": lambda x: retriever.invoke(x["question"]),
    "question": lambda x: x["question"]
}) | prompt | model | output_parser

In [51]:
chain.invoke({"question": "where did harrison work?"})

'Harrison worked at Kensho.'

In [52]:
inputs = RunnableMap({
    "context": lambda x: retriever.invoke(x["question"]),
    "question": lambda x: x["question"]
})

In [53]:
inputs.invoke({"question": "where did harrison work?"})

{'context': [Document(page_content='harrison worked at kensho'),
  Document(page_content='bears like to eat honey')],
 'question': 'where did harrison work?'}

## Bind

and OpenAI Functions

In [55]:
functions = [
    {
      "name": "weather_search",
      "description": "Search for weather given an airport code",
      "parameters": {
        "type": "object",
        "properties": {
          "airport_code": {
            "type": "string",
            "description": "The airport code to get the weather for"
          },
        },
        "required": ["airport_code"]
      }
    }
  ]

In [56]:
prompt = ChatPromptTemplate.from_messages(
    [
        ("human", "{input}")
    ]
)
model = ChatOpenAI(temperature=0).bind(functions=functions)

In [57]:
runnable = prompt | model

In [58]:
runnable.invoke({"input": "what is the weather in sf"})

AIMessage(content='', additional_kwargs={'function_call': {'arguments': '{"airport_code":"SFO"}', 'name': 'weather_search'}}, response_metadata={'token_usage': {'completion_tokens': 16, 'prompt_tokens': 64, 'total_tokens': 80}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'function_call', 'logprobs': None}, id='run-499d115c-93fc-400f-8259-ed87b088c51c-0', usage_metadata={'input_tokens': 64, 'output_tokens': 16, 'total_tokens': 80})

In [59]:
functions = [
    {
      "name": "weather_search",
      "description": "Search for weather given an airport code",
      "parameters": {
        "type": "object",
        "properties": {
          "airport_code": {
            "type": "string",
            "description": "The airport code to get the weather for"
          },
        },
        "required": ["airport_code"]
      }
    },
        {
      "name": "sports_search",
      "description": "Search for news of recent sport events",
      "parameters": {
        "type": "object",
        "properties": {
          "team_name": {
            "type": "string",
            "description": "The sports team to search for"
          },
        },
        "required": ["team_name"]
      }
    }
  ]

In [60]:
model = model.bind(functions=functions)

In [61]:
runnable = prompt | model

In [62]:
runnable.invoke({"input": "how did the patriots do yesterday?"})

AIMessage(content='', additional_kwargs={'function_call': {'arguments': '{"team_name":"patriots"}', 'name': 'sports_search'}}, response_metadata={'token_usage': {'completion_tokens': 18, 'prompt_tokens': 99, 'total_tokens': 117}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'function_call', 'logprobs': None}, id='run-20a90b10-f8e7-4ed6-ab8b-309225e69304-0', usage_metadata={'input_tokens': 99, 'output_tokens': 18, 'total_tokens': 117})

- 패트리어츠(Patriots)는 미국의 프로 미식축구 팀인 뉴잉글랜드 패트리어츠(New England Patriots)를 줄여서 부르는 말입니다. 이 팀은 NFL(National Football League)에 속해 있으며, 매사추세츠주 폭스버러에 기반을 두고 있습니다. 패트리어츠는 NFL에서 매우 성공적인 팀 중 하나로, 여러 차례 슈퍼볼 우승을 차지한 경력이 있습니다.

## Fallbacks
- 이제 에러 처리를 위한 폴백 체인을 설정하겠습니다.
- 첫 번째 모델이 실패할 경우 폴백 모델을 사용합니다.

In [63]:
from langchain.llms import OpenAI # 옛날 모델 
import json

**Note**: Due to the deprecation of OpenAI's model `text-davinci-001` on 4 January 2024, you'll be using OpenAI's recommended replacement model `gpt-3.5-turbo-instruct` instead.

- 단순 체인을 설정합니다. 이 체인은 언어 모델의 출력을 JSON으로 디코딩합니다.

In [64]:
simple_model = OpenAI(
    temperature=0, 
    max_tokens=1000, 
    model="gpt-3.5-turbo-instruct"
)

simple_chain = simple_model | json.loads

  warn_deprecated(


In [65]:
challenge = "세 개의 시를 JSON 블롭으로 작성하세요. 각 시는 제목, 작가, 첫 줄로 구성된 JSON 블롭입니다."

In [66]:
response = simple_model.invoke(challenge)
print(response)



{
  "title": "봄",
  "author": "김소월",
  "first_line": "봄이 오면 산들도 꽃피고"
}

{
  "title": "가을",
  "author": "윤동주",
  "first_line": "가을이 오면 나는 노래한다"
}

{
  "title": "겨울",
  "author": "정지용",
  "first_line": "겨울이 오면 나는 눈을 바라본다"
}


- json 형식 생성에 실패

In [67]:
type(response)

str

**Note**: The next line is expected to fail.

In [69]:
from langchain_openai import ChatOpenAI # 최근 모델

model = ChatOpenAI(temperature=0)
chain = model | StrOutputParser() | json.loads

In [70]:
response = chain.invoke(challenge)

In [71]:
print(response)

[{'title': '봄', 'author': '윤동주', 'first_line': '봄이 오나 봄이 오나 봄이 오나'}, {'title': '가을', 'author': '김소월', 'first_line': '하늘 높이 구름 없이 맑은 가을하늘'}, {'title': '겨울', 'author': '이상', 'first_line': '눈 내리는 밤이면 눈 내리는 밤이면'}]


- 최근 모델 성공

In [72]:
type(response[0])

dict

- fallbacks 를 쓰면 에러가 나도 원래 chain로 돌아가서 실행을 한다.
- 첫 번째 모델이 실패하면 폴백 모델이 호출됨

In [73]:
final_chain = simple_chain.with_fallbacks([chain])

In [74]:
response = final_chain.invoke(challenge)
print(response)

[{'title': '봄', 'author': '윤동주', 'first_line': '봄날의 햇살이 부드럽게 내린다.'}, {'title': '가을', 'author': '김소월', 'first_line': '단풍잎이 바람에 스치며 날아간다.'}, {'title': '겨울', 'author': '이상', 'first_line': '하얀 눈이 하늘에서 내리고 있다.'}]


In [76]:
type(response[0])

dict

## Interface
- LCEL을 사용하면 다양한 방식으로 런너블을 호출할 수 있습니다. 여기에는 invoke, stream, batch 메서드가 포함됩니다.
  
<img src='./images/fig_02_02.png' width=800>

In [77]:
prompt = ChatPromptTemplate.from_template(
    "Tell me a short joke about {topic}"
)
model = ChatOpenAI()
output_parser = StrOutputParser()

chain = prompt | model | output_parser

In [78]:
chain.invoke({"topic": "bears"})

"Why don't bears wear shoes? \n\nBecause they have bear feet!"

- batch 메서드는 여러 입력에 대해 런너블을 호출합니다. 이는 병렬 처리를 통해 성능을 향상시킬 수 있습니다.

In [80]:
chain.batch([{"topic": "bears"}, {"topic": "frogs"}])

["Why did the bear break up with his girlfriend?\nBecause he couldn't bear the relationship anymore!",
 'Why are frogs so happy? Because they eat whatever bugs them!']

- stream 메서드는 스트리밍 방식으로 응답을 반환합니다. 이 방법은 응답을 점진적으로 처리할 수 있습니다.

In [79]:
for t in chain.stream({"topic": "bears"}):
    print(t)


Why
 do
 bears
 have
 hairy
 coats
?


F
ur
 protection
!



- 모든 동기 메서드는 비동기 버전도 제공됩니다. 예를 들어 ainvoke, astream, abatch 메서드가 있습니다.

In [81]:
print(1)
response = await chain.ainvoke({"topic": "bears"})
print(response)
print(2)

1
What do you call a bear with no teeth?

A gummy bear!
2


# OpenAI Function Calling In LangChain

- OpenAI 함수와 LangChain 표현 언어의 사용법을 소개합니다.
- Pydantic 라이브러리를 소개합니다. Pydantic은 OpenAI 함수를 쉽게 만들 수 있게 도와주는 Python 라이브러리입니다.


- Pydantic이란?
    - Pydantic은 Python의 데이터 검증 라이브러리로, 다양한 스키마를 정의하고 이를 JSON으로 내보내기 쉽게 합니다.
    - Pydantic 객체를 사용하여 OpenAI 함수 설명을 작성할 수 있습니다.


<img src='./images/fig_03_01.png' width=800>

- Pydantic 클래스 정의
    - 일반적인 Python 클래스와 유사하며, init 메서드 대신 클래스 정의 아래 속성과 타입을 나열합니다.
    - 이 클래스들은 실제로 사용되지는 않고, OpenAI 함수의 JSON을 생성하기 위해 사용됩니다.


<img src='./images/fig_03_02.png' width=800>

In [None]:
# import os
# import openai

# from dotenv import load_dotenv, find_dotenv
# _ = load_dotenv(find_dotenv()) # read local .env file
# openai.api_key = os.environ['OPENAI_API_KEY']

In [82]:
from typing import List
from pydantic import BaseModel, Field

## Pydantic Syntax

- Pydantic 데이터 클래스는 Python의 데이터 클래스와 Pydantic의 검증 기능이 결합된 것입니다.
- 이들은 데이터 구조를 간결하게 정의하면서 데이터가 지정된 타입과 제약 조건을 준수하도록 보장합니다.
- 표준 Python에서는 다음과 같이 클래스를 생성합니다:

In [84]:
class User:
    def __init__(self, name: str, age: int, email: str):
        self.name = name
        self.age = age
        self.email = email

In [85]:
foo = User(name="Joe",age=32, email="joe@gmail.com")

In [86]:
foo.name

'Joe'

In [87]:
foo = User(name="Joe",age="bar", email="joe@gmail.com")

In [88]:
foo.age

'bar'

In [89]:
class pUser(BaseModel):
    name: str
    age: int
    email: str

In [90]:
foo_p = pUser(name="Jane", age=32, email="jane@gmail.com")

In [91]:
foo_p.name

'Jane'

**Note**: The next cell is expected to fail.

In [92]:
foo_p = pUser(name="Jane", age="bar", email="jane@gmail.com")

ValidationError: 1 validation error for pUser
age
  Input should be a valid integer, unable to parse string as an integer [type=int_parsing, input_value='bar', input_type=str]
    For further information visit https://errors.pydantic.dev/2.7/v/int_parsing

In [93]:
class Class(BaseModel):
    students: List[pUser]

In [94]:
obj = Class(
    students=[pUser(name="Jane", age=32, email="jane@gmail.com")]
)

In [95]:
obj

Class(students=[pUser(name='Jane', age=32, email='jane@gmail.com')])

## Pydantic to OpenAI function definition
- 다음은 Pydantic을 사용하여 OpenAI 함수를 생성하는 코드 예제입니다.
- WeatherSearch 클래스는 Pydantic의 BaseModel을 상속받아 정의됩니다.
- 클래스에는 airport_code라는 문자열 속성이 있으며, 이 속성에는 "날씨를 가져올 공항 코드"라는 설명이 붙어 있습니다.
- 클래스의 docstring은 "Call this with an airport code to get the weather at that airport"로, 이 함수가 특정 공항의 날씨 정보를 가져오는 데 사용된다는 설명을 포함합니다.

In [101]:
class WeatherSearch(BaseModel):
    """Call this with an airport code to get the weather at that airport"""
    airport_code: str = Field(description="airport code to get weather for")

- convert_pydantic_to_openai_function 함수를 사용하여 WeatherSearch 클래스를 OpenAI 함수로 변환합니다.

In [102]:
from langchain_core.utils.function_calling import convert_pydantic_to_openai_function

In [103]:
weather_function = convert_pydantic_to_openai_function(WeatherSearch)

- weather_function 변수는 변환된 OpenAI 함수의 JSON 스키마를 포함합니다.

In [104]:
weather_function

{'name': 'WeatherSearch',
 'description': 'Call this with an airport code to get the weather at that airport',
 'parameters': {'properties': {'airport_code': {'description': 'airport code to get weather for',
    'type': 'string'}},
  'required': ['airport_code'],
  'type': 'object'}}

- description 이 없으면 에러가 나야 하지만

In [37]:
class WeatherSearch1(BaseModel):
    airport_code: str = Field(description="airport code to get weather for")

- 지금은 안난다 (구버전은 났음)

In [38]:
convert_pydantic_to_openai_function(WeatherSearch1)

{'name': 'WeatherSearch1',
 'description': '',
 'parameters': {'properties': {'airport_code': {'description': 'airport code to get weather for',
    'type': 'string'}},
  'required': ['airport_code'],
  'type': 'object'}}

In [105]:
class WeatherSearch2(BaseModel):
    """Call this with an airport code to get the weather at that airport"""
    airport_code: str

In [106]:
convert_pydantic_to_openai_function(WeatherSearch2)

{'name': 'WeatherSearch2',
 'description': 'Call this with an airport code to get the weather at that airport',
 'parameters': {'properties': {'airport_code': {'type': 'string'}},
  'required': ['airport_code'],
  'type': 'object'}}

In [107]:
from langchain_openai import ChatOpenAI

In [108]:
model = ChatOpenAI()

- model.invoke("what is the weather in SF today?", functions=[weather_function])를 호출하여 모델에게 "SF의 오늘 날씨는?"이라는 질문을 전달합니다.
- functions 인수에 weather_function을 전달하여, 모델이 이 질문에 대해 weather_function 함수를 사용할 수 있도록 합니다.
- weather_function은 이전에 Pydantic을 사용하여 정의한 날씨 검색 함수로, 공항 코드를 사용하여 해당 공항의 날씨 정보를 가져오는 역할을 합니다.

In [109]:
model.invoke("what is the weather in SF today?", functions=[weather_function])

AIMessage(content='', additional_kwargs={'function_call': {'arguments': '{"airport_code":"SFO"}', 'name': 'WeatherSearch'}}, response_metadata={'token_usage': {'completion_tokens': 17, 'prompt_tokens': 70, 'total_tokens': 87}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'function_call', 'logprobs': None}, id='run-d45d5909-4458-47f5-8a18-0a6c4abae3f7-0', usage_metadata={'input_tokens': 70, 'output_tokens': 17, 'total_tokens': 87})

- model.bind(functions=[weather_function])를 호출하여 모델에 weather_function을 바인딩합니다.
- 이렇게 하면 모델 인스턴스가 weather_function을 항상 사용할 수 있게 됩니다.
- model_with_function 변수는 함수가 바인딩된 모델 인스턴스를 참조합니다.
- model_with_function.invoke("what is the weather in sf?")를 호출하여 모델에게 "SF의 날씨는?"이라는 질문을 전달합니다.
- 바인딩된 weather_function이 이 질문에 대해 사용됩니다.

In [110]:
model_with_function = model.bind(functions=[weather_function])

In [111]:
model_with_function.invoke("what is the weather in sf?")

AIMessage(content='', additional_kwargs={'function_call': {'arguments': '{"airport_code":"SFO"}', 'name': 'WeatherSearch'}}, response_metadata={'token_usage': {'completion_tokens': 17, 'prompt_tokens': 69, 'total_tokens': 86}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'function_call', 'logprobs': None}, id='run-87083edf-578d-49c4-a634-a714ca284d10-0', usage_metadata={'input_tokens': 69, 'output_tokens': 17, 'total_tokens': 86})

## Forcing it to use a function

- `model.bind(functions=[weather_function], function_call={"name":"WeatherSearch"})`를 호출하여 모델에 `weather_function`을 바인딩하고, 특정 함수 호출을 강제하도록 설정합니다.
  - `functions=[weather_function]`: 모델에 바인딩할 함수 리스트를 지정합니다.
  - `function_call={"name":"WeatherSearch"}`: 모델이 항상 "WeatherSearch"라는 이름의 함수를 호출하도록 강제합니다.
- `model_with_forced_function` 변수는 함수가 바인딩되고 특정 함수 호출이 강제된 모델 인스턴스를 참조합니다.
- `model_with_forced_function.invoke("what is the weather in sf?")`를 호출하여 모델에게 "SF의 날씨는?"이라는 질문을 전달합니다.
- 이 설정 덕분에 모델은 항상 `WeatherSearch` 함수를 사용하여 질문에 응답하게 됩니다.

In [112]:
model_with_forced_function = model.bind(functions=[weather_function], function_call={"name":"WeatherSearch"})

In [113]:
model_with_forced_function.invoke("what is the weather in sf?")

AIMessage(content='', additional_kwargs={'function_call': {'arguments': '{"airport_code":"SFO"}', 'name': 'WeatherSearch'}}, response_metadata={'token_usage': {'completion_tokens': 7, 'prompt_tokens': 79, 'total_tokens': 86}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-92431049-a84b-4075-8bd1-7e25a01a3a60-0', usage_metadata={'input_tokens': 79, 'output_tokens': 7, 'total_tokens': 86})

In [114]:
model_with_forced_function.invoke("hi!")

AIMessage(content='', additional_kwargs={'function_call': {'arguments': '{"airport_code":"SFO"}', 'name': 'WeatherSearch'}}, response_metadata={'token_usage': {'completion_tokens': 7, 'prompt_tokens': 74, 'total_tokens': 81}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-c8499c59-398e-4884-9a27-87b622983042-0', usage_metadata={'input_tokens': 74, 'output_tokens': 7, 'total_tokens': 81})

## Using in a chain


다음은 프롬프트 템플릿과 바인딩된 모델을 사용하여 체인을 호출하는 코드 예제입니다.

- `ChatPromptTemplate.from_messages`를 사용하여 프롬프트 템플릿을 생성합니다.
  - 이 템플릿은 시스템 메시지와 사용자 메시지로 구성됩니다.
  - 시스템 메시지: "You are a helpful assistant" (당신은 도움이 되는 어시스턴트입니다)
  - 사용자 메시지: `{input}` (사용자 입력을 받을 자리 표시자)
- `prompt` 변수는 생성된 프롬프트 템플릿을 참조합니다.

In [115]:
from langchain.prompts import ChatPromptTemplate

In [116]:
prompt = ChatPromptTemplate.from_messages([
    ("system", "You are a helpful assistant"),
    ("user", "{input}")
])

- `prompt | model_with_function`을 사용하여 프롬프트 템플릿과 바인딩된 모델을 체인으로 결합합니다.
  - `|` 연산자는 프롬프트 템플릿의 출력을 모델에 전달하는 체인을 생성합니다.

In [117]:
chain = prompt | model_with_function

- `chain.invoke({"input": "what is the weather in sf?"})`를 호출하여 체인에 입력을 전달하고 결과를 가져옵니다.
  - 입력 딕셔너리에는 `input` 키가 있으며, 값으로 "what is the weather in sf?"를 전달합니다.
- 이 체인은 프롬프트 템플릿을 통해 입력을 받아 모델로 전달하고, 모델은 바인딩된 `weather_function`을 사용하여 응답을 생성합니다.

이 예제는 프롬프트 템플릿과 바인딩된 모델을 체인으로 결합하여 사용자 입력을 처리하고 모델의 응답을 가져오는 방법을 보여줍니다.

In [118]:
chain.invoke({"input": "what is the weather in sf?"})

AIMessage(content='', additional_kwargs={'function_call': {'arguments': '{"airport_code":"SFO"}', 'name': 'WeatherSearch'}}, response_metadata={'token_usage': {'completion_tokens': 17, 'prompt_tokens': 75, 'total_tokens': 92}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'function_call', 'logprobs': None}, id='run-efb2c098-ca88-4f53-9b07-5d46c4e065f5-0', usage_metadata={'input_tokens': 75, 'output_tokens': 17, 'total_tokens': 92})

## Using multiple functions

다음은 여러 Pydantic 함수를 바인딩하고 호출하는 OpenAI 모델 코드 예제입니다.

- `ArtistSearch` 클래스는 Pydantic의 `BaseModel`을 상속받아 정의됩니다.
  - `artist_name` 속성은 조회할 아티스트의 이름을 나타내며, 문자열로 타입이 지정되어 있습니다.
  - `n` 속성은 결과의 개수를 나타내며, 정수로 타입이 지정되어 있습니다.
  - 클래스의 docstring은 "Call this to get the names of songs by a particular artist"로, 특정 아티스트의 노래 목록을 가져오는 데 사용된다는 설명을 포함합니다.

In [48]:
class ArtistSearch(BaseModel):
    """Call this to get the names of songs by a particular artist"""
    artist_name: str = Field(description="name of artist to look up")
    n: int = Field(description="number of results")

- `functions` 리스트에는 `WeatherSearch`와 `ArtistSearch` 클래스에서 변환된 OpenAI 함수가 포함됩니다.

In [49]:
functions = [
    convert_pydantic_to_openai_function(WeatherSearch),
    convert_pydantic_to_openai_function(ArtistSearch),
]

- `model.bind(functions=functions)`를 호출하여 모델에 여러 함수를 바인딩합니다.

In [50]:
model_with_functions = model.bind(functions=functions)

- `model_with_functions.invoke("what is the weather in sf?")`를 호출하여 모델에게 "SF의 날씨는?"이라는 질문을 전달합니다. 모델은 바인딩된 `weather_function`을 사용하여 응답합니다.

In [51]:
model_with_functions.invoke("what is the weather in sf?")

AIMessage(content='', additional_kwargs={'function_call': {'arguments': '{"airport_code":"SFO"}', 'name': 'WeatherSearch'}}, response_metadata={'token_usage': {'completion_tokens': 17, 'prompt_tokens': 116, 'total_tokens': 133}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'function_call', 'logprobs': None}, id='run-597a4b35-9247-467a-8fcf-56df449a87ee-0', usage_metadata={'input_tokens': 116, 'output_tokens': 17, 'total_tokens': 133})

- `model_with_functions.invoke("what are three songs by taylor swift?")`를 호출하여 모델에게 "Taylor Swift의 노래 세 곡은 무엇인가요?"라는 질문을 전달합니다. 모델은 바인딩된 `artist_function`을 사용하여 응답합니다.

In [52]:
model_with_functions.invoke("what are three songs by taylor swift?")

AIMessage(content='', additional_kwargs={'function_call': {'arguments': '{"artist_name":"Taylor Swift","n":3}', 'name': 'ArtistSearch'}}, response_metadata={'token_usage': {'completion_tokens': 21, 'prompt_tokens': 118, 'total_tokens': 139}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'function_call', 'logprobs': None}, id='run-dc0befe1-cd4b-4d85-b1b1-ec61ef81a792-0', usage_metadata={'input_tokens': 118, 'output_tokens': 21, 'total_tokens': 139})

- `model_with_functions.invoke("hi!")`를 호출하여 모델에게 "안녕하세요!"라는 인사말을 전달합니다. 이 경우, 모델은 함수 호출 없이 일반적인 응답을 제공합니다.

In [53]:
model_with_functions.invoke("hi!")

AIMessage(content='Hello! How can I assist you today?', response_metadata={'token_usage': {'completion_tokens': 10, 'prompt_tokens': 111, 'total_tokens': 121}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-1dc3fbf7-9525-49fc-95af-ac152c36b433-0', usage_metadata={'input_tokens': 111, 'output_tokens': 10, 'total_tokens': 121})

- 이 예제는 여러 Pydantic 함수를 바인딩하여 다양한 질문에 대해 적절한 함수를 선택하여 응답하는 방법을 보여줍니다. 모델은 질문의 내용에 따라 적절한 함수를 호출하거나, 필요하지 않은 경우 일반적인 응답을 제공할 수 있습니다.

# Tagging and Extraction Using OpenAI functions


### 태깅 (Tagging)
1. **개요**: 비구조화된 텍스트에 구조화된 설명을 입력하여 구조화된 데이터를 생성.
2. **예시**: 텍스트의 감정과 언어 태그를 추출.
3. **과정**:
   - 비구조화된 텍스트와 구조화된 설명을 입력.
   - LLM을 사용하여 텍스트의 감정과 언어를 태그로 추출.
   - 구조화된 설명에 따라 결과 생성.

<img src="./images/fig_04_01.png" width=800>


In [10]:
# import os
# import openai

# from dotenv import load_dotenv, find_dotenv
# _ = load_dotenv(find_dotenv()) # read local .env file
# openai.api_key = os.environ['OPENAI_API_KEY']

1. **설정**:
   - 필요한 함수와 클래스 임포트 (typing, Pydantic 등).
   - Pydantic 모델 생성 (태깅에 사용).
   - 'convert_pydantic_to_openai_function' 메소드 사용.

In [120]:
from typing import List
from pydantic import BaseModel, Field
from langchain_core.utils.function_calling import convert_pydantic_to_openai_function

2. **태깅 기능 구현**:
   - 프로토타입 태깅 모델 생성.
   - 감정과 언어 태그를 위한 구조화된 설명 추가.
   - 모델에 프롬프트와 언어 모델 연결.
   - 사용자 입력을 받아 태깅 함수 호출.
   - 결과: 감정(positive), 언어(English) 등 추출.

In [121]:
class Tagging(BaseModel):
    """Tag the piece of text with particular info."""
    sentiment: str = Field(description="sentiment of text, should be `pos`, `neg`, or `neutral`")
    language: str = Field(description="language of text (should be ISO 639-1 code)")

In [122]:
convert_pydantic_to_openai_function(Tagging)

{'name': 'Tagging',
 'description': 'Tag the piece of text with particular info.',
 'parameters': {'properties': {'sentiment': {'description': 'sentiment of text, should be `pos`, `neg`, or `neutral`',
    'type': 'string'},
   'language': {'description': 'language of text (should be ISO 639-1 code)',
    'type': 'string'}},
  'required': ['sentiment', 'language'],
  'type': 'object'}}

In [123]:
from langchain.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI

In [124]:
model = ChatOpenAI(temperature=0)

In [125]:
tagging_functions = [convert_pydantic_to_openai_function(Tagging)]

In [126]:
prompt = ChatPromptTemplate.from_messages([
    ("system", "Think carefully, and then tag the text as instructed"),
    ("user", "{input}")
])

In [127]:
model_with_functions = model.bind(
    functions=tagging_functions,
    function_call={"name": "Tagging"}
)

In [128]:
tagging_chain = prompt | model_with_functions

In [129]:
tagging_chain.invoke({"input": "I love langchain"})

AIMessage(content='', additional_kwargs={'function_call': {'arguments': '{"sentiment":"pos","language":"en"}', 'name': 'Tagging'}}, response_metadata={'token_usage': {'completion_tokens': 10, 'prompt_tokens': 108, 'total_tokens': 118}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-48791a96-c6d7-4fc9-a729-b44af84cc2c5-0', usage_metadata={'input_tokens': 108, 'output_tokens': 10, 'total_tokens': 118})

In [130]:
tagging_chain.invoke({"input": "non mi piace questo cibo"})  # "이 음식이 마음에 들지 않습니다"

AIMessage(content='', additional_kwargs={'function_call': {'arguments': '{"sentiment":"neg","language":"it"}', 'name': 'Tagging'}}, response_metadata={'token_usage': {'completion_tokens': 10, 'prompt_tokens': 111, 'total_tokens': 121}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-fe62103a-1b3e-4db0-b059-a89a7705631a-0', usage_metadata={'input_tokens': 111, 'output_tokens': 10, 'total_tokens': 121})

In [131]:
from langchain.output_parsers.openai_functions import JsonOutputFunctionsParser

In [132]:
tagging_chain = prompt | model_with_functions | JsonOutputFunctionsParser()

In [133]:
tagging_chain.invoke({"input": "이 순대 존맛탱이네."})

{'sentiment': 'pos', 'language': 'ko'}

## Extraction

Extraction is similar to tagging, but used for extracting multiple pieces of information.

### 추출 (Extraction)
1. **개요**: 텍스트에서 특정 엔티티를 추출.
2. **차이점**: 태깅과 달리 리스트 형태로 엔티티를 추출.
3. **예시**: 기사에서 언급된 논문 리스트 추출.

<img src="./images/fig_04_02.png" width=800>

3. **추출 기능 구현**:
   - 다수의 정보를 추출하기 위해 클래스 정의.
   - 예: 사람 정보(person schema) 추출.
   - 추출한 정보를 리스트로 관리.

In [134]:
from typing import Optional
class Person(BaseModel):
    """Information about a person."""
    name: str = Field(description="person's name")
    age: Optional[int] = Field(description="person's age")

In [135]:
class Information(BaseModel):
    """Information to extract."""
    people: List[Person] = Field(description="List of info about people")

In [136]:
convert_pydantic_to_openai_function(Information)

{'name': 'Information',
 'description': 'Information to extract.',
 'parameters': {'$defs': {'Person': {'description': 'Information about a person.',
    'properties': {'name': {'description': "person's name", 'type': 'string'},
     'age': {'anyOf': [{'type': 'integer'}, {'type': 'null'}],
      'description': "person's age"}},
    'required': ['name', 'age'],
    'type': 'object'}},
  'properties': {'people': {'description': 'List of info about people',
    'items': {'description': 'Information about a person.',
     'properties': {'name': {'description': "person's name", 'type': 'string'},
      'age': {'anyOf': [{'type': 'integer'}, {'type': 'null'}],
       'description': "person's age"}},
     'required': ['name', 'age'],
     'type': 'object'},
    'type': 'array'}},
  'required': ['people'],
  'type': 'object'}}

In [137]:
extraction_functions = [convert_pydantic_to_openai_function(Information)]
extraction_model = model.bind(functions=extraction_functions, function_call={"name": "Information"})

In [138]:
extraction_model.invoke("Joe is 30, his mom is Martha")

AIMessage(content='', additional_kwargs={'function_call': {'arguments': '{"people":[{"name":"Joe","age":30},{"name":"Martha","age":null}]}', 'name': 'Information'}}, response_metadata={'token_usage': {'completion_tokens': 21, 'prompt_tokens': 95, 'total_tokens': 116}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-a1a26392-aa04-4346-afc9-f9db11d8ee5f-0', usage_metadata={'input_tokens': 95, 'output_tokens': 21, 'total_tokens': 116})

In [139]:
prompt = ChatPromptTemplate.from_messages([
    ("system", "Extract the relevant information, if not explicitly provided do not guess. Extract partial info"),
    ("human", "{input}")
])

In [140]:
extraction_chain = prompt | extraction_model

In [141]:
extraction_chain.invoke({"input": "Joe is 30, his mom is Martha"})

AIMessage(content='', additional_kwargs={'function_call': {'arguments': '{"people":[{"name":"Joe","age":30},{"name":"Martha","age":null}]}', 'name': 'Information'}}, response_metadata={'token_usage': {'completion_tokens': 21, 'prompt_tokens': 112, 'total_tokens': 133}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-08f07a57-24a7-425e-a34e-b56ad70801d5-0', usage_metadata={'input_tokens': 112, 'output_tokens': 21, 'total_tokens': 133})

### 출력 파서 (Output Parser)
1. **JSON 출력 파서**: JSON 형식으로 출력된 데이터를 파싱하여 활용.
2. **LangChain**: JSON 출력 파서 사용으로 편리한 데이터 활용.


In [142]:
from langchain.output_parsers.openai_functions import JsonKeyOutputFunctionsParser

In [143]:
extraction_chain = prompt | extraction_model | JsonOutputFunctionsParser()

In [144]:
extraction_chain.invoke({"input": "Joe is 30, his mom is Martha"})

{'people': [{'name': 'Joe', 'age': 30}, {'name': 'Martha', 'age': None}]}

In [145]:
extraction_chain = prompt | extraction_model | JsonKeyOutputFunctionsParser(key_name="people")

In [146]:
extraction_chain.invoke({"input": "Joe is 30, his mom is Martha"})

[{'name': 'Joe', 'age': 30}, {'name': 'Martha', 'age': None}]

## 실제 적용 예시

우리는 태깅을 더 큰 텍스트에 적용할 수 있습니다.

예를 들어, 이 블로그 포스트를 로드하고 텍스트의 일부에서 태그 정보를 추출해 봅시다.

In [147]:
from langchain.document_loaders import WebBaseLoader
loader = WebBaseLoader("https://lilianweng.github.io/posts/2023-06-23-agent/")
documents = loader.load()



In [148]:
doc = documents[0]

In [149]:
page_content = doc.page_content[:10000]

In [150]:
print(page_content[:1000])







LLM Powered Autonomous Agents | Lil'Log







































Lil'Log






















Posts




Archive




Search




Tags




FAQ




emojisearch.app









      LLM Powered Autonomous Agents
    
Date: June 23, 2023  |  Estimated Reading Time: 31 min  |  Author: Lilian Weng


 


Table of Contents



Agent System Overview

Component One: Planning

Task Decomposition

Self-Reflection


Component Two: Memory

Types of Memory

Maximum Inner Product Search (MIPS)


Component Three: Tool Use

Case Studies

Scientific Discovery Agent

Generative Agents Simulation

Proof-of-Concept Examples


Challenges

Citation

References





Building agents with LLM (large language model) as its core controller is a cool concept. Several proof-of-concepts demos, such as AutoGPT, GPT-Engineer and BabyAGI, serve as inspiring examples. The potentiality of LLM extends beyond generating well-written copies, stories, essays and programs; it can be framed as a powerful general

In [151]:
class Overview(BaseModel):
    """Overview of a section of text."""
    summary: str = Field(description="Provide a concise summary of the content.")
    language: str = Field(description="Provide the language that the content is written in.")
    keywords: str = Field(description="Provide keywords related to the content.")

In [152]:
overview_tagging_function = [
    convert_pydantic_to_openai_function(Overview)
]
tagging_model = model.bind(
    functions=overview_tagging_function,
    function_call={"name":"Overview"}
)
tagging_chain = prompt | tagging_model | JsonOutputFunctionsParser()

In [153]:
tagging_chain.invoke({"input": page_content})

{'summary': 'The article discusses building autonomous agents powered by LLM (large language model) as the core controller, with components like planning, memory, and tool use. It explores task decomposition, self-reflection, and challenges in implementing LLM-powered agents.',
 'language': 'English',
 'keywords': 'LLM, autonomous agents, planning, memory, tool use, task decomposition, self-reflection, challenges'}

In [154]:
class Paper(BaseModel):
    """Information about papers mentioned."""
    title: str
    author: Optional[str]


class Info(BaseModel):
    """Information to extract"""
    papers: List[Paper]

In [156]:
paper_extraction_function = [
    convert_pydantic_to_openai_function(Info)
]
extraction_model = model.bind(
    functions=paper_extraction_function, 
    function_call={"name":"Info"}
)
extraction_chain = prompt | extraction_model | JsonKeyOutputFunctionsParser(key_name="papers")

In [157]:
extraction_chain.invoke({"input": page_content})

[{'title': 'LLM Powered Autonomous Agents', 'author': 'Lilian Weng'}]

In [158]:
# template = """A article will be passed to you. Extract from it all papers that are mentioned by this article. 

# Do not extract the name of the article itself. If no papers are mentioned that's fine - you don't need to extract any! Just return an empty list.

# Do not make up or guess ANY extra information. Only extract what exactly is in the text."""

template = '''
기사가 제공됩니다. 이 기사에서 언급된 모든 논문을 추출하세요.

기사의 제목은 추출하지 마세요. 논문이 언급되지 않았다면, 빈 목록을 반환하세요.

추가적인 정보를 추측하거나 만들어내지 말고, 텍스트에 정확히 있는 내용만 추출하세요.
'''

prompt = ChatPromptTemplate.from_messages([
    ("system", template),
    ("human", "{input}")
])

In [159]:
extraction_chain = prompt | extraction_model | JsonKeyOutputFunctionsParser(key_name="papers")

In [160]:
extraction_chain.invoke({"input": page_content})

[{'title': 'Chain of thought (CoT; Wei et al. 2022)', 'author': None},
 {'title': 'Tree of Thoughts (Yao et al. 2023)', 'author': None},
 {'title': 'LLM+P (Liu et al. 2023)', 'author': None},
 {'title': 'ReAct (Yao et al. 2023)', 'author': None},
 {'title': 'Reflexion (Shinn & Labash 2023)', 'author': None},
 {'title': 'Chain of Hindsight (CoH; Liu et al. 2023)', 'author': None},
 {'title': 'Algorithm Distillation (AD; Laskin et al. 2023)', 'author': None}]

In [161]:
extraction_chain.invoke({"input": "hi"})

[]

In [162]:
from langchain.text_splitter import RecursiveCharacterTextSplitter
text_splitter = RecursiveCharacterTextSplitter(chunk_overlap=0)

In [163]:
splits = text_splitter.split_text(doc.page_content)

In [164]:
len(splits)

15

In [165]:
def flatten(matrix):
    flat_list = []
    for row in matrix:
        flat_list += row
    return flat_list

In [166]:
flatten([[1, 2], [3, 4]])

[1, 2, 3, 4]

In [167]:
print(splits[0])

LLM Powered Autonomous Agents | Lil'Log







































Lil'Log






















Posts




Archive




Search




Tags




FAQ




emojisearch.app









      LLM Powered Autonomous Agents
    
Date: June 23, 2023  |  Estimated Reading Time: 31 min  |  Author: Lilian Weng


 


Table of Contents



Agent System Overview

Component One: Planning

Task Decomposition

Self-Reflection


Component Two: Memory

Types of Memory

Maximum Inner Product Search (MIPS)


Component Three: Tool Use

Case Studies

Scientific Discovery Agent

Generative Agents Simulation

Proof-of-Concept Examples


Challenges

Citation

References





Building agents with LLM (large language model) as its core controller is a cool concept. Several proof-of-concepts demos, such as AutoGPT, GPT-Engineer and BabyAGI, serve as inspiring examples. The potentiality of LLM extends beyond generating well-written copies, stories, essays and programs; it can be framed as a powerful general probl

In [168]:
from langchain.schema.runnable import RunnableLambda

In [169]:
prep = RunnableLambda(
    lambda x: [{"input": doc} for doc in text_splitter.split_text(x)]
)

In [170]:
prep.invoke("hi")

[{'input': 'hi'}]

In [171]:
chain = prep | extraction_chain.map() | flatten

In [172]:
response = chain.invoke(doc.page_content)

In [173]:
response

[{'title': 'Maximum Inner Product Search: A Survey',
  'author': 'Yi Tay and Shuai Zhang'},
 {'title': 'Chain of thought', 'author': 'Wei et al. 2022'},
 {'title': 'Tree of Thoughts', 'author': 'Yao et al. 2023'},
 {'title': 'LLM+P', 'author': 'Liu et al. 2023'},
 {'title': 'ReAct', 'author': 'Yao et al. 2023'},
 {'title': 'Reflexion', 'author': 'Shinn & Labash 2023'},
 {'title': 'Chain of Hindsight (CoH)', 'author': 'Liu et al. 2023'},
 {'title': 'Algorithm Distillation (AD)', 'author': 'Laskin et al. 2023'},
 {'title': 'Algorithm Distillation for Learning In-Context Reinforcement Learning Algorithms',
  'author': 'Laskin et al. 2023'},
 {'title': 'LSH Forest: Self-Tuning Indexes for Similarity Search',
  'author': 'Marius Muja and David G. Lowe'},
 {'title': 'ANNOY: Approximate Nearest Neighbors Oh Yeah',
  'author': 'Erik Bernhardsson'},
 {'title': 'Efficient and Robust Approximate Nearest Neighbor Search using Hierarchical Navigable Small World Graphs',
  'author': 'Yu. A. Malkov a

# Tools and Routing

- 이 강의에서는 LangChain의 도구 개념을 소개하고, 언어 모델이 함수와 상호작용하는 방법에 대해 자세히 설명합니다.

<img src='./images/fig_05_01.png' width=800>

In [None]:
# import os
# import openai

# from dotenv import load_dotenv, find_dotenv
# _ = load_dotenv(find_dotenv()) # read local .env file
# openai.api_key = os.environ['OPENAI_API_KEY']

#### 도구 데코레이터 사용
1. **도구 데코레이터 소개**
    - `langchain` 패키지에서 `tool` 데코레이터를 가져와서 사용합니다.
    - 이 데코레이터는 함수를 LangChain 도구로 자동 변환합니다.

In [174]:
from langchain.agents import tool

In [175]:
@tool
def search(query: str) -> str:
    """Search for weather online"""
    return "42f"

In [176]:
search.name

'search'

In [178]:
search.description

'Search for weather online'

In [179]:
search.args

{'query': {'title': 'Query', 'type': 'string'}}

2. **입력 스키마 정의**
    - 명확한 입력 스키마를 정의하는 것이 중요합니다.
    - 언어 모델이 어떤 입력값을 사용해야 하는지 결정하는 데 도움을 줍니다.
    - Pydantic 모델을 사용하여 입력 스키마를 정의할 수 있습니다.

3. **도구 예시**
    - 예시 함수: 위도와 경도를 입력 받아 현재 온도를 반환하는 도구.
    - `openmedio` API를 사용하여 날씨 정보를 가져옵니다.
    - Pydantic 모델을 사용하여 입력 스키마를 정의하고, 도구 데코레이터를 사용하여 함수를 도구로 변환합니다.

4. **도구 설명**
    - 도구의 이름과 설명을 확인할 수 있습니다.
    - 함수 서명(signature) 및 docstring을 포함한 설명을 볼 수 있습니다.
    - OpenAI 함수 정의 형식으로 변환할 수 있습니다.


In [182]:
# from pydantic import BaseModel, Field
from langchain_core.pydantic_v1 import BaseModel, Field

class SearchInput(BaseModel):
    query: str = Field(description="Thing to search for")

In [183]:
@tool(args_schema=SearchInput)
def search(query: str) -> str:
    """Search for the weather online."""
    return "42f"

In [184]:
search.args

{'query': {'title': 'Query',
  'description': 'Thing to search for',
  'type': 'string'}}

In [185]:
search.run("sf")

'42f'

In [186]:
import requests
from langchain_core.pydantic_v1 import BaseModel, Field
import datetime

# Define the input schema
class OpenMeteoInput(BaseModel):
    latitude: float = Field(..., description="Latitude of the location to fetch weather data for")
    longitude: float = Field(..., description="Longitude of the location to fetch weather data for")

@tool(args_schema=OpenMeteoInput)
def get_current_temperature(latitude: float, longitude: float) -> dict:
    """Fetch current temperature for given coordinates."""
    
    BASE_URL = "https://api.open-meteo.com/v1/forecast"
    
    # Parameters for the request
    params = {
        'latitude': latitude,
        'longitude': longitude,
        'hourly': 'temperature_2m',
        'forecast_days': 1,
    }

    # Make the request
    response = requests.get(BASE_URL, params=params)
    
    if response.status_code == 200:
        results = response.json()
    else:
        raise Exception(f"API Request failed with status code: {response.status_code}")

    current_utc_time = datetime.datetime.utcnow()
    time_list = [datetime.datetime.fromisoformat(time_str.replace('Z', '+00:00')) for time_str in results['hourly']['time']]
    temperature_list = results['hourly']['temperature_2m']
    
    closest_time_index = min(range(len(time_list)), key=lambda i: abs(time_list[i] - current_utc_time))
    current_temperature = temperature_list[closest_time_index]
    
    return f'The current temperature is {current_temperature}°C'

In [188]:
get_current_temperature.name

'get_current_temperature'

In [189]:
get_current_temperature.description

'Fetch current temperature for given coordinates.'

In [190]:
get_current_temperature.args

{'latitude': {'title': 'Latitude',
  'description': 'Latitude of the location to fetch weather data for',
  'type': 'number'},
 'longitude': {'title': 'Longitude',
  'description': 'Longitude of the location to fetch weather data for',
  'type': 'number'}}

In [191]:
# from langchain.tools.render import format_tool_to_openai_function
from langchain_core.utils.function_calling import convert_to_openai_function

In [192]:
# format_tool_to_openai_function(get_current_temperature)
convert_to_openai_function(get_current_temperature)

{'name': 'get_current_temperature',
 'description': 'Fetch current temperature for given coordinates.',
 'parameters': {'type': 'object',
  'properties': {'latitude': {'description': 'Latitude of the location to fetch weather data for',
    'type': 'number'},
   'longitude': {'description': 'Longitude of the location to fetch weather data for',
    'type': 'number'}},
  'required': ['latitude', 'longitude']}}

In [193]:
get_current_temperature.invoke({"latitude": 13, "longitude": 14})

'The current temperature is 27.9°C'

In [194]:
import wikipedia

@tool
def search_wikipedia(query: str) -> str:
    """Run Wikipedia search and get page summaries."""
    page_titles = wikipedia.search(query)
    summaries = []
    for page_title in page_titles[: 3]:
        try:
            wiki_page =  wikipedia.page(title=page_title, auto_suggest=False)
            summaries.append(f"Page: {page_title}\nSummary: {wiki_page.summary}")
        except (
            self.wiki_client.exceptions.PageError,
            self.wiki_client.exceptions.DisambiguationError,
        ):
            pass
    if not summaries:
        return "No good Wikipedia Search Result was found"
    return "\n\n".join(summaries)

In [195]:
search_wikipedia.name

'search_wikipedia'

In [196]:
search_wikipedia.description

'Run Wikipedia search and get page summaries.'

In [197]:
convert_to_openai_function(search_wikipedia)

{'name': 'search_wikipedia',
 'description': 'Run Wikipedia search and get page summaries.',
 'parameters': {'type': 'object',
  'properties': {'query': {'type': 'string'}},
  'required': ['query']}}

In [198]:
search_wikipedia.invoke({"query": "langchain"})

"Page: LangChain\nSummary: LangChain is a framework designed to simplify the creation of applications using large language models (LLMs). As a language model integration framework, LangChain's use-cases largely overlap with those of language models in general, including document analysis and summarization, chatbots, and code analysis.\n\n\n\nPage: DataStax\nSummary: DataStax, Inc. is a real-time data for AI company based in Santa Clara, California. Its product Astra DB is a cloud database-as-a-service based on Apache Cassandra. DataStax also offers DataStax Enterprise (DSE), an on-premises database built on Apache Cassandra, and Astra Streaming, a messaging and event streaming cloud service based on Apache Pulsar. As of June 2022, the company has roughly 800 customers distributed in over 50 countries.\n\n\n\nPage: Sentence embedding\nSummary: In natural language processing, a sentence embedding refers to a numeric representation of a sentence in the form of a vector of real numbers whi

### Routing

In lesson 3, we show an example of function calling deciding between two candidate functions.

Given our tools above, let's format these as OpenAI functions and show this same behavior.


#### 언어 모델을 사용한 Route 선택
1. **언어 모델로 함수 호출 결정**
    - 언어 모델을 사용하여 어떤 함수를 호출할지 결정할 수 있습니다.
    - OpenAI 모델을 사용하여 함수 호출을 결정하고, 해당 함수를 호출하는 과정을 보여줍니다.

In [199]:
from langchain_openai import ChatOpenAI

In [48]:
functions = [
    convert_to_openai_function(f) for f in [
        search_wikipedia, get_current_temperature
    ]
]
model = ChatOpenAI(temperature=0).bind(functions=functions)

In [49]:
model.invoke("what is the weather in sf right now")

AIMessage(content='', additional_kwargs={'function_call': {'arguments': '{"latitude":37.7749,"longitude":-122.4194}', 'name': 'get_current_temperature'}}, response_metadata={'token_usage': {'completion_tokens': 25, 'prompt_tokens': 105, 'total_tokens': 130}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'function_call', 'logprobs': None}, id='run-bbbddc51-7ca4-4400-860e-441e20f86187-0', usage_metadata={'input_tokens': 105, 'output_tokens': 25, 'total_tokens': 130})

In [50]:
model.invoke("what is langchain")

AIMessage(content='', additional_kwargs={'function_call': {'arguments': '{"query":"Langchain"}', 'name': 'search_wikipedia'}}, response_metadata={'token_usage': {'completion_tokens': 16, 'prompt_tokens': 101, 'total_tokens': 117}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'function_call', 'logprobs': None}, id='run-cf5212ce-e902-4bd8-b825-3fb297b42e91-0', usage_metadata={'input_tokens': 101, 'output_tokens': 16, 'total_tokens': 117})

In [51]:
from langchain.prompts import ChatPromptTemplate
prompt = ChatPromptTemplate.from_messages([
    ("system", "You are helpful but sassy assistant"),
    ("user", "{input}"),
])
chain = prompt | model

In [52]:
chain.invoke({"input": "what is the weather in sf right now"})

AIMessage(content='', additional_kwargs={'function_call': {'arguments': '{"latitude":37.7749,"longitude":-122.4194}', 'name': 'get_current_temperature'}}, response_metadata={'token_usage': {'completion_tokens': 25, 'prompt_tokens': 113, 'total_tokens': 138}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'function_call', 'logprobs': None}, id='run-9fd63a06-1841-498c-874c-e72704c58ea8-0', usage_metadata={'input_tokens': 113, 'output_tokens': 25, 'total_tokens': 138})

#### 응답 파서 사용
1. **응답 파서 소개**
    - 응답 파서를 사용하여 언어 모델의 출력을 더 사용하기 쉽게 변환합니다.
    - 함수 호출 시나리오와 단순 응답 시나리오를 구분하여 처리합니다.

2. **출력 파서**
    - `OpenAIFunctionsAgentOutputParser`를 사용하여 출력값을 에이전트 액션 또는 에이전트 종료로 변환합니다.
    - 에이전트 액션: 함수 호출이 필요한 경우.
    - 에이전트 종료: 단순 응답인 경우.

In [54]:
from langchain.agents.output_parsers import OpenAIFunctionsAgentOutputParser

In [55]:
chain = prompt | model | OpenAIFunctionsAgentOutputParser()

In [64]:
result = chain.invoke({"input": "what is the weather in sf right now"})

In [65]:
type(result)

langchain_core.agents.AgentActionMessageLog

In [66]:
result.tool

'get_current_temperature'

In [67]:
result.tool_input

{'latitude': 37.7749, 'longitude': -122.4194}

In [68]:
get_current_temperature(result.tool_input)

'The current temperature is 19.0°C'

In [70]:
result = chain.invoke({"input": "hi!"})

In [71]:
type(result)

langchain_core.agents.AgentFinish

In [72]:
result.return_values

{'output': 'Well, hello there! How can I assist you today?'}


#### 라우팅 함수 추가
1. **라우팅 함수 정의**
    - 라우팅 함수를 정의하여 언어 모델의 결과에 따라 적절한 조치를 취합니다.
    - 에이전트 액션과 에이전트 종료를 구분하여 처리합니다.
    - 에이전트 액션인 경우, 적절한 도구를 찾아 실행합니다.
    - 에이전트 종료인 경우, 단순히 응답 값을 반환합니다.

2. **새로운 체인 생성**
    - 새로운 체인을 생성하여 프롬프트와 모델, 출력 파서, 라우팅 함수를 결합합니다.
    - 예시 입력에 따라 도구를 호출하거나 단순 응답을 반환합니다.

In [77]:
from langchain.schema.agent import AgentFinish
def route(result):
    if isinstance(result, AgentFinish):
        return result.return_values['output']
    else:
        tools = {
            "search_wikipedia": search_wikipedia, 
            "get_current_temperature": get_current_temperature,
        }
        return tools[result.tool].run(result.tool_input)

In [78]:
chain = prompt | model | OpenAIFunctionsAgentOutputParser() | route

In [79]:
result = chain.invoke({"input": "What is the weather in san francisco right now?"})

In [80]:
result

'The current temperature is 19.0°C'

In [81]:
result = chain.invoke({"input": "What is langchain?"})

In [82]:
result

"Page: LangChain\nSummary: LangChain is a framework designed to simplify the creation of applications using large language models (LLMs). As a language model integration framework, LangChain's use-cases largely overlap with those of language models in general, including document analysis and summarization, chatbots, and code analysis.\n\nPage: DataStax\nSummary: DataStax, Inc. is a real-time data for AI company based in Santa Clara, California. Its product Astra DB is a cloud database-as-a-service based on Apache Cassandra. DataStax also offers DataStax Enterprise (DSE), an on-premises database built on Apache Cassandra, and Astra Streaming, a messaging and event streaming cloud service based on Apache Pulsar. As of June 2022, the company has roughly 800 customers distributed in over 50 countries.\n\n\n\nPage: Sentence embedding\nSummary: In natural language processing, a sentence embedding refers to a numeric representation of a sentence in the form of a vector of real numbers which e

In [83]:
chain.invoke({"input": "hi!"})

'Well, hello there! How can I assist you today?'

### 요약
이 강의에서는 LangChain 도구의 개념과 사용자 정의 도구를 만드는 방법, OpenAPI 사양을 사용하는 방법, 언어 모델을 사용하여 함수 호출을 결정하는 방법 등을 다루었습니다. 

# Conversational agent

## 강의 소개 및 개요
- 이번 강의에서는 대화형 에이전트를 구축하는 방법을 학습합니다. 이는 도구 사용과 채팅 메모리를 결합하여 ChatGPT와 유사한 대화형 에이전트를 만드는 과정입니다.

<img src='./images/fig_06_01.png' width=600>


## 에이전트 기본 개념
- 에이전트는 언어 모델과 코드의 조합입니다. 언어 모델은 수행할 단계와 그 입력을 결정하고, 에이전트 루프는 도구를 선택하여 호출하고 결과를 관찰합니다. 이를 반복하여 특정 조건을 충족할 때까지 진행합니다.
- 에이전트 종료 조건: 언어 모델이 종료를 결정하거나 최대 반복 횟수 등의 규칙을 설정할 수 있습니다.

## 실습: 도구와 에이전트 루프 구현
- 이전 강의에서 구축한 도구를 사용하여 에이전트 루프를 작성합니다. 에이전트 루프는 입력을 받아 적절한 도구를 선택하고 호출한 후 결과를 반환합니다. 이를 반복하여 종료 조건이 충족될 때까지 진행합니다.
    - 모델 및 프롬프트 설정: 언어 모델과 프롬프트 템플릿을 설정하고, 도구 목록을 OpenAI 함수로 변환합니다.
    - 루프 생성: 도구를 선택하고 호출한 후 결과를 반환하는 루프를 생성합니다. 이를 위해 프롬프트에 메시지 목록을 추가하여 이전 도구 호출 내역과 결과를 저장합니다.

In [200]:
from langchain.tools import tool

In [201]:
import requests
from langchain_core.pydantic_v1 import BaseModel, Field
import datetime

# Define the input schema
class OpenMeteoInput(BaseModel):
    latitude: float = Field(..., description="Latitude of the location to fetch weather data for")
    longitude: float = Field(..., description="Longitude of the location to fetch weather data for")

@tool(args_schema=OpenMeteoInput)
def get_current_temperature(latitude: float, longitude: float) -> dict:
    """Fetch current temperature for given coordinates."""
    
    BASE_URL = "https://api.open-meteo.com/v1/forecast"
    
    # Parameters for the request
    params = {
        'latitude': latitude,
        'longitude': longitude,
        'hourly': 'temperature_2m',
        'forecast_days': 1,
    }

    # Make the request
    response = requests.get(BASE_URL, params=params)
    
    if response.status_code == 200:
        results = response.json()
    else:
        raise Exception(f"API Request failed with status code: {response.status_code}")

    current_utc_time = datetime.datetime.utcnow()
    time_list = [datetime.datetime.fromisoformat(time_str.replace('Z', '+00:00')) for time_str in results['hourly']['time']]
    temperature_list = results['hourly']['temperature_2m']
    
    closest_time_index = min(range(len(time_list)), key=lambda i: abs(time_list[i] - current_utc_time))
    current_temperature = temperature_list[closest_time_index]
    
    return f'The current temperature is {current_temperature}°C'

In [202]:
import wikipedia

@tool
def search_wikipedia(query: str) -> str:
    """Run Wikipedia search and get page summaries."""
    page_titles = wikipedia.search(query)
    summaries = []
    for page_title in page_titles[: 3]:
        try:
            wiki_page =  wikipedia.page(title=page_title, auto_suggest=False)
            summaries.append(f"Page: {page_title}\nSummary: {wiki_page.summary}")
        except (
            self.wiki_client.exceptions.PageError,
            self.wiki_client.exceptions.DisambiguationError,
        ):
            pass
    if not summaries:
        return "No good Wikipedia Search Result was found"
    return "\n\n".join(summaries)

In [203]:
tools = [get_current_temperature, search_wikipedia]

In [204]:
from langchain_openai import ChatOpenAI
from langchain.prompts import ChatPromptTemplate
from langchain_core.utils.function_calling import convert_to_openai_function
from langchain.agents.output_parsers import OpenAIFunctionsAgentOutputParser

In [205]:
functions = [convert_to_openai_function(f) for f in tools]
model = ChatOpenAI(temperature=0).bind(functions=functions)
prompt = ChatPromptTemplate.from_messages([
    ("system", "You are helpful but sassy assistant"),
    ("user", "{input}"),
])
chain = prompt | model | OpenAIFunctionsAgentOutputParser()

In [206]:
result = chain.invoke({"input": "what is the weather is sf?"})
result

AgentActionMessageLog(tool='get_current_temperature', tool_input={'latitude': 37.7749, 'longitude': -122.4194}, log="\nInvoking: `get_current_temperature` with `{'latitude': 37.7749, 'longitude': -122.4194}`\n\n\n", message_log=[AIMessage(content='', additional_kwargs={'function_call': {'arguments': '{"latitude":37.7749,"longitude":-122.4194}', 'name': 'get_current_temperature'}}, response_metadata={'token_usage': {'completion_tokens': 25, 'prompt_tokens': 112, 'total_tokens': 137}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'function_call', 'logprobs': None}, id='run-1cfdbb80-dc1b-44c0-ab80-2134ec90664b-0', usage_metadata={'input_tokens': 112, 'output_tokens': 25, 'total_tokens': 137})])

In [207]:
result.tool

'get_current_temperature'

In [208]:
result.tool_input

{'latitude': 37.7749, 'longitude': -122.4194}

In [209]:
from langchain.prompts import MessagesPlaceholder
prompt = ChatPromptTemplate.from_messages([
    ("system", "You are helpful but sassy assistant"),
    ("user", "{input}"),
    MessagesPlaceholder(variable_name="agent_scratchpad")
])

In [210]:
chain = prompt | model | OpenAIFunctionsAgentOutputParser()

In [211]:
result1 = chain.invoke({
    "input": "what is the weather is sf?",
    "agent_scratchpad": []
})

In [212]:
result1

AgentActionMessageLog(tool='get_current_temperature', tool_input={'latitude': 37.7749, 'longitude': -122.4194}, log="\nInvoking: `get_current_temperature` with `{'latitude': 37.7749, 'longitude': -122.4194}`\n\n\n", message_log=[AIMessage(content='', additional_kwargs={'function_call': {'arguments': '{"latitude":37.7749,"longitude":-122.4194}', 'name': 'get_current_temperature'}}, response_metadata={'token_usage': {'completion_tokens': 25, 'prompt_tokens': 112, 'total_tokens': 137}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'function_call', 'logprobs': None}, id='run-9a73bd95-54cb-4de4-90e3-f1ee4e5125d2-0', usage_metadata={'input_tokens': 112, 'output_tokens': 25, 'total_tokens': 137})])

In [213]:
result1.tool

'get_current_temperature'

In [214]:
result1.tool_input

{'latitude': 37.7749, 'longitude': -122.4194}

In [215]:
observation = get_current_temperature.invoke(result1.tool_input)
observation

'The current temperature is 17.0°C'

In [216]:
type(result1)

langchain_core.agents.AgentActionMessageLog

- (AgentAction, tool output) 튜플을 FunctionMessage로 변환합니다.

In [217]:
from langchain.agents.format_scratchpad import format_to_openai_functions

In [218]:
result1.message_log

[AIMessage(content='', additional_kwargs={'function_call': {'arguments': '{"latitude":37.7749,"longitude":-122.4194}', 'name': 'get_current_temperature'}}, response_metadata={'token_usage': {'completion_tokens': 25, 'prompt_tokens': 112, 'total_tokens': 137}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'function_call', 'logprobs': None}, id='run-9a73bd95-54cb-4de4-90e3-f1ee4e5125d2-0', usage_metadata={'input_tokens': 112, 'output_tokens': 25, 'total_tokens': 137})]

In [219]:
format_to_openai_functions([(result1, observation), ])

[AIMessage(content='', additional_kwargs={'function_call': {'arguments': '{"latitude":37.7749,"longitude":-122.4194}', 'name': 'get_current_temperature'}}, response_metadata={'token_usage': {'completion_tokens': 25, 'prompt_tokens': 112, 'total_tokens': 137}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'function_call', 'logprobs': None}, id='run-9a73bd95-54cb-4de4-90e3-f1ee4e5125d2-0', usage_metadata={'input_tokens': 112, 'output_tokens': 25, 'total_tokens': 137}),
 FunctionMessage(content='The current temperature is 17.0°C', name='get_current_temperature')]

In [220]:
result2 = chain.invoke({
    "input": "what is the weather is sf?", 
    "agent_scratchpad": format_to_openai_functions([(result1, observation)])
})

In [222]:
result2

AgentFinish(return_values={'output': 'The current temperature in San Francisco is 17.0°C.'}, log='The current temperature in San Francisco is 17.0°C.')

## 에이전트 실행 함수 작성
- 에이전트를 실행하는 함수 run_agent를 작성합니다. 이 함수는 사용자 입력을 받아 에이전트 루프를 실행하고, 종료 조건이 충족될 때까지 반복합니다.
    - 에이전트 체인 생성: agent_chain을 생성하여 입력과 중간 결과를 받아 에이전트 스크래치패드를 생성하고, 이를 모델과 파서에 전달합니다.
    - 루프 간소화: 에이전트 체인을 직접 호출하여 입력과 중간 결과를 처리하는 간단한 루프를 작성합니다.

In [223]:
from langchain.schema.agent import AgentFinish
def run_agent(user_input):
    intermediate_steps = []
    while True:
        result = chain.invoke({
            "input": user_input, 
            "agent_scratchpad": format_to_openai_functions(intermediate_steps)
        })
        if isinstance(result, AgentFinish):
            return result
        tool = {
            "search_wikipedia": search_wikipedia, 
            "get_current_temperature": get_current_temperature,
        }[result.tool]
        observation = tool.run(result.tool_input)
        intermediate_steps.append((result, observation))

In [224]:
from langchain.schema.runnable import RunnablePassthrough
agent_chain = RunnablePassthrough.assign(
    agent_scratchpad= lambda x: format_to_openai_functions(x["intermediate_steps"])
) | chain

In [225]:
def run_agent(user_input):
    intermediate_steps = []
    while True:
        result = agent_chain.invoke({
            "input": user_input, 
            "intermediate_steps": intermediate_steps
        })
        if isinstance(result, AgentFinish):
            return result
        tool = {
            "search_wikipedia": search_wikipedia, 
            "get_current_temperature": get_current_temperature,
        }[result.tool]
        observation = tool.run(result.tool_input)
        intermediate_steps.append((result, observation))

In [226]:
run_agent("what is the weather is sf?")

AgentFinish(return_values={'output': 'The current temperature in San Francisco is 17.0°C.'}, log='The current temperature in San Francisco is 17.0°C.')

In [227]:
run_agent("what is langchain?")

AgentFinish(return_values={'output': 'LangChain is a framework designed to simplify the creation of applications using large language models (LLMs). It is a language model integration framework with use-cases including document analysis and summarization, chatbots, and code analysis.'}, log='LangChain is a framework designed to simplify the creation of applications using large language models (LLMs). It is a language model integration framework with use-cases including document analysis and summarization, chatbots, and code analysis.')

In [228]:
run_agent("hi!")

AgentFinish(return_values={'output': 'Well, hello there! How can I assist you today?'}, log='Well, hello there! How can I assist you today?')

In [229]:
from langchain.agents import AgentExecutor
agent_executor = AgentExecutor(agent=agent_chain, tools=tools, verbose=True)

In [230]:
agent_executor.invoke({"input": "what is langchain?"})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `search_wikipedia` with `{'query': 'Langchain'}`


[0m[33;1m[1;3mPage: LangChain
Summary: LangChain is a framework designed to simplify the creation of applications using large language models (LLMs). As a language model integration framework, LangChain's use-cases largely overlap with those of language models in general, including document analysis and summarization, chatbots, and code analysis.



Page: DataStax
Summary: DataStax, Inc. is a real-time data for AI company based in Santa Clara, California. Its product Astra DB is a cloud database-as-a-service based on Apache Cassandra. DataStax also offers DataStax Enterprise (DSE), an on-premises database built on Apache Cassandra, and Astra Streaming, a messaging and event streaming cloud service based on Apache Pulsar. As of June 2022, the company has roughly 800 customers distributed in over 50 countries.



Page: Sentence embedding
Summary: In natural langua

{'input': 'what is langchain?',
 'output': 'LangChain is a framework designed to simplify the creation of applications using large language models (LLMs). It is a language model integration framework with use-cases including document analysis and summarization, chatbots, and code analysis.'}

In [32]:
agent_executor.invoke({"input": "my name is bob"})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mNice to meet you, Bob! How can I assist you today?[0m

[1m> Finished chain.[0m


{'input': 'my name is bob',
 'output': 'Nice to meet you, Bob! How can I assist you today?'}

In [33]:
agent_executor.invoke({"input": "what is my name"})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mI'm sorry, I don't have access to your personal information. How can I assist you today?[0m

[1m> Finished chain.[0m


{'input': 'what is my name',
 'output': "I'm sorry, I don't have access to your personal information. How can I assist you today?"}

## 메모리 기능 추가
- 에이전트가 이전 대화를 기억할 수 있도록 메모리 기능을 추가합니다. 이를 통해 사용자와의 대화를 유지하고, 이전 메시지를 참조할 수 있습니다.
    - 메시지 플레이스홀더 추가: 프롬프트에 채팅 기록을 위한 메시지 플레이스홀더를 추가합니다.
    - 메모리 객체 설정: 메시지를 메모리에 저장하고 이를 에이전트 체인에 전달하여 대화 기록을 유지합니다.

In [231]:
prompt = ChatPromptTemplate.from_messages([
    ("system", "You are helpful but sassy assistant"),
    MessagesPlaceholder(variable_name="chat_history"),
    ("user", "{input}"),
    MessagesPlaceholder(variable_name="agent_scratchpad")
])

In [232]:
agent_chain = RunnablePassthrough.assign(
    agent_scratchpad= lambda x: format_to_openai_functions(x["intermediate_steps"])
) | prompt | model | OpenAIFunctionsAgentOutputParser()

In [233]:
from langchain.memory import ConversationBufferMemory
memory = ConversationBufferMemory(return_messages=True,memory_key="chat_history")

In [234]:
agent_executor = AgentExecutor(agent=agent_chain, tools=tools, verbose=True, memory=memory)

In [235]:
agent_executor.invoke({"input": "my name is bob"})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mNice to meet you, Bob! How can I assist you today?[0m

[1m> Finished chain.[0m


{'input': 'my name is bob',
 'chat_history': [HumanMessage(content='my name is bob'),
  AIMessage(content='Nice to meet you, Bob! How can I assist you today?')],
 'output': 'Nice to meet you, Bob! How can I assist you today?'}

In [236]:
agent_executor.invoke({"input": "whats my name"})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mYour name is Bob.[0m

[1m> Finished chain.[0m


{'input': 'whats my name',
 'chat_history': [HumanMessage(content='my name is bob'),
  AIMessage(content='Nice to meet you, Bob! How can I assist you today?'),
  HumanMessage(content='whats my name'),
  AIMessage(content='Your name is Bob.')],
 'output': 'Your name is Bob.'}

In [40]:
agent_executor.invoke({"input": "whats the weather in sf?"})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `get_current_temperature` with `{'latitude': 37.7749, 'longitude': -122.4194}`
responded: I can help you with that. Just give me a moment to fetch the current weather in San Francisco.

[0m[36;1m[1;3mThe current temperature is 10.9°C[0m[32;1m[1;3mThe current temperature in San Francisco is 10.9°C.[0m

[1m> Finished chain.[0m


{'input': 'whats the weather in sf?',
 'chat_history': [HumanMessage(content='my name is bob'),
  AIMessage(content='Nice to meet you, Bob! How can I assist you today?'),
  HumanMessage(content='whats my name'),
  AIMessage(content='Your name is Bob.'),
  HumanMessage(content='whats the weather in sf?'),
  AIMessage(content='The current temperature in San Francisco is 10.9°C.')],
 'output': 'The current temperature in San Francisco is 10.9°C.'}