# OpenAI API 및 LangChain 사용하기

## OpenAI API

In [1]:
%pip install openai

Note: you may need to restart the kernel to use updated packages.


In [3]:
import os

os.environ["OPENAI_API_KEY"] = "" # 환경변수에 OPENAI_API_KEY를 설정합니다.

### Text Completion 예제

기본적인 텍스트 생성 예제입니다.

In [5]:
import openai

openai.api_key = os.getenv("OPENAI_API_KEY") # 환경변수에서 OPENAI_API_KEY를 가져와 openai.api_key에 할당합니다.

response = openai.Completion.create(
  model="text-davinci-003", # 사용할 AI 모델을 지정합니다. 여기서는 "text-davinci-003" 모델을 사용하였습니다.
  prompt="안녕? 넌 누구니?", # AI 모델에게 전달할 프롬프트를 지정합니다.
  max_tokens=256, # 생성될 텍스트의 최대 토큰 수를 지정합니다. 여기서는 256개의 토큰을 지정하였습니다.
  temperature=0 # 출력의 다양성을 조절합니다. 값이 0이면 가장 확률이 높은 텍스트를 생성하고, 값이 1에 가까울수록 더 다양한 텍스트를 생성합니다.
)

In [6]:
print(response)

{
  "choices": [
    {
      "finish_reason": "stop",
      "index": 0,
      "logprobs": null,
      "text": "\n\n\uc548\ub155\ud558\uc138\uc694. \ub098\ub294 \ud64d\uae38\ub3d9\uc774\uc5d0\uc694."
    }
  ],
  "created": 1685717462,
  "id": "cmpl-7N0PGYOflVLhSFt451lHa9mGBkbfu",
  "model": "text-davinci-003",
  "object": "text_completion",
  "usage": {
    "completion_tokens": 42,
    "prompt_tokens": 19,
    "total_tokens": 61
  }
}


In [7]:
print(response.choices[0].text)



안녕하세요. 나는 홍길동이에요.


### Chat Completion 예제

In [18]:
example_messages = [
    {
        "role": "user",
        "content": "안녕? 넌 누구니?",
    },
]

response = openai.ChatCompletion.create(
  model="gpt-3.5-turbo", # 사용할 AI 모델을 지정합니다. 여기서는 "text-davinci-003" 모델을 사용하였습니다.
  messages=example_messages, # AI 모델에게 전달할 프롬프트를 지정합니다.
  max_tokens=256, # 생성될 텍스트의 최대 토큰 수를 지정합니다. 여기서는 256개의 토큰을 지정하였습니다.
  temperature=0 # 출력의 다양성을 조절합니다. 값이 0이면 가장 확률이 높은 텍스트를 생성하고, 값이 1에 가까울수록 더 다양한 텍스트를 생성합니다.
)

In [19]:
print(response)

{
  "choices": [
    {
      "finish_reason": "stop",
      "index": 0,
      "message": {
        "content": "\uc548\ub155\ud558\uc138\uc694! \uc800\ub294 OpenAI\uc758 \uc778\uacf5\uc9c0\ub2a5 \uc5b4\uc2dc\uc2a4\ud134\ud2b8\uc785\ub2c8\ub2e4. \ubb34\uc5c7\uc744 \ub3c4\uc640\ub4dc\ub9b4\uae4c\uc694?",
        "role": "assistant"
      }
    }
  ],
  "created": 1685719130,
  "id": "chatcmpl-7N0qAhpv5bWgayjZIBTkWhtdkH1Op",
  "model": "gpt-3.5-turbo-0301",
  "object": "chat.completion",
  "usage": {
    "completion_tokens": 39,
    "prompt_tokens": 21,
    "total_tokens": 60
  }
}


In [20]:
print(response.choices[0].message.content)

안녕하세요! 저는 OpenAI의 인공지능 어시스턴트입니다. 무엇을 도와드릴까요?


#### role을 지정하여 대화하기

role 종류
- system: 시스템의 목적을 정의할 때 사용
- assistant: assistant의 응답 메시지를 저장하는데 사용
- user: 사용자의 입력을 넘길 때 사용




In [106]:
example_messages = [
    {
        "role": "system",
        "content": "You are a helpful assistant that like google assistant or siri."
    },
    {
        "role": "user",
        "content": "안녕? 넌 누구니?",
    },
]

In [117]:
response = openai.ChatCompletion.create(
  model="gpt-3.5-turbo", # 사용할 AI 모델을 지정합니다. 여기서는 "text-davinci-003" 모델을 사용하였습니다.
  messages=example_messages, # AI 모델에게 전달할 프롬프트를 지정합니다.
  max_tokens=256, # 생성될 텍스트의 최대 토큰 수를 지정합니다. 여기서는 256개의 토큰을 지정하였습니다.
  temperature=0 # 출력의 다양성을 조절합니다. 값이 0이면 가장 확률이 높은 텍스트를 생성하고, 값이 1에 가까울수록 더 다양한 텍스트를 생성합니다.
)

response_message_1 = response.choices[0].message.content
print(response_message_1)

안녕하세요! 저는 인공지능 기반의 개인 비서로, 여러분의 질문에 대답하고 도움을 드리기 위해 만들어졌습니다. 무엇을 도와드릴까요?


#### 대화를 이어나가기

이전에 받은 대화를 assistant의 입력으로 사용하여 대화를 이어나갈 수 있습니다.

In [123]:
next_messages = [
    {
        "role": "assistant",
        "content": response_message_1,
    },
    {
        "role": "user",
        "content": "2020년 올림픽은 개최국은 어디야?",
    },
]

new_messages = example_messages.copy()
new_messages.extend(next_messages)
from pprint import pprint
pprint(new_messages)

[{'content': 'You are a helpful assistant that like google assistant or siri.',
  'role': 'system'},
 {'content': '안녕? 넌 누구니?', 'role': 'user'},
 {'content': '안녕하세요! 저는 인공지능 기반의 개인 비서로, 여러분의 질문에 대답하고 도움을 드리기 위해 만들어졌습니다. 무엇을 '
             '도와드릴까요?',
  'role': 'assistant'},
 {'content': '2020년 올림픽은 개최국은 어디야?', 'role': 'user'}]


In [120]:
response = openai.ChatCompletion.create(
  model="gpt-3.5-turbo", # 사용할 AI 모델을 지정합니다. 여기서는 "text-davinci-003" 모델을 사용하였습니다.
  messages=new_messages, # AI 모델에게 전달할 프롬프트를 지정합니다.
  max_tokens=256, # 생성될 텍스트의 최대 토큰 수를 지정합니다. 여기서는 256개의 토큰을 지정하였습니다.
  temperature=0 # 출력의 다양성을 조절합니다. 값이 0이면 가장 확률이 높은 텍스트를 생성하고, 값이 1에 가까울수록 더 다양한 텍스트를 생성합니다.
)
response_message_2 = response.choices[0].message.content
print(response_message_2)

2020년 올림픽은 일본의 도쿄에서 개최됩니다.


#### 대화의 맥락을 유지하는지 확인하기

이전 대화 맥락을 고려하여 답변을 하고 있는지 확인하기 위해 짧은 입력만 주고 대답을 받아봅니다.

In [124]:
next_messages = [
    {
        "role": "assistant",
        "content": response_message_2,
    },
    {
        "role": "user",
        "content": "언제 열려?",
    },
]

new_messages.extend(next_messages)
pprint(new_messages)

[{'content': 'You are a helpful assistant that like google assistant or siri.',
  'role': 'system'},
 {'content': '안녕? 넌 누구니?', 'role': 'user'},
 {'content': '안녕하세요! 저는 인공지능 기반의 개인 비서로, 여러분의 질문에 대답하고 도움을 드리기 위해 만들어졌습니다. 무엇을 '
             '도와드릴까요?',
  'role': 'assistant'},
 {'content': '2020년 올림픽은 개최국은 어디야?', 'role': 'user'},
 {'content': '2020년 올림픽은 일본의 도쿄에서 개최됩니다.', 'role': 'assistant'},
 {'content': '언제 열려?', 'role': 'user'}]


In [125]:
response = openai.ChatCompletion.create(
  model="gpt-3.5-turbo", # 사용할 AI 모델을 지정합니다. 여기서는 "text-davinci-003" 모델을 사용하였습니다.
  messages=new_messages, # AI 모델에게 전달할 프롬프트를 지정합니다.
  max_tokens=256, # 생성될 텍스트의 최대 토큰 수를 지정합니다. 여기서는 256개의 토큰을 지정하였습니다.
  temperature=0 # 출력의 다양성을 조절합니다. 값이 0이면 가장 확률이 높은 텍스트를 생성하고, 값이 1에 가까울수록 더 다양한 텍스트를 생성합니다.
)
response_message_3 = response.choices[0].message.content
print(response_message_3)

2020년 도쿄 올림픽은 2021년 7월 23일부터 8월 8일까지 열릴 예정입니다.


## LangChain

In [49]:
%pip install langchain

Note: you may need to restart the kernel to use updated packages.


### Chat 모델 사용하기

In [4]:
from langchain.chat_models import ChatOpenAI
from langchain.schema import (
    AIMessage,
    HumanMessage,
    SystemMessage
)

chat_llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0.0)

#### 단순 대화하기

메시지는 HumanMessage를 이용해 생성합니다. 이 메시지를 chat_llm에 전달하면 AI 모델이 답변을 생성합니다.
OpenAI API를 직접 사용하는 것과 마찬가지로, 질의를 보낼 때마다 새로운 세션으로 동작합니다.

In [129]:
result = chat_llm([HumanMessage(content="안녕? 넌 누구니?")])
print(result.content)
result_content_1 = result.content

안녕하세요! 저는 OpenAI의 인공지능 어시스턴트입니다. 무엇을 도와드릴까요?


In [131]:
result = chat_llm([HumanMessage(content="2020년 서울의 인구를 알려줘")])
print(result.content)
result_content_2 = result.content

2020년 서울의 인구는 약 9,736,962명입니다.


In [132]:
result = chat_llm([HumanMessage(content="그럼 부산은?")])
print(result.content)
result_content_3 = result.content

부산은 대한민국의 도시 중 하나로, 경제, 문화, 교통 등 다양한 측면에서 중요한 역할을 합니다. 부산은 대한민국의 대표적인 항구 도시로서, 국내외 무역과 관광 산업 등에 큰 기여를 하고 있습니다. 또한 부산은 해운대, 광안리, 송정 등의 해변과 부산타워, 용두산 등의 관광 명소가 많아 관광객들에게 인기 있는 도시입니다.


#### 대화의 이력을 통해 대화하기

위와 동일한 대화를 보내 맥락을 잘 유지하고 답변을 하는지 확인합니다.

In [133]:
chat_messages = [
    SystemMessage(content="You are a helpful assistant that like google assistant or siri."),
    HumanMessage(content="안녕? 넌 누구니?"),
    AIMessage(content=result_content_1),
    HumanMessage(content="2020년 서울의 인구를 알려줘"),
    AIMessage(content=result_content_2),
    HumanMessage(content="그럼 부산은?"),
    AIMessage(content=result_content_3),
]

In [134]:
result = chat_llm(chat_messages)
print(result.content)

하지만, 제가 말씀드리고자 하는 것은 부산의 인구입니다. 2020년 기준 부산의 인구는 약 3,367,957명입니다.


### 토큰 수 확인하기

In [138]:
chat_llm.get_num_tokens('안녕? 넌 누구니?')

13

In [137]:
chat_llm.get_num_tokens_from_messages(chat_messages)

305

### Batch 단위로 메시지 보내기

In [4]:
batch_messages = [
    [
        SystemMessage(content="You are a helpful assistant that like google assistant or siri."),
        HumanMessage(content="2020년 서울의 인구를 알려줘")
    ],
    [
        SystemMessage(content="You are a helpful assistant that like google assistant or siri."),
        HumanMessage(content="그럼 부산은?")
    ]
]

In [5]:
result = chat_llm.generate(batch_messages)

print(result)

generations=[[ChatGeneration(text='2020년 12월 31일 기준으로 서울특별시의 총 인구는 약 9,736,962명입니다.', generation_info=None, message=AIMessage(content='2020년 12월 31일 기준으로 서울특별시의 총 인구는 약 9,736,962명입니다.', additional_kwargs={}, example=False))], [ChatGeneration(text='부산은 대한민국의 도시 중 하나로, 경상남도에 위치해 있습니다. 부산은 대한민국에서 가장 큰 항구도시이며, 경제적으로 중요한 역할을 합니다. 또한, 부산은 해변과 산이 어우러져 자연경관이 아름다운 도시로도 유명합니다.', generation_info=None, message=AIMessage(content='부산은 대한민국의 도시 중 하나로, 경상남도에 위치해 있습니다. 부산은 대한민국에서 가장 큰 항구도시이며, 경제적으로 중요한 역할을 합니다. 또한, 부산은 해변과 산이 어우러져 자연경관이 아름다운 도시로도 유명합니다.', additional_kwargs={}, example=False))]] llm_output={'token_usage': {'prompt_tokens': 76, 'completion_tokens': 149, 'total_tokens': 225}, 'model_name': 'gpt-3.5-turbo'}


##### 생성 결과를 출력

In [14]:
for idx, generation in enumerate(result.generations):
    print(f'batch index: {idx}, response message: {generation[0].text}')


batch index: 0, response message: 2020년 12월 31일 기준으로 서울특별시의 총 인구는 약 9,736,962명입니다.
batch index: 1, response message: 부산은 대한민국의 도시 중 하나로, 경상남도에 위치해 있습니다. 부산은 대한민국에서 가장 큰 항구도시이며, 경제적으로 중요한 역할을 합니다. 또한, 부산은 해변과 산이 어우러져 자연경관이 아름다운 도시로도 유명합니다.


##### 토큰 사용량 출력

In [15]:
print(result.llm_output)

{'token_usage': {'prompt_tokens': 76, 'completion_tokens': 149, 'total_tokens': 225}, 'model_name': 'gpt-3.5-turbo'}


### 스트리밍 요청

In [14]:
from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler

chat = ChatOpenAI(streaming=True, callbacks=[StreamingStdOutCallbackHandler()], temperature=0)
resp = chat([HumanMessage(content="Write me a song about sparkling water.")])

Verse 1:
Bubbles rising to the top
A refreshing drink that never stops
Clear and crisp, it's oh so pure
Sparkling water, I can't ignore

Chorus:
Sparkling water, oh how you shine
A taste so clean, it's simply divine
You quench my thirst, you make me feel alive
Sparkling water, you're my favorite vibe

Verse 2:
No sugar, no calories, just H2O
A drink that's good for me, don't you know
With lemon or lime, it's even better
Sparkling water, you're my forever

Chorus:
Sparkling water, oh how you shine
A taste so clean, it's simply divine
You quench my thirst, you make me feel alive
Sparkling water, you're my favorite vibe

Bridge:
I'll never get tired of your effervescence
You're the perfect drink for any occasion
Whether I'm at home or out on the town
Sparkling water, you never let me down

Chorus:
Sparkling water, oh how you shine
A taste so clean, it's simply divine
You quench my thirst, you make me feel alive
Sparkling water, you're my favorite vibe

Outro:
Sparkling water, you're the o

### Chat Prompt Template 사용하기

In [17]:
from langchain.prompts.chat import (
    ChatPromptTemplate,
    SystemMessagePromptTemplate,
    HumanMessagePromptTemplate,
)

from langchain.chat_models import ChatOpenAI

chat_llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0.0)

In [28]:
template = "You are a helpful assistant that translates {input_language} to {output_language}."
system_message_prompt = SystemMessagePromptTemplate.from_template(template)

human_template = "{text}"
human_message_prompt = HumanMessagePromptTemplate.from_template(human_template)

chat_prompt = ChatPromptTemplate.from_messages([system_message_prompt, human_message_prompt])

# get a chat completion from the formatted messages
response = chat_llm(chat_prompt.format_prompt(input_language="English", output_language="Korean", text="I love programming.").to_messages())

In [34]:
print([response])  # 객체를 출력하기 위해 리스트 형태로 감쌈
print('content:', response.content)

[AIMessage(content='저는 프로그래밍을 좋아합니다.', additional_kwargs={}, example=False)]
content: 저는 프로그래밍을 좋아합니다.


### Chain 사용하기

#### LLM과 prompt 템플릿를 함께 사용하기

위와 동일한 대화를 `LLMChain`를 이용해 생성합니다. `PromptTemplate` 객체를 `to_messages()`로 변환하는 과정이 필요 없이 바로 `LLMChain`에 넘기면 됩니다. 응답 결과는 객체가 아닌 텍스트인 부분이 다릅니다.

In [46]:
from langchain import LLMChain

llm_chain = LLMChain(llm=chat_llm, prompt=chat_prompt)
response = llm_chain.run(input_language="English", output_language="Korean", text="I love programming.")

In [47]:
print(response)

저는 프로그래밍을 좋아합니다.


#### 수학 계산용 체인 - LLMMathChain

In [50]:
from langchain import LLMMathChain

math_chain = LLMMathChain.from_llm(llm=chat_llm, verbose=True)

math_chain.run("What is 2 raised to the 10 power?")



[1m> Entering new LLMMathChain chain...[0m
What is 2 raised to the 10 power?[32;1m[1;3m```text
2**10
```
...numexpr.evaluate("2**10")...
[0m
Answer: [33;1m[1;3m1024[0m
[1m> Finished chain.[0m


'Answer: 1024'

#### 대화용 체인 - ConversationChain

대화용 체인은 local memory 객체에 대화의 이력을 저장하고 관리한다. 이전에 수동으로 이력을 관리하던 방식과 달리, 이력을 관리하는 부분을 자동으로 처리한다.

In [7]:
from langchain import ConversationChain

conversation_chain = ConversationChain(llm=chat_llm, verbose=True)
conversation_chain.predict(input="안녕? 넌 누구니?")



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:

Human: 안녕? 넌 누구니?
AI:[0m

[1m> Finished chain.[0m


'안녕하세요! 저는 인공지능입니다. 제 이름은 OpenAI GPT-3입니다. 저는 대화를 하고, 질문에 답하며, 정보를 제공하는 데에 사용됩니다. 무엇을 도와드릴까요?'

In [8]:
conversation_chain.predict(input="2020년 서울의 인구를 알려줘")



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:
Human: 안녕? 넌 누구니?
AI: 안녕하세요! 저는 인공지능입니다. 제 이름은 OpenAI GPT-3입니다. 저는 대화를 하고, 질문에 답하며, 정보를 제공하는 데에 사용됩니다. 무엇을 도와드릴까요?
Human: 2020년 서울의 인구를 알려줘
AI:[0m

[1m> Finished chain.[0m


'2020년 서울의 인구는 약 9,736,962명입니다. 이는 2019년 대비 약 0.2% 증가한 수치입니다. 서울은 대한민국의 수도이며, 인구 밀도가 매우 높은 도시 중 하나입니다. 서울은 경제, 문화, 교육 등 다양한 분야에서 중요한 역할을 합니다.'

In [9]:
conversation_chain.predict(input="그럼 부산은?")



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:
Human: 안녕? 넌 누구니?
AI: 안녕하세요! 저는 인공지능입니다. 제 이름은 OpenAI GPT-3입니다. 저는 대화를 하고, 질문에 답하며, 정보를 제공하는 데에 사용됩니다. 무엇을 도와드릴까요?
Human: 2020년 서울의 인구를 알려줘
AI: 2020년 서울의 인구는 약 9,736,962명입니다. 이는 2019년 대비 약 0.2% 증가한 수치입니다. 서울은 대한민국의 수도이며, 인구 밀도가 매우 높은 도시 중 하나입니다. 서울은 경제, 문화, 교육 등 다양한 분야에서 중요한 역할을 합니다.
Human: 그럼 부산은?
AI:[0m

[1m> Finished chain.[0m


'2020년 부산의 인구는 약 3,398,361명입니다. 이는 2019년 대비 약 0.1% 감소한 수치입니다. 부산은 대한민국의 대표적인 항구도시이며, 경제적으로 중요한 역할을 합니다. 또한 부산은 해운대, 광안리 등의 해변과 부산타워, 용두산 등의 관광지로도 유명합니다.'

### Few shot 에제

HumanMessage와 AIMessage를 이용해 대화를 반복하여 incontext learning을 위한 예시를 넘길 수 있습니다.

In [19]:
from langchain import LLMChain
from langchain.prompts.chat import (
    ChatPromptTemplate,
    SystemMessagePromptTemplate,
    AIMessagePromptTemplate,
    HumanMessagePromptTemplate,
)

In [20]:
template = "You are a helpful assistant that translates english to pirate."
system_message_prompt = SystemMessagePromptTemplate.from_template(template)
example_human = HumanMessagePromptTemplate.from_template("Hi")
example_ai = AIMessagePromptTemplate.from_template("Argh me mateys")
human_template="{text}"
human_message_prompt = HumanMessagePromptTemplate.from_template(human_template)

In [23]:
chat_prompt = ChatPromptTemplate.from_messages([system_message_prompt, example_human, example_ai, human_message_prompt])
chain = LLMChain(llm=chat_llm, prompt=chat_prompt)
# get a chat completion from the formatted messages
chain.run(text="I love programming.")

"I be lovin' programmin', me hearty!"