### How to chat with GPT using OpenAI API

In [1]:
import os
import openai
from retrying import retry
print ("openai version:[%s]"%(openai.__version__))

openai version:[0.27.8]


### Locate where your key is

In [2]:
key_path = '../key/rilab_key.txt'
print ('key_path:[%s]'%(key_path))

key_path:[../key/rilab_key.txt]


### Use key

In [3]:
with open(key_path, 'r') as f: OPENAI_API_KEY = f.read()
openai.api_key = OPENAI_API_KEY

### Query function

In [4]:
@retry(stop_max_attempt_number=5,
       wait_exponential_multiplier=1000,
       wait_exponential_max=10000)
def query_gpt(messages:list,gpt_model='gpt-4'):
    """
        gpt_model: 'gpt-3.5-turbo' / 'gpt-4'
    """
    # Call the OpenAI API
    response     = openai.ChatCompletion.create(
        model    = gpt_model, 
        messages = messages
    )
    # Extract the response content and status code
    content     = response["choices"][0]["message"]["content"]
    status_code = response["choices"][0]["finish_reason"]
    return content,status_code,response
print ("Ready.")

Ready.


`messages`, an input to GPT, is basically a list where each item is a dictionary consists of `role` and `content`. A `role` can either be
* `system`: which defines the identity of the agent
* `user`: which states the input of a user
* `assistant`: which stores messages previously generated by the agents
More information can be found in [here](https://platform.openai.com/docs/guides/gpt/chat-completions-api).

In [5]:
role_msg = """너는 한국어로 대화에 능통한 언어모델이야"""
question = "LLM(Large Language Model)은 어떻게 작동하는지 설명해줘"
messages = [{"role": "system", "content": f'{role_msg}'},
            {"role": 'user', "content": f'{question}'}]
print (messages)

[{'role': 'system', 'content': '너는 한국어로 대화에 능통한 언어모델이야'}, {'role': 'user', 'content': 'LLM(Large Language Model)은 어떻게 작동하는지 설명해줘'}]


### Now let's use `GPT`

In [6]:
content,status_code,response = query_gpt(messages=messages)

In [7]:
print (content)

LLM(Large Language Model)은 인공지능이 자연어 처리를 학습하는 방법 중 하나입니다. 이는 인간이 소통에 사용하는 언어를 이해하고 생성하는 모델을 구현하는 기술입니다.

작동 원리를 간단하게 설명하자면, LLM은 대규모의 텍스트 더미를 통해 학습하는데, 일종의 통계적 패턴 인식 방법을 사용합니다. 모델은 이전에 본 수많은 문장들을 기반으로 다음에 올 단어나 문장을 예측하려고 합니다. 

예를 들면, "나는 오늘 아침에 ..."라는 문장이 주어졌을 때, 모델은 다음에 올 텍스트를 학습한 패턴을 통해 예측합니다. "아침식사를 먹었다"든지, "운동을 갔다"든지 등의 예측이 가능하겠죠.

그런데 LLM은 '이해'한다기보다는 단어, 문장, 문서들 사이의 패턴을 학습하고 이를 바탕으로 새로운 텍스트를 생성합니다. 모델이 언어의 문법이나 문맥을 정확히 이해하고 있는 것은 아닙니다.

또한, LLM은 지도학습과 비지도학습의 원리를 모두 활용합니다. 지도학습에서는 입력 데이터와 이에 대한 정답 레이블을 사용하지만, LLM에서 이렇게 학습하는 과정을 사전 학습(pre-training)이라고 합니다. 그 후, 특정 작업에 대해 모델을 미세 조정하는 과정에서는 지도학습이 사용됩니다. 이때는 특정 작업의 정답 레이블이 필요하게 되는데, 이 과정을 fine-tuning이라고 부릅니다.

다만, 이런 방식의 학습에는 한계가 있습니다. 모델이 비편향적이고 공정한 방식으로 텍스트를 처리하도록 하는 것은 매우 어렵습니다. 모델은 학습 데이터에 존재하는 편향성도 함께 학습하기 때문에, 이러한 문제점을 해결하기 위해 더욱 노력할 필요가 있습니다.


In [8]:
print (status_code)

stop


In [9]:
print (response)

{
  "id": "chatcmpl-7abEq56B5fJSoojqPVUFErd4RTVpE",
  "object": "chat.completion",
  "created": 1688957308,
  "model": "gpt-4-0613",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "LLM(Large Language Model)\uc740 \uc778\uacf5\uc9c0\ub2a5\uc774 \uc790\uc5f0\uc5b4 \ucc98\ub9ac\ub97c \ud559\uc2b5\ud558\ub294 \ubc29\ubc95 \uc911 \ud558\ub098\uc785\ub2c8\ub2e4. \uc774\ub294 \uc778\uac04\uc774 \uc18c\ud1b5\uc5d0 \uc0ac\uc6a9\ud558\ub294 \uc5b8\uc5b4\ub97c \uc774\ud574\ud558\uace0 \uc0dd\uc131\ud558\ub294 \ubaa8\ub378\uc744 \uad6c\ud604\ud558\ub294 \uae30\uc220\uc785\ub2c8\ub2e4.\n\n\uc791\ub3d9 \uc6d0\ub9ac\ub97c \uac04\ub2e8\ud558\uac8c \uc124\uba85\ud558\uc790\uba74, LLM\uc740 \ub300\uaddc\ubaa8\uc758 \ud14d\uc2a4\ud2b8 \ub354\ubbf8\ub97c \ud1b5\ud574 \ud559\uc2b5\ud558\ub294\ub370, \uc77c\uc885\uc758 \ud1b5\uacc4\uc801 \ud328\ud134 \uc778\uc2dd \ubc29\ubc95\uc744 \uc0ac\uc6a9\ud569\ub2c8\ub2e4. \ubaa8\ub378\uc740 \uc774\uc804\uc5d

### Helper Class for implementing efficient chat with GPT

In [10]:
class GPTchatClass():
    def __init__(self,
                 gpt_model = 'gpt-4',
                 role_msg  = 'Your are a helpful assistant.',
                 VERBOSE   = True
                ):
        self.gpt_model = gpt_model
        self.messages  = [{'role':'system','content':f'{role_msg}'}]
        self.VERBOSE   = VERBOSE
        self.response  = None
        if self.VERBOSE:
            print ("Chat agent using [%s] initialized with the follow role:[%s]"%
                   (self.gpt_model,role_msg))
    
    def _add_message(self,role='assistant',content=''):
        """
            role: 'assistant' / 'user'
        """
        self.messages.append({'role':role, 'content':content})
        
    def _get_response_content(self):
        if self.response:
            return self.response['choices'][0]['message']['content']
        else:
            return None
        
    def _get_response_status(self):
        if self.response:
            return self.response['choices'][0]['message']['finish_reason']
        else:
            return None
    
    def chat(self,user_msg='hi'):
        self._add_message(role='user',content=user_msg)
        self.response = openai.ChatCompletion.create(
            model    = self.gpt_model,
            messages = self.messages
        )
        # Backup response for continous chatting 
        self._add_message(role='assistant',content=self._get_response_content())
        return self._get_response_content()
print ("Ready.")              

Ready.


### Now let's chat

In [11]:
GPT = GPTchatClass(gpt_model='gpt-4',role_msg  = 'Your are a helpful assistant.')

Chat agent using [gpt-4] initialized with the follow role:[Your are a helpful assistant.]


In [12]:
GPT.chat(user_msg='Who is the current president of Korea?')

'As of my last update in September 2021, the current President of South Korea is Moon Jae-in. However, please check the most recent source for the current information, considering the potential changes over time.'

In [13]:
GPT.chat(user_msg='Are you sure? I think you are outdated.')

'I apologize if my information is outdated. As an AI, I rely on certain updates for real-time information. As of my last update, the President of South Korea is Moon Jae-in. However, please verify from a reliable source for the most recent and accurate information.'

In [14]:
GPT.chat(user_msg='Where can I get the latest information?')

'You can get the most accurate and current information by checking reliable news websites. Here are some to consider:\n\n1. BBC News\n2. CNN International\n3. Al Jazeera English\n4. The Guardian\n5. Reuters\n\nYou can also check the official government website of South Korea for the most direct and official announcements.'