# Text Generation models

- GPT-4o
- GPT-4o with image inpus

## Chat Completion API

In [1]:
import os
import openai
import sys
sys.path.append('./')

from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv()) # read local .env file

- 메시지는 메시지 개체의 배열이어야 하며, 각 개체에는role(“system", “user" 또는 “assistant")과 content가 있습니다. 대화는 하나의 메시지만큼 짧을 수도 있고 여러 번 주고받을 수도 있습니다.
- 대화는 먼저 system 메시지로 형식화되고 이어서 user 메시지와 assistanc 메시지가 교대로 표시됩니다.  - system 메시지는 assistant의 동작을 설정하는 데 도움이 됩니다. 예를 들어, assitant의 성격을 수정하거나 대화 전반에 걸쳐 assistant가 어떻게 행동해야 하는지에 대한 구체적인 지침을 제공할 수 있습니다. 그러나 system 메시지는 선택 사항이며 system 메시지가 없는 모델의 동작은 "당신은 도움이 되는 조수입니다"와 같은 일반적인 메시지를 사용하는 것과 유사할 가능성이 높습니다.  - 
User 메시지는 assistant가 응답할 요청이나 설명을 제공합니다. Assistant 메시지는 이전 assistant 응답을 저장하지만 원하는 동작의 예를 제공하기 위해 user가 작성할 수도 있습니다  .- 
사용자 지침이 이전 메시지를 참조할 때 대화 기록을 포함하는 것이 중요합니다. 위의 예에서 사용자의 마지막 질문인 " Where was it played?" 는 2020년 월드 시리즈에 대한 이전 메시지의 context 에서만 의미가 있습니다. 모델에는 과거 요청에 대한 기억이 없기 때문에 모든 관련 정보는 각 요청의 대화 기록의 일부로 제공되어야 합니다. 대화가 모델의 토큰 제한에 맞지 않으면 어떤 방식으로든 줄여야 합니다 .



In [2]:
from openai import OpenAI
client = OpenAI()

Model = "gpt-3.5-turbo"
# Model = "gpt-4o"

response = client.chat.completions.create(
  model=Model,
  messages=[
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "2020년 코리안 시리즈를 우승한 야구팀이 어디?"},
    {"role": "assistant", "content": "2020년 한국시리즈(Korean Series) 우승 야구팀은 NC 다이노스(NC Dinos)입니다."},
    {"role": "user", "content": "마지막 게임이 어디에서 열렸어?"}
  ]
)

In [3]:
response.to_dict()

{'id': 'chatcmpl-9b0bnVF5lUniVxbXDhXVw1xuK8L7p',
 'choices': [{'finish_reason': 'stop',
   'index': 0,
   'logprobs': None,
   'message': {'content': '2020년 한국시리즈 마지막 경기는 창원 NC파크에서 열렸습니다.',
    'role': 'assistant'}}],
 'created': 1718607503,
 'model': 'gpt-3.5-turbo-0125',
 'object': 'chat.completion',
 'system_fingerprint': None,
 'usage': {'completion_tokens': 32, 'prompt_tokens': 110, 'total_tokens': 142}}

In [4]:
print(response.choices[0].message.content)

2020년 한국시리즈 마지막 경기는 창원 NC파크에서 열렸습니다.


### 모든 응답에는 'finish_reason'이 포함되며, 'finish_reason'의 가능한 값은 다음과 같습니다:
- stop: API가 완전한 메시지를 반환하거나, stop 매개변수를 통해 제공된 중단 시퀀스 중 하나에 의해 메시지가 종료됨
- length: max_tokens 매개변수 또는 토큰 제한으로 인해 완전하지 않은 모델 출력
- function_call: 모델이 함수를 호출하기로 결정함

In [5]:
print(response.choices[0].finish_reason)

stop


## JSON mode

- respone_format 을 { "type": "json_object" }로 지정합니다. 
- JSON 모드를 사용하는 경우 항상 대화의 일부 메시지(예: 시스템 메시지)를 통해 JSON을 생성하도록 모델에 지시합니다.
- 문자열이 "JSON"컨텍스트 어딘가에 나타나지 않으면 API는 오류를 발생시킵니다.

In [6]:
response = client.chat.completions.create(
  model=Model,
  response_format={ "type": "json_object" },
  messages=[
    {"role": "system", "content": "You are a helpful assistant designed to output JSON."},
    {"role": "user", "content": "2020년 코리안 시리즈를 우승한 야구팀이 어디?"},
    {"role": "assistant", "content": "2020년 한국시리즈(Korean Series) 우승 야구팀은 NC 다이노스(NC Dinos)입니다."},
    {"role": "user", "content": "마지막 게임이 어디에서 열렸어? 한국어로 답해줘"}
  ]
)

response.to_dict()

{'id': 'chatcmpl-9b0bwhZIFH3P8otgN6F36LGk5t24P',
 'choices': [{'finish_reason': 'stop',
   'index': 0,
   'logprobs': None,
   'message': {'content': '                                                                                                    ',
    'role': 'assistant'}}],
 'created': 1718607512,
 'model': 'gpt-3.5-turbo-0125',
 'object': 'chat.completion',
 'system_fingerprint': None,
 'usage': {'completion_tokens': 100,
  'prompt_tokens': 124,
  'total_tokens': 224}}

In [7]:
print(response.choices[0].message.content)

                                                                                                    


## Token 관리
- "ChatGPT is great!“ 는 6개의 토큰으로 인코딩됩니다 $\rightarrow$ ["Chat", "G", "PT", " is", " great", "!"]
- 예를 들어, API 호출이 메시지 입력에서 10개의 토큰을 사용하고 메시지 출력에서 ​​20개의 토큰을 받은 경우 30개의 토큰에 대한 요금이 청구됩니다.


In [8]:
print(response.usage)
print(response.usage.prompt_tokens)

CompletionUsage(completion_tokens=100, prompt_tokens=124, total_tokens=224)
124


In [12]:
import tiktoken

encoding = tiktoken.encoding_for_model(Model)

In [19]:
messages=[
    {"role": "system", "content": "You are a helpful assistant designed to output JSON."},
    {"role": "user", "content": "2020년 코리안 시리즈를 우승한 야구팀이 어디?"},
    {"role": "assistant", "content": "2020년 한국시리즈(Korean Series) 우승 야구팀은 NC 다이노스(NC Dinos)입니다."},
    {"role": "user", "content": "마지막 게임이 어디에서 열렸어? 한국어로 답해줘"}
  ]

num_tokens = 0
for message in messages:
  num_tokens += 4  # every message follows <im_start>{role/name}\n{content}<im_end>\n
  for key, value in message.items():
      num_tokens += len(encoding.encode(value))
      print(value)
      print(encoding.encode(value))

num_tokens

system
[9125]
You are a helpful assistant designed to output JSON.
[2675, 527, 264, 11190, 18328, 6319, 311, 2612, 4823, 13]
user
[882]
2020년 코리안 시리즈를 우승한 야구팀이 어디?
[2366, 15, 75265, 226, 3396, 66391, 29102, 31495, 230, 45618, 29102, 96064, 230, 18918, 66822, 108, 18550, 117, 24486, 24814, 120, 89359, 169, 40934, 13094, 80402, 112, 90335, 30]
assistant
[78191]
2020년 한국시리즈(Korean Series) 우승 야구팀은 NC 다이노스(NC Dinos)입니다.
[2366, 15, 75265, 226, 62398, 89059, 255, 30426, 29102, 96064, 230, 17155, 46295, 11378, 8, 66822, 108, 18550, 117, 24814, 120, 89359, 169, 40934, 34804, 20660, 50467, 13094, 75265, 116, 25941, 8368, 34, 423, 15570, 8, 80052, 13]
user
[882]
마지막 게임이 어디에서 열렸어? 한국어로 답해줘
[40011, 230, 22035, 40011, 231, 100027, 94801, 13094, 80402, 112, 90335, 57575, 25493, 112, 22289, 116, 32179, 30, 62398, 89059, 255, 32179, 17835, 35243, 113, 34983, 59269, 246]


125

## 재현 가능한 출력 
- SEED 매개 변수 사용

In [20]:
from IPython.display import display, HTML

# GPT_MODEL = "gpt-3.5-turbo"
GPT_MODEL = "gpt-4o"
SEED = 123

topic = "a journey to Mars"
system_message = "You are a helpful assistant that generates short stories."
user_request = f"{topic}에 관한 짧은 이야기를 한국어로 생성하세요."

try:
    messages = [
        {"role": "system", "content": system_message},
        {"role": "user", "content": user_request},
    ]

    response = openai.chat.completions.create(
        model=GPT_MODEL,
        messages=messages,
        seed=SEED,
        max_tokens=1000,
        temperature=0.7,
    )

    response_content = response.choices[0].message.content
    system_fingerprint = response.system_fingerprint  # 특정 API 응답을 식별하고 추적하는 데 도움 되는 고유 식별자
    completion_tokens = (
        response.usage.total_tokens - response.usage.prompt_tokens
    )
    finish_reason = response.choices[0].finish_reason

    table = f"""
    <table>
    <tr><th style="text-align: left;">Response</th><td style="text-align: left;">{response_content}</td></tr>
    <tr><th style="text-align: left;">System Fingerprint</th><td style="text-align: left;">{system_fingerprint}</td></tr>
    <tr><th style="text-align: left;">Number of completion tokens</th><td style="text-align: left;">{completion_tokens}</td></tr>
    <tr><th style="text-align: left;">finish reason</th><td style="text-align: left;">{finish_reason}</td></tr>
    </table>
    """
    display(HTML(table))
except Exception as e:
    print(f"An error occurred: {e}")

0,1
Response,"알겠습니다. 다음은 ""화성으로의 여정""에 관한 짧은 이야기입니다: --- 지구에서 가장 뛰어난 과학자들과 우주비행사들로 구성된 팀이 있었어요. 그들은 인류 최초로 화성에 도착하기 위해 오랜 시간 준비를 해왔어요. 이들의 임무는 단순히 화성에 도착하는 것만이 아니라, 그곳에서 생존하고 새로운 거주지를 건설하는 것이었어요. 마침내 발사일이 다가왔고, 팀은 최신 기술로 제작된 우주선에 탑승했어요. 우주선은 거대한 로켓의 힘을 빌려 지구를 떠나 드넓은 우주를 항해하기 시작했어요. 몇 달 동안의 긴 여행 끝에, 그들은 마침내 붉은 행성인 화성의 궤도에 도달했어요. 화성 표면에 착륙한 순간, 팀원들은 모두 감격의 눈물을 흘렸어요. 그들은 신중하게 우주복을 입고, 한 발 한 발 조심스럽게 화성의 땅을 밟았어요. 화성의 하늘은 지구와는 전혀 다른 붉은 색으로 물들어 있었고, 공기는 매우 희박했어요. 팀은 곧바로 기지를 건설하기 시작했어요. 지구에서 가져온 모듈을 조립하고, 태양광 패널을 설치해 에너지를 공급했어요. 모든 팀원들은 서로 협력하며, 각자의 역할을 성실히 수행했어요. 마침내, 화성에서의 첫 번째 거주지가 완성되었어요. 그들은 화성의 극한 환경 속에서도 작은 농장을 조성해 신선한 채소를 키웠어요. 또한, 화성의 토양과 대기를 연구하며, 미래의 화성 거주를 위한 귀중한 데이터를 수집했어요. 이렇게 화성에서의 생활이 안정되면서, 팀원들은 서로에게 더욱 의지하며 가족처럼 지냈어요. 그들은 자랑스러움과 함께, 인류의 새로운 문명을 개척해 나가는 선구자가 되었다는 사명감을 느꼈어요. 그리고 지구에 남아 있는 사람들에게도 희망을 전하기 위해, 그들은 매일 화성에서의 소식을 전송했어요. 화성으로의 여정은 끝이 아닌 새로운 시작이었어요. 인류는 이제 우주의 더 먼 곳을 향해 나아갈 준비를 하고 있었어요. --- 이상입니다. 도움이 되었기를 바랍니다!"
System Fingerprint,fp_319be4768e
Number of completion tokens,566
finish reason,stop


In [21]:
response.to_dict()

{'id': 'chatcmpl-9b0pMQyaN7Z8GjgdWoNkJRyPDOY17',
 'choices': [{'finish_reason': 'stop',
   'index': 0,
   'logprobs': None,
   'message': {'content': '알겠습니다. 다음은 "화성으로의 여정"에 관한 짧은 이야기입니다:\n\n---\n\n지구에서 가장 뛰어난 과학자들과 우주비행사들로 구성된 팀이 있었어요. 그들은 인류 최초로 화성에 도착하기 위해 오랜 시간 준비를 해왔어요. 이들의 임무는 단순히 화성에 도착하는 것만이 아니라, 그곳에서 생존하고 새로운 거주지를 건설하는 것이었어요.\n\n마침내 발사일이 다가왔고, 팀은 최신 기술로 제작된 우주선에 탑승했어요. 우주선은 거대한 로켓의 힘을 빌려 지구를 떠나 드넓은 우주를 항해하기 시작했어요. 몇 달 동안의 긴 여행 끝에, 그들은 마침내 붉은 행성인 화성의 궤도에 도달했어요.\n\n화성 표면에 착륙한 순간, 팀원들은 모두 감격의 눈물을 흘렸어요. 그들은 신중하게 우주복을 입고, 한 발 한 발 조심스럽게 화성의 땅을 밟았어요. 화성의 하늘은 지구와는 전혀 다른 붉은 색으로 물들어 있었고, 공기는 매우 희박했어요.\n\n팀은 곧바로 기지를 건설하기 시작했어요. 지구에서 가져온 모듈을 조립하고, 태양광 패널을 설치해 에너지를 공급했어요. 모든 팀원들은 서로 협력하며, 각자의 역할을 성실히 수행했어요. 마침내, 화성에서의 첫 번째 거주지가 완성되었어요.\n\n그들은 화성의 극한 환경 속에서도 작은 농장을 조성해 신선한 채소를 키웠어요. 또한, 화성의 토양과 대기를 연구하며, 미래의 화성 거주를 위한 귀중한 데이터를 수집했어요.\n\n이렇게 화성에서의 생활이 안정되면서, 팀원들은 서로에게 더욱 의지하며 가족처럼 지냈어요. 그들은 자랑스러움과 함께, 인류의 새로운 문명을 개척해 나가는 선구자가 되었다는 사명감을 느꼈어요.\n\n그리고 지구에 남아 있는 사람들에게도 희망을 전하기 위해, 그들은 매일 화성에서의 소