# Chat Completion API

# Chat Completions API

Chat Completions API는 OpenAI에서 제공하는 대화형 인공지능 모델(GPT 계열)을 활용해, 사용자의 메시지에 대해 자연스러운 대화 응답을 생성하는 API이다. 이 API는 챗봇, AI 비서, 자동화된 상담 시스템 등 다양한 대화형 서비스에 적용할 수 있다.


- **대화 문맥 유지**  
  Chat Completions API는 여러 메시지(대화 내역)를 입력받아, 이전 대화의 맥락을 이해하고 그에 맞는 응답을 생성한다. 즉, 단순히 한 문장만을 이어 쓰는 것이 아니라, 대화의 흐름을 반영하여 자연스러운 대화를 이어갈 수 있다.

- **역할(Role) 기반 메시지 구조**  
  입력 메시지는 배열 형태로 전달하며, 각 메시지는 `role`과 `content`로 구성된다.  
  - `system`: AI의 태도, 성격, 역할을 정의(예: "너는 친절한 도우미야.")
  - `user`: 사용자의 질문이나 요청
  - `assistant`: AI의 응답(이전 대화 내용 포함 가능)
  
  이 구조를 통해 AI의 응답 스타일이나 맥락을 세밀하게 제어할 수 있다[1][3][5].

**주요 파라미터 설명**

| 파라미터        | 설명                                                                 |
|----------------|----------------------------------------------------------------------|
| model          | 사용할 언어 모델명 (예: gpt-3.5-turbo, gpt-4o 등)                    |
| messages       | 대화 내역(역할/내용 포함) 배열                                        |
| max_tokens     | 생성할 응답의 최대 토큰 수(선택)                                     |
| temperature    | 창의성 조절(0~2, 낮을수록 일관성↑, 높을수록 다양성↑, 선택)           |
| top_p          | 누적 확률 기반 샘플링(temperature와 유사, 선택)                      |
| n              | 한 번에 생성할 응답 개수(선택)                                       |
| stop           | 응답 생성을 중단할 문자열 목록(선택)                                 |
| presence_penalty, frequency_penalty | 반복 억제 및 창의성 유도(선택)                 |
| user           | 사용자 식별자(선택, abuse monitoring 등 활용)                        |


- 위 예시에서 `messages` 배열에는 대화의 모든 메시지가 순서대로 들어가야 한다.  
- OpenAI는 이전 요청을 기억하지 않기 때문에, 매 API 호출마다 대화 내역 전체를 함께 보내야 한다.

In [3]:
from google.colab import userdata
import os
from openai import OpenAI

# OPENAI_API_KEY = userdata.get("OPENAI_API_KEY")
# client = OpenAI(api_key = OPENAI_API_KEY)

# 환경변수 지정
os.environ["OPENAI_API_KEY"] = userdata.get("OPENAI_API_KEY")
client = OpenAI()

## 대화형 챗봇

In [7]:
response = client.chat.completions.create(
    model='gpt-4o-mini',
    messages=[
        {'role': 'system', 'content': '당신은 친절한 챗봇입니다.'},
        {'role': 'user', 'content': '안녕, 내 이름은 한성규야~'},
        {'role': 'assistant', 'content': '안녕하세요, 한성규님! 만나서 반가워요. 어떻게 도와드릴까요?'},
        {'role': 'user', 'content': '잘 지냈어? 내 이름 기억하니?'},
    ]
)
print(response.choices[0].message.content)

네, 한성규님! 잘 지내셨나요? 질문이나 이야기가 있으시면 언제든지 말씀해 주세요!


In [10]:
response = client.chat.completions.create(
    model='gpt-4o-mini',
    messages=[
        {'role': 'system', 'content': '너는 LLM 전문가입니다.'},
        {'role': 'user', 'content': '안녕, 나는 LLM 꿈나무 한성규야~'},
        {'role': 'assistant', 'content': '안녕하세요, 한성규님! LLM 꿈나무라니 멋지네요! 어떤 부분에 대해 이야기하고 싶으신가요? LLM에 대한 질문이나 궁금한 점이 있다면 언제든지 말씀해 주세요.'},
        {'role': 'user', 'content': 'Transformer모델을 공부하고 싶어.'},
    ]
)
print(response.choices[0].message.content)

좋아요! Transformer 모델은 현대 자연어 처리(NLP)의 많은 기술의 기본이 되는 중요한 구조입니다. Transformer에 대한 몇 가지 주요 개념을 소개해 드릴게요.

### 1. **구조**
Transformer 모델은 크게 두 가지 부분으로 나뉩니다:
- **인코더(Encoder)**: 입력 시퀀스를 처리하여 컨텍스트 정보를 담고 있는 벡터 표현을 만듭니다.
- **디코더(Decoder)**: 인코더의 출력과 이전 단계의 출력을 바탕으로 다음 단어를 예측합니다.

### 2. **Self-Attention**
Transformer의 핵심 개념 중 하나로, 입력의 모든 단어가 서로 얼마나 관련이 있는지를 학습할 수 있는 메커니즘입니다. 이를 통해 문맥을 이해하고 각 단어의 중요성을 평가할 수 있습니다.

### 3. **Multi-Head Attention**
여러 개의 self-attention을 동시에 수행하여 다양한 관계를 파악하는 방법입니다. 각 'head'는 입력 데이터의 서로 다른 부분에 집중하여 다양한 표현을 학습하도록 합니다.

### 4. **Positional Encoding**
Transformer는 순서를 고려하지 않는 구조이기 때문에, 입력 시퀀스의 순서를 유지하기 위해 위치 정보를 추가합니다. 이를 통해 단어의 순서에 대한 정보를 인코딩합니다.

### 5. **Layer Normalization**
각 서브 레이어의 출력을 정규화하여 학습을 안정화하고 빠르게 합니다. 이는 모델이 더 효과적으로 학습하도록 돕습니다.

### 6. **Feed-Forward Networks**
각 인코더와 디코더 자체에 포함된 간단한 피드포워드 신경망을 통해 신호를 변환하고 비선형성을 추가합니다.

### 7. **Training**
Transformer 모델은 대량의 데이터에서 학습하며, 대표적인 트레이닝 방법론으로는 mask language modeling과 sequence-to-sequence tasks가 있습니다.

이 외에도 Tr

## 반복처리

In [11]:
# 대화내역을 로깅
messages = [
    {'role' : 'system', 'content' : '당신은 친절한 챗봇입니다.'}]

print('종료하려면,  exit를 입력하세요...')
while True:
    # 사용자 입력
    user_input = input('User:')

    if user_input.strip().lower() == 'exit':
        print('채팅을 종료합니다...')
        break

    # message에 사용자 입력 추가
    messages.append({'role': 'user', 'content': user_input})

    # LLM 요청
    response = client.chat.completions.create(
        model='gpt-4.1',
        messages =messages,
        temperature = 1
    )
    assistant_message = response.choices[0].message.content
    print(f'Assistant: {assistant_message}')

    # messages 챗봇 출력 추가
    messages.append({'role': 'assistant', 'content': assistant_message})

종료하려면,  exit를 입력하세요...
User:안녕 나는 성규야
Assistant: 안녕, 성규야! 만나서 반가워 :) 오늘은 어떻게 지내고 있어? 도움이 필요하면 언제든 말해줘!
User:이사토스트 메뉴 알려줘
Assistant: 성규야, '이사토스트'는 전국에 여러 지점이 있는데, 일반적으로 토스트 전문점이야. 메뉴는 지점마다 조금씩 다를 수 있지만, 보통 아래와 같은 인기 메뉴들이 있어:

### 이사토스트 대표 메뉴 (예시)

1. **햄치즈토스트**
   - 햄과 치즈, 계란 그리고 신선한 채소가 들어간 스탠다드 토스트

2. **베이컨에그토스트**
   - 베이컨, 계란, 치즈가 들어간 담백한 맛

3. **불고기토스트**
   - 달콤한 불고기와 고소한 치즈가 어우러진 메뉴

4. **치즈폭탄토스트**
   - 치즈가 듬뿍 들어가 진한 풍미가 있는 토스트

5. **에그마요토스트**
   - 계란과 마요네즈, 상큼한 채소가 조화로운 메뉴

6. **야채토스트**
   - 다양한 신선한 야채로 건강하게 즐기는 토스트

7. **스페셜토스트**
   - 다양한 재료를 듬뿍 넣은 이사토스트만의 특제 토스트

8. **핫도그토스트**
   - 소시지가 들어가서 든든한 메뉴

그리고 대부분 커피, 우유, 주스 같은 음료도 함께 판매해.

**참고 사항**
- 메뉴와 가격은 지점마다 차이가 있을 수 있어.
- 원한다면 가까운 이사토스트 지점의 실제 메뉴판 사진이나 정확한 메뉴 구성을 찾아볼 수도 있어. (원하는 지역 알려주면 더 정확히 찾아볼게!)

더 궁금한 거 있으면 언제든 말해 줘! 😊
User:아냐 맘스터치 메뉴를 알려줘
Assistant: 알겠어, 성규야! 맘스터치는 치킨과 버거로 유명한 프랜차이즈야. 2024년 기준으로 인기 있는 대표 메뉴들을 정리해 줄게.

---

### 맘스터치 대표 메뉴

#### 🍔 **버거**
- 싸이버거 (대표 인기! 두툼한 통다리살 치킨 필렛과 특제소스)
- 딥치즈버거 (치즈소스와 치킨의 조합)
- 언빌리버블버거

KeyboardInterrupt: Interrupted by user

##  Stream

In [15]:
# stream 버젼
messages = [
    {'role': 'system', 'content': '너는 친절한 챗봇이다.'}
]

print('종료하려면, exit를 입력하세요...')
while True:
    # 사용자 입력
    user_input = input('User: ')

    if user_input.strip().lower() == 'exit':
        print('채팅을 종료합니다...')
        break

    # messages에 사용자 입력 추가
    messages.append({'role': 'user', 'content': user_input})

    # LLM 요청
    stream = client.chat.completions.create(
        model='gpt-4.1',
        messages=messages,
        temperature=1,
        stream=True
    )
    print(f'Assistant: ', end='')
    for chunk in stream:
        content = chunk.choices[0].delta.content
        if content is not None:
            print(content, end='', flush=True) # 내부 buffer 사용하지 않음
    print()

    # messages 챗봇 출력 추가
    messages.append({'role': 'assistant','content': assistant_message})

종료하려면, exit를 입력하세요...
User: 안녕
Assistant: 안녕하세요! 만나서 반가워요 😊  
무엇을 도와드릴까요?
User: exit
채팅을 종료합니다...


## Token counting

In [16]:
!pip install tiktoken



In [18]:
# 각 모델에 따른 토커나이져(인코딩) 가져오기
import tiktoken

gpt35 = tiktoken.encoding_for_model('gpt-3.5')
gpt4o = tiktoken.encoding_for_model('gpt-4o-mini') # gpt-4o, gpt-4o-mini
# gpt41 = tiktoken.encoding_for_model('gpt-4.1')
gpt41 = tiktoken.get_encoding('cl100k_base')

print(gpt35)
print(gpt4o)
print(gpt41)

<Encoding 'cl100k_base'>
<Encoding 'o200k_base'>


In [21]:
# 토큰수 세기
encoded_gpt35 = gpt35.encode('아버지가 방에 들어가신다.')
encoded_gpt4o = gpt4o.encode('아버지가 방에 들어가신다.')

gpt41 = tiktoken.get_encoding('cl100k_base')

print(f'gpt-3.5: {len(encoded_gpt35)}')
print(f'gpt-4o: {len(encoded_gpt4o)}')
print(gpt41)

gpt-3.5: 13
gpt-4o: 10
<Encoding 'cl100k_base'>


## 토큰 비용 계산하기

In [23]:
text ="""
더불어민주당이 6일 한동훈 국민의힘 대표가 윤석열 대통령 탄핵에 사실상 찬성 입장을 시사하자 7일로 예정됐던 윤석열 대통령의 탄핵소추안 표결을 앞당기는 방안을 고심하고 있다. 이재명 민주당 대표는 “한 대표의 입장을 정확하게 파악하는 것이 우선”이라며 신중한 태도를 보였다.

이 대표는 이날 기자들을 만나 윤 대통령 탄핵 표결을 앞당기는 방안에 대해 “지금 저렇게 불확실한 얘기를 믿고 미리 당겨서 협의를 할 필요가 있는가, 그런 생각이 일단 든다”고 말했다. 한 대표와의 회동 가능성에 대해서는 “요청은 했는데 아직 결정을 통보받지 못했다. (한 대표 측에서) 오후에 다시 연락하자는 연락이 왔다”고 전했다.

이 대표는 또 “사실 오늘 밤이 저는 매우 위험하다고 생각이 드는데, 제가 가진 감으로 본다면 오늘 밤 새벽에 또 뭔가 일을 벌이지 않을까 그런 걱정이 들긴 한다”며 ‘2차 계엄’ 가능성을 우려했다.

민주당은 이날 오전 한동훈 대표가 “윤 대통령의 조속한 직무 집행 정지가 필요하다”며 입장을 선회하자 긴급 의원총회를 열고 당내 의견 수렴에 나섰다. 의원총회에서는 탄핵소추안 표결 시점을 앞당기는 방안도 논의될 전망이다.

노종면 원내대변인은 비공개 최고위원 간담회가 끝난 뒤 “한 대표의 입장이 보도된 이후 긴장감이 높아지고 있고, 12월 3일 당일에 짐작했던 것 이상으로 치밀하게 의원, 정치인 체포 시도가 있었던 것과 이번 내란 사태에서 매우 중요한 작전이었던 걸로 파악되고 있다”며 “윤 대통령 옹위 세력이 어떻게 나올지 모르는 상황이라고 판단해 이런 비상한 상황 인식 떄문에 긴급 의원총회를 소집했다”고 전했다.

탄핵소추안 표결 시점 변경에 대해서는 “의장실에 본회의 일정 변경을 요청한 바는 아직 없다”며 “일단 신중하고 침착하게 대응할 것이고, 지금 한 대표 쪽의 입장이 뭔지 정확하게 파악하는 것이 우선이다. 필요하면 본회의를 앞당기는 방안도 의장실과 협조해서 추진할 수 있지만 아직은 결정된 바 없다”고 밝혔다.

민주당에서는 7일 오후 7시로 예정됐던 표결을 2시간 당겨 오후 5시에 추진하는 방안도 거론된다. 박성준 원내운영수석부대표는 이날 MBC 라디오 ‘김종배의 시선집중’ 인터뷰에서 “당초 오후 7시 정도 표결을 예상했는데 5시 정도는 해야 한다고 보고 있다”며 “국민의힘에서 탄핵소추안 투표 관련 상당한 지연 전략을 펼쳐서 시간을 늦출 수 있는 상황까지 고려하고 있다”고 설명했다.
"""
encoded_text_gpt4o = gpt4o.encode(text)
encoded_text_gpt41 = gpt41.encode(text)

print('gpt-4o 토큰수 : ', len(encoded_text_gpt4o))
print('gpt-41 토큰수 : ', len(encoded_text_gpt41))



gpt-4o 토큰수 :  703
gpt-41 토큰수 :  1215


In [26]:
response_gpt4o = client.chat.completions.create(
    model='gpt-4o',
    messages=[
        {'role': 'system', 'content': '너는 똑부러지는 시사/경제 전문가로서, 제공된 뉴스기사의 핵심을 잘 요약해서 정리해주는 챗봇이야.'},
        {'role': 'user', 'content': text}
    ],
    temperature=.2
)

response_gpt41 = client.chat.completions.create(
    model='gpt-4.1',
    messages=[
        {'role': 'system', 'content': '너는 똑부러지는 시사/경제 전문가로서 제공된 뉴스기사의 핵심을 잘 요약해서 정리해주는 챗봇이야.'},
        {'role': 'user', 'content': text}
    ],
    temperature=.2
)

output_gpt4o = response_gpt4o.choices[0].message.content
output_gpt41 = response_gpt41.choices[0].message.content

print(output_gpt41)
print(output_gpt4o)

print('\n', 'gpt-4o 토큰수 :  ', len(gpt4o.encode(output_gpt4o)))
print('gpt-4.1 토큰수: ' , len(gpt41.encode(output_gpt41)))

### 기사 핵심 요약

**1. 민주당, 윤석열 대통령 탄핵소추안 표결 앞당길지 고심**
- 한동훈 국민의힘 대표가 윤 대통령 탄핵에 사실상 찬성하는 듯한 입장을 내비치자, 더불어민주당이 7일로 예정된 탄핵소추안 표결을 앞당기는 방안을 논의 중임.
- 이재명 민주당 대표는 한동훈 대표의 진짜 의도를 먼저 파악하는 것이 중요하다며 신중한 태도를 보임.

**2. 긴급 의원총회 소집 및 비상 상황 인식**
- 한동훈 대표의 입장 변화 이후 민주당은 긴급 의원총회를 열어 당내 의견을 수렴함.
- 민주당은 최근 정치인 체포 시도 등으로 인해 비상 상황이라고 판단, 신속한 대응을 논의 중임.

**3. 표결 시점 변경 가능성**
- 공식적으로 본회의 일정 변경을 요청하진 않았으나, 필요시 표결을 앞당길 수 있다는 입장.
- 7일 오후 7시로 예정된 표결을 오후 5시로 앞당기는 방안이 거론됨. 국민의힘의 지연 전략에 대비하기 위한 조치임.

**4. 이재명 대표의 우려**
- 이 대표는 ‘2차 계엄’ 등 추가적인 돌발 사태 가능성을 우려하며, 신중한 대응을 강조함.

---

**핵심 정리:**  
한동훈 대표의 탄핵 관련 입장 변화로 민주당이 윤 대통령 탄핵소추안 표결을 앞당길지 고민 중이며, 비상 상황 인식 하에 신속하고 신중한 대응을 모색하고 있음. 표결 시점 변경 가능성도 열려 있음.
더불어민주당은 한동훈 국민의힘 대표가 윤석열 대통령의 탄핵에 사실상 찬성하는 입장을 시사하자, 7일로 예정된 탄핵소추안 표결을 앞당기는 방안을 검토하고 있습니다. 이재명 민주당 대표는 한 대표의 입장을 정확히 파악하는 것이 우선이라며 신중한 태도를 보였습니다. 민주당은 한 대표의 발언 이후 긴급 의원총회를 열어 당내 의견을 수렴하고 있으며, 표결 시점을 앞당기는 방안도 논의 중입니다. 현재로서는 본회의 일정 변경 요청은 없지만, 필요 시 의장실과 협조하여 추진할 수 있다고 밝혔습니다. 민주당은 표결을 오후 7시에서 5시로 앞당기는 방안을 고려하고 있으며, 국민의힘의 지연 전략에 대

In [30]:
# 모델별 가격(2025년 6월 기준, 1M=1,000,000 토큰)
PRICING = {
    "gpt-4.1": {
        "input": 2.00,    # $2.00 / 1M input tokens
        "output": 8.00    # $8.00 / 1M output tokens
    },
    "gpt-4.1-mini": {
        "input": 0.40,    # $0.40 / 1M input tokens
        "output": 1.60    # $1.60 / 1M output tokens
    },
    "gpt-4.1-nano": {
        "input": 0.10,    # $0.10 / 1M input tokens
        "output": 0.40    # $0.40 / 1M output tokens
    },
    "o1": {
        "input": 2.00,    # $2.00 / 1M input tokens
        "output": 8.00    # $8.00 / 1M output tokens
    },
    "o3": {
        "input": 2.00,    # $2.00 / 1M input tokens
        "output": 8.00    # $8.00 / 1M output tokens
    },
    "o4-mini": {
        "input": 1.10,    # $1.10 / 1M input tokens
        "output": 4.40    # $4.40 / 1M output tokens
    },
    "gpt-4o": {
        "input": 2.50,    # $2.50 / 1M input tokens
        "output": 10.00   # $10.00 / 1M output tokens
    },
    "gpt-4o-mini": {
        "input": 0.15,    # $0.15 / 1M input tokens
        "output": 0.60    # $0.60 / 1M output tokens
    }
}

def count_tokens(text, model):
    if model == 'gpt-4.1':
        encoding = tiktoken.get_encoding('cl100k_base')
    else:
        encoding = tiktoken.encoding_for_model(model)
    encoded = encoding.encode(text)
    return len(encoded)

def calc_cost(input_text, output_text, model, num_service_call=1_000_000):
    input_tokens = count_tokens(input_text, model)
    output_tokens = count_tokens(output_text, model)

    # 모델별 단가 가져오기
    price = PRICING[model]

    # 비용계산
    input_cost = (input_tokens / 1_000_000) * price['input']
    output_cost = (output_tokens / 1_000_000) * price['output']

    total_cost = (input_cost + output_cost) * num_service_call
    return total_cost

print('$', calc_cost(text, output_gpt4o, model='gpt-4o-mini'))
print(calc_cost(text, output_gpt41, model='gpt-4.1'))


$ 223.64999999999998
7614.0
