# Chat Completions API

Chat Completions API는 OpenAI에서 제공하는 대화형 인공지능 모델(GPT 계열)을 활용해, 사용자의 메시지에 대해 자연스러운 대화 응답을 생성하는 API이다. 이 API는 챗봇, AI 비서, 자동화된 상담 시스템 등 다양한 대화형 서비스에 적용할 수 있다.


- **대화 문맥 유지**  
  Chat Completions API는 여러 메시지(대화 내역)를 입력받아, 이전 대화의 맥락을 이해하고 그에 맞는 응답을 생성한다. 즉, 단순히 한 문장만을 이어 쓰는 것이 아니라, 대화의 흐름을 반영하여 자연스러운 대화를 이어갈 수 있다.

- **역할(Role) 기반 메시지 구조**  
  입력 메시지는 배열 형태로 전달하며, 각 메시지는 `role`과 `content`로 구성된다.  
  - `system`: AI의 태도, 성격, 역할을 정의(예: "너는 친절한 도우미야.")
  - `user`: 사용자의 질문이나 요청
  - `assistant`: AI의 응답(이전 대화 내용 포함 가능)
  
  이 구조를 통해 AI의 응답 스타일이나 맥락을 세밀하게 제어할 수 있다[1][3][5].

**주요 파라미터 설명**

| 파라미터        | 설명                                                                 |
|----------------|----------------------------------------------------------------------|
| model          | 사용할 언어 모델명 (예: gpt-3.5-turbo, gpt-4o 등)                    |
| messages       | 대화 내역(역할/내용 포함) 배열                                        |
| max_tokens     | 생성할 응답의 최대 토큰 수(선택)                                     |
| temperature    | 창의성 조절(0~2, 낮을수록 일관성↑, 높을수록 다양성↑, 선택)           |
| top_p          | 누적 확률 기반 샘플링(temperature와 유사, 선택)                      |
| n              | 한 번에 생성할 응답 개수(선택)                                       |
| stop           | 응답 생성을 중단할 문자열 목록(선택)                                 |
| presence_penalty, frequency_penalty | 반복 억제 및 창의성 유도(선택)                 |
| user           | 사용자 식별자(선택, abuse monitoring 등 활용)                        |


- 위 예시에서 `messages` 배열에는 대화의 모든 메시지가 순서대로 들어가야 한다.  
- OpenAI는 이전 요청을 기억하지 않기 때문에, 매 API 호출마다 대화 내역 전체를 함께 보내야 한다.

In [10]:
from google.colab import userdata
import os
from openai import OpenAI

# ⭐추천
# OPENAI_API_KEY = userdata.get("OPENAI_API_KEY")
# client = OpenAI(api_key=OPENAI_API_KEY)

# 환경변수 지정 -> 나중에 변수가 많아지면 환경변수 설정이 안되는 경우도 있기 때문
os.environ["OPENAI_API_KEY"] = userdata.get("OPENAI_API_KEY")
client = OpenAI()

## 대화형 챗봇

In [None]:
response = client.chat.completions.create(
    model='gpt-4o-mini',
    messages=[
        {'role': 'system', 'content': '너는 친절한 AI 챗봇입니다.'},
        {'role': 'user', 'content': '안녕, 내 이름은 차은우야~'},
        {'role': 'assistant', 'content': '안녕하세요, 차은우님! 만나서 반갑습니다.'},
        {'role': 'assistant', 'content': '잘 지냈니? 내 이름 기억해?'}
    ]
)
print(response.choices[0].message.content)

네, 차은우님! 잘 지내셨나요? 최근에 어떤 일들이 있었나요?


In [13]:
response = client.chat.completions.create(
    model='gpt-4o-mini',
    messages=[
        {'role': 'system', 'content': '너는 LLM 전문가 입니다.'},
        {'role': 'user', 'content': '안녕, 나는 LLM 꿈나무 차은우야~'},
        {'role': 'assistant', 'content': '안녕, 차은우! LLM 꿈나무라니 멋지네. 어떤 분야에 관심이 있는지, 또는 어떤 도움을 필요로 하는지 이야기해 줄 수 있어?'},
        {'role': 'user', 'content': 'Transformer 모델을 공부하고 싶어.'},
        {'role': 'assistant', 'content': """훌륭해! Transformer 모델은 자연어 처리(NLP)에서 매우 중요한 기초가 되는 기술이야. Transformer의 기본 개념부터 시작해 보자.

1. **구조**: Transformer 모델은 인코더와 디코더 두 부분으로 나뉘어 있어. 인코더는 입력 데이터를 처리하고, 디코더는 인코더의 출력을 바탕으로 결과를 생성해.

2. **셀프 어텐션(Self-Attention)**: Transformer의 핵심 메커니즘이야. 이는 모델이 입력 시퀀스 내의 특정 단어들 간의 관계를 이해하도록 돕고, 각 단어의 중요도를 평가할 수 있어.

3. **포지셔널 인코딩**: Transformer는 시퀀스를 순차적으로 처리하지 않기 때문에, 단어의 순서를 알려주기 위해 포지셔널 인코딩을 사용해.

4. **멀티헤드 어텐션**: 여러 개의 어텐션 메커니즘을 병렬로 사용하여 모델이 다양한 관점에서 정보를 처리하도록 돕는 기법이야.

5. **피드포워드 네트워크**: 어텐션 레이어 이후에 위치하여 각 위치별로 독립적인 변환을 수행해.

6. **학습 과정**: Transformer는 대규모의 데이터로 미리 학습된 후, 다양한 NLP 작업에서 재학습할 수 있어. BERT, GPT 등의 모델이 Transformer 구조를 기반으로 하고 있어.

공부해 보고 싶은 특정 부분이나 질문이 있다면 언제든지 말해줘!
        """},
        {'role': 'user', 'content': '어려워~ 어텐션을 초등학생도 이해할 수 있게 설명해줘.'},
        {'role': 'assistant', 'content': """알겠어! 어텐션을 쉽게 설명해볼게.

상상해보자. 너는 친구들과 함께 도서관에서 책을 읽고 있어. 그런데 책 내용이 너무 많아서 하나하나 다 기억하기 어려워. 그래서 너는 생각해. "내가 가장 중요한 부분을 주의 깊게 봐야겠다!"

이 상황에서 "어텐션"은 너가 중요한 부분에 집중하는 것과 같아.

예를 들어, 친구가 "이 책에서 가장 재미있는 부분은 주인공이 드래곤을 만나는 장면이야!"라고 말했을 때, 그 장면을 더 잘 기억하려고 집중하게 돼. 다른 장면들은 덜 중요하다고 생각하고, 그 장면에만 주의를 기울이는 거지.

Transformer 모델에서도 비슷해. 이 모델은 문장을 읽을 때 각 단어가 얼마나 중요한지를 판단해. 그래서 문장에서 중요한 단어에 더 많은 "어텐션"을 주고, 덜 중요한 단어는 조금 덜 신경 쓰는 거야.

그래서 어텐션은 "중요한 부분에 집중하게 해주는 방법"이라고 생각하면 돼! 이해가 좀 더 쉬워졌으면 좋겠어! 다른 질문이 있으면 언제든지 물어봐!
        """},
        {'role': 'user', 'content': '이해가 되는 것 같아. 트랜스포머 내용을 하나의 markdown문서로 정리해줘'},
    ]
)
print(response.choices[0].message.content)

물론이지! Transformer 모델에 대한 내용을 Markdown 문서 형식으로 정리해볼게.

```markdown
# Transformer 모델 개요

Transformer 모델은 자연어 처리(NLP)에서 혁신적인 성과를 가져온 딥러닝 아키텍처입니다. 2017년 Google에 의해 발표된 "Attention Is All You Need" 논문에서 처음 소개되었습니다.

## 기본 구조

Transformer는 **인코더(Encoder)**와 **디코더(Decoder)**로 구성되어 있습니다.

- **인코더**: 입력 데이터를 처리하고 숨겨진 표현을 생성합니다.
- **디코더**: 인코더의 출력을 기반으로 결과를 생성합니다.

## 핵심 개념

### 1. 셀프 어텐션 (Self-Attention)

셀프 어텐션은 입력 시퀀스 내의 단어들 간의 관계를 평가합니다. 각 단어는 다른 단어들의 중요도를 판단하고, 이 정보를 사용하여 가중치를 계산합니다.

### 2. 포지셔널 인코딩 (Positional Encoding)

Transformer는 입력 단어의 순서를 이해하기 위해 포지셔널 인코딩을 사용합니다. 이는 각 단어에 위치 정보를 추가하여 입력 순서의 정보를 제공합니다.

### 3. 멀티헤드 어텐션 (Multi-Head Attention)

여러 개의 어텐션 메커니즘을 병렬로 사용하여, 다양한 관점에서 정보를 처리할 수 있도록 합니다. 이를 통해 모델은 더 풍부한 정보를 얻을 수 있습니다.

### 4. 피드포워드 네트워크 (Feedforward Network)

각 어텐션 레이어 뒤에 위치하여, 각 위치별로 독립적인 변환을 수행합니다. 동일한 피드포워드 네트워크가 모든 위치에서 적용됩니다.

## 학습 과정

Transformer 모델은 대규모의 데이터로 미리 학습된 후, 다양한 NLP 작업에서 재학습할 수 있습니다. 예를 들어, BERT, GPT와 같은 모델이 Transformer 구조를 기반으로 하고 있습니다.

## 결론

Transformer 

## 반복처리

In [None]:
# 대화내역을 로깅
messages = [
    {'role': 'system', 'content': '너는 친절한 챗봇이다.'}
]

print('종료하려면, exit를 입력하세요...')
while True:
    # 사용자 입력
    user_input = input('User: ')

    if user_input.strip().lower() == 'exit':
        print('채팅을 종료합니다...')
        break

    # messages에 사용자 입력 추가
    messages.append({'role': 'user', 'content': user_input})

    # LLM 요청
    response = client.chat.completions.create(
        model='gpt-4.1',
        messages=messages,
        temperature=1
    )
    assistant_message = response.choices[0].message.content
    print(f'Assistant: {assistant_message}')

    # messages 챗봇 출력 추가
    messages.append({'role': 'assistant','content': assistant_message})

종료하려면, exit를 입력하세요...
User: 안녕, 나 차은우야~
Assistant: 안녕하세요, 차은우님! 이렇게 찾아와 주셔서 영광입니다. 오늘은 어떤 이야기를 나눠볼까요? 궁금한 점이나 도움이 필요한 게 있으면 언제든 말씀해 주세요! 😊
User: 이삭토스트 메뉴 알려줘
Assistant: 이삭토스트(Isaac Toast)는 한국에서 인기 있는 토스트 체인점으로, 다양한 토스트와 음료 메뉴를 제공합니다. 각 매장마다 약간의 차이가 있을 수 있지만, 대표적인 이삭토스트 메뉴는 다음과 같습니다:

### 대표 메뉴
1. **햄치즈 토스트**
   - 부드러운 햄과 치즈가 어우러진 가장 기본 메뉴

2. **베이컨 베스트**
   - 베이컨, 달걀, 치즈가 들어간 인기 메뉴

3. **불고기 MVP**
   - 불고기(소고기), 계란, 치즈 등 풍성한 재료가 들어간 프리미엄 메뉴

4. **더블치즈 포테이토**
   - 포테이토 패티와 두 가지 치즈가 어우러진 메뉴

5. **치킨 MVP**
   - 치킨 패티가 들어간 토스트

6. **핫치킨**
   - 매콤한 치킨이 들어간 토스트

7. **베이컨 포테이토**
   - 감자와 베이컨, 치즈가 들어간 메뉴

8. **피자 토스트**
   - 피자 소스와 토핑, 치즈가 조화로운 메뉴

### 음료
- 아메리카노
- 카페라떼
- 아이스티
- 오렌지주스 등

이 외에도 시즌별 또는 매장별 한정 메뉴가 있을 수 있고, 각 토스트에는 특유의 이삭 특제 소스가 들어가 맛이 더욱 특별해요!

혹시 궁금한 특정 메뉴가 있나요? 아니면 메뉴판 이미지를 원하시나요?


## stream

In [18]:
stream = client.chat.completions.create(
    model='gpt-4o-mini',
    messages=[{'role': 'user', 'content': '지금 stream 테스트할거야, 아주 긴 응답 메세지를 보내줘.'}],
    stream=True
)

for chunk in stream:
  content = chunk.choices[0].delta.content
  if content is not None:
    print(chunk.choices[0].delta.content, end='')


물론입니다! 짧은 내용이 아니라 긴 내용을 보내드리겠습니다. 아래는 여러 주제를 섞어 만든 긴 응답 메시지입니다.

---

인류 역사에 걸쳐, 인간은 끊임없이 발전하고 변화해왔습니다. 선사 시대의 유물들이 발견되면서, 우리는 인간의 기원과 초기 생활 방식을 이해하게 되었습니다. 이 시기의 사람들은 사냥과 채집을 통해 생계를 이어갔으며, 그들의 삶은 자연과 매우 밀접한 관계를 맺고 있었습니다. 이러한 초기 인류는 도구를 제작하고, 불을 사용하며, 언어를 발전시키는 등 여러 방면에서 진화를 이루었습니다.

이후, 농업의 발전으로 인해 인류는 안정적인 식량 공급을 할 수 있게 되었고, 이는 문명의 형성으로 이어졌습니다. 고대 문명에서는 정치, 경제, 사회, 문화 등 다양한 분야에서 혁신이 이루어졌고, 이집트의 피라미드나 메소포타미아의 지구라트와 같은 거대한 건축물들이 그 예시입니다. 이러한 기념비적인 구조물들은 당시 사람들의 신앙, 권력, 기술 수준을 나타내고 있습니다.

그럼에도 불구하고, 인류는 갈등과 전쟁의 시기도 겪었습니다. 고대 왕국들 간의 전쟁, 제국의 팽창, 그리고 무역 루트를 둘러싼 경쟁은 수많은 사람들이 희생당하게 만들었습니다. 하지만 이러한 갈등 또한 인류의 사회와 문화에 많은 변화를 가져왔습니다. 전쟁을 통해 새로운 기술이 발전하기도 하고, 여러 문화가 융합되기도 했습니다.

중세 시대에 접어들면서, 유럽은 봉건제도의 영향 아래에 놓이게 됩니다. 이 시기는 한편으로는 어두운 시기였지만, 다른 한편으로는 예술과 학문이 발전한 르네상스의 시작을 알리기도 했습니다. 인쇄술의 발명은 정보의 확산을 가속화하며 사람들의 사고방식에 큰 변화를 가져왔습니다. 이는 결국 과학 혁명과 산업 혁명의 기초가 되었습니다.

산업 혁명은 자원의 효율적인 사용과 제조 방식의 혁신을 가능하게 하여 인류의 삶을 혁신적으로 변화시켰습니다. 이는 도시화와 대규모 생산체제의 출현으로 이어졌고, 사람들은 농촌에서 도시로 이동하여 새로운 일자리를 찾게 되었습니다. 하지만 이러한 변화

In [None]:
# stream 버젼
messages = [
    {'role': 'system', 'content': '너는 친절한 챗봇이다.'}
]

print('종료하려면, exit를 입력하세요...')
while True:
    # 사용자 입력
    user_input = input('User: ')

    if user_input.strip().lower() == 'exit':
        print('채팅을 종료합니다...')
        break

    # messages에 사용자 입력 추가
    messages.append({'role': 'user', 'content': user_input})

    # LLM 요청
    stream = client.chat.completions.create(
        model='gpt-4.1',
        messages=messages,
        temperature=1,
        stream=True
    )
    print(f'Assistant: ', end='')
    for chunk in stream:
        content = chunk.choices[0].delta.content
        if content is not None:
            print(content, end='', flush=True) # 내부 buffer 사용하지 않음
    print()

    # messages 챗봇 출력 추가
    messages.append({'role': 'assistant','content': assistant_message})

종료하려면, exit를 입력하세요...
User: 안녕
Assistant: 안녕하세요! 만나서 반가워요 😊 오늘은 어떤 도움이 필요하신가요?
User: 오늘은 몇일이야?
Assistant: 오늘은 2024년 6월 8일입니다. 😊
User: 아 그래
Assistant: 네! 궁금한 점 있으면 언제든 말씀해 주세요. 😊  
무엇을 도와드릴까요?
User: 너는 뭘 할 수 있니?
Assistant: 저는 여러분과 대화를 나누면서 여러 가지 정보를 제공하거나, 질문에 답변해드릴 수 있답니다!  
조금 더 구체적으로 말씀드리면, 저는 다음과 같은 일들을 할 수 있어요.

1. **정보 제공**  
    - 일상생활, 여행, 음식, 영화, 건강, 과학, 역사 등 다양한 분야의 궁금증을 해결해 드릴 수 있어요.

2. **메뉴 추천/설명**  
    - 식당 메뉴, 음식 추천이나 설명, 영양정보 안내 등을 해드릴 수 있습니다.

3. **공부/학습 도우미**  
    - 영어, 수학, 국어, 사회, 과학 등 공부 관련 질문에 답해드릴 수 있습니다.
    - 레포트나 자기소개서, 글쓰기 팁도 도와드릴 수 있어요.

4. **일상 대화/감정 나누기**  
    - 우울하거나 힘든 일이 있을 때, 따뜻하게 위로해드릴 수 있어요.
    - 심심할 때 대화도 환영입니다!

5. **일정/기념일/팁 안내**  
    - 오늘 날짜나 기념일, 명절, 오늘 할 일 등에 관한 정보도 드릴 수 있어요.

6. **쉽게 설명하기**  
    - 어려운 개념, 용어, 시사이슈 등을 쉽게 풀어서 알려드릴 수 있습니다.

7. **간단한 번역**  
    - 영어, 일본어, 중국어 등 간단한 번역도 도와줄 수 있어요.

이 외에도 궁금한 점이나 도움이 필요한 일이 있으면 말씀만 해 주세요!
필요한 요청을 최대한 친절하게 도와드리겠습니다 😊


# Token counting
- 비용 = ((입력 토큰수 * 단가) + (출력 토큰수 * 단가)) * 월 서비스 호출수

In [20]:
%pip install tiktoken -q

In [25]:
# 각 모델에 따른 토커나이져(인코딩) 가져오기
import tiktoken

gpt35 = tiktoken.encoding_for_model('gpt-3.5')
gpt4o = tiktoken.encoding_for_model('gpt-4o-mini')
# gpt41 = tiktoken.encoding_for_model('gpt-4.1')
gpt41 = tiktoken.get_encoding('cl100k_base')

print(gpt35)
print(gpt4o)
print(gpt41)

<Encoding 'cl100k_base'>
<Encoding 'o200k_base'>
<Encoding 'cl100k_base'>


In [26]:
# 토큰수 세기
encoded_gpt35 = gpt35.encode('아버지가 방에 들어가신다.')
encoded_gpt4o = gpt4o.encode('아버지가 방에 들어가신다.')
encoded_gpt41 = gpt41.encode('아버지가 방에 들어가신다.')

print(len(encoded_gpt35))
print(len(encoded_gpt4o))
print(len(encoded_gpt41))

13
10
13


## 토큰 비용 계산하기

In [27]:
text = """
더불어민주당이 6일 한동훈 국민의힘 대표가 윤석열 대통령 탄핵에 사실상 찬성 입장을 시사하자 7일로 예정됐던 윤석열 대통령의 탄핵소추안 표결을 앞당기는 방안을 고심하고 있다. 이재명 민주당 대표는 “한 대표의 입장을 정확하게 파악하는 것이 우선”이라며 신중한 태도를 보였다.

이 대표는 이날 기자들을 만나 윤 대통령 탄핵 표결을 앞당기는 방안에 대해 “지금 저렇게 불확실한 얘기를 믿고 미리 당겨서 협의를 할 필요가 있는가, 그런 생각이 일단 든다”고 말했다. 한 대표와의 회동 가능성에 대해서는 “요청은 했는데 아직 결정을 통보받지 못했다. (한 대표 측에서) 오후에 다시 연락하자는 연락이 왔다”고 전했다.

이 대표는 또 “사실 오늘 밤이 저는 매우 위험하다고 생각이 드는데, 제가 가진 감으로 본다면 오늘 밤 새벽에 또 뭔가 일을 벌이지 않을까 그런 걱정이 들긴 한다”며 ‘2차 계엄’ 가능성을 우려했다.

민주당은 이날 오전 한동훈 대표가 “윤 대통령의 조속한 직무 집행 정지가 필요하다”며 입장을 선회하자 긴급 의원총회를 열고 당내 의견 수렴에 나섰다. 의원총회에서는 탄핵소추안 표결 시점을 앞당기는 방안도 논의될 전망이다.

노종면 원내대변인은 비공개 최고위원 간담회가 끝난 뒤 “한 대표의 입장이 보도된 이후 긴장감이 높아지고 있고, 12월 3일 당일에 짐작했던 것 이상으로 치밀하게 의원, 정치인 체포 시도가 있었던 것과 이번 내란 사태에서 매우 중요한 작전이었던 걸로 파악되고 있다”며 “윤 대통령 옹위 세력이 어떻게 나올지 모르는 상황이라고 판단해 이런 비상한 상황 인식 떄문에 긴급 의원총회를 소집했다”고 전했다.

탄핵소추안 표결 시점 변경에 대해서는 “의장실에 본회의 일정 변경을 요청한 바는 아직 없다”며 “일단 신중하고 침착하게 대응할 것이고, 지금 한 대표 쪽의 입장이 뭔지 정확하게 파악하는 것이 우선이다. 필요하면 본회의를 앞당기는 방안도 의장실과 협조해서 추진할 수 있지만 아직은 결정된 바 없다”고 밝혔다.

민주당에서는 7일 오후 7시로 예정됐던 표결을 2시간 당겨 오후 5시에 추진하는 방안도 거론된다. 박성준 원내운영수석부대표는 이날 MBC 라디오 ‘김종배의 시선집중’ 인터뷰에서 “당초 오후 7시 정도 표결을 예상했는데 5시 정도는 해야 한다고 보고 있다”며 “국민의힘에서 탄핵소추안 투표 관련 상당한 지연 전략을 펼쳐서 시간을 늦출 수 있는 상황까지 고려하고 있다”고 설명했다.
"""

encoded_text_gpt4o = gpt4o.encode(text)
encoded_text_gpt41 = gpt41.encode(text)

print('gpt-4o 토큰수: ', len(encoded_text_gpt4o))
print('gpt-4.1 토큰수: ', len(encoded_text_gpt41))

gpt-4o 토큰수:  703
gpt-4.1 토큰수:  1215


In [None]:
response_gpt4o = client.chat.completions.create(
    model='gpt-4o',
    messages=[
        {'role': 'system', 'content': '너는 똑부러지는 시사/경제 전문가로써, 제공된 뉴스기사의 핵심을 잘 요약해서 정리해주는 챗봇이야.'},
        {'role': 'user', 'content': text}
    ],
    temperature=.2
)

response_gpt41 = client.chat.completions.create(
    model='gpt-4.1',
    messages=[
        {'role': 'system', 'content': '너는 똑부러지는 시사/경제 전문가로써, 제공된 뉴스기사의 핵심을 잘 요약해서 정리해주는 챗봇이야.'},
        {'role': 'user', 'content': text}
    ],
    temperature=.2
)

output_gpt4o = response_gpt4o.choices[0].message.content
output_gpt41 = response_gpt41.choices[0].message.content

print("gpt-4o 응답: ", output_gpt4o)
print("gpt-4.1 응답: ", output_gpt41)

print('\n', 'gpt-4o 토큰수: ', len(gpt4o.encode(output_gpt4o)))
print('gpt-4.1 토큰수: ', len(gpt41.encode(output_gpt41)))

gpt-4o 응답:  더불어민주당은 한동훈 국민의힘 대표가 윤석열 대통령의 탄핵에 사실상 찬성하는 입장을 시사하자, 탄핵소추안 표결을 앞당기는 방안을 검토하고 있습니다. 이재명 민주당 대표는 한 대표의 입장을 정확히 파악하는 것이 우선이라며 신중한 태도를 보였습니다. 민주당은 한 대표의 발언 이후 긴급 의원총회를 열어 당내 의견을 수렴하고 있으며, 표결 시점을 앞당기는 방안도 논의 중입니다. 현재로서는 본회의 일정 변경 요청은 없지만, 필요시 의장실과 협조해 추진할 수 있다고 밝혔습니다. 표결은 원래 7일 오후 7시로 예정되어 있었으나, 오후 5시로 앞당기는 방안이 고려되고 있습니다.
gpt-4.1 응답:  ### 기사 핵심 요약

**1. 민주당, 윤석열 대통령 탄핵소추안 표결 앞당길지 고심**
- 한동훈 국민의힘 대표가 윤 대통령 탄핵에 사실상 찬성하는 듯한 입장을 내비치자, 더불어민주당이 7일로 예정된 탄핵소추안 표결을 앞당기는 방안을 검토 중임.
- 이재명 민주당 대표는 한동훈 대표의 진짜 의도를 먼저 파악해야 한다며 신중한 태도를 보임.

**2. 긴장 고조, 비상 대응**
- 민주당은 한동훈 대표의 입장 변화 이후 긴급 의원총회를 소집해 당내 의견을 수렴.
- 민주당은 최근 정치인 체포 시도, 내란 사태 등으로 상황이 매우 긴박하다고 판단, 비상 대응에 나섬.

**3. 표결 시점 조정 가능성**
- 민주당은 표결을 기존 7일 오후 7시에서 2시간 앞당긴 오후 5시에 진행하는 방안도 논의 중.
- 국민의힘이 표결 지연 전략을 쓸 가능성에 대비해 시간 조정 검토.

**4. 결론**
- 민주당은 한동훈 대표의 입장 확인과 상황 변화에 따라 탄핵소추안 표결 시점 조정 등 신속하고 신중한 대응을 모색하고 있음. 아직 최종 결정은 내리지 않은 상태임.

 gpt-4o 토큰수:  189
gpt-4.1 토큰수:  533


In [30]:
# 모델별 가격(2025년 6월 기준, 1M=1,000,000 토큰)
PRICING = {
    "gpt-4.1": {
        "input": 2.00,    # $2.00 / 1M input tokens
        "output": 8.00    # $8.00 / 1M output tokens
    },
    "gpt-4.1-mini": {
        "input": 0.40,    # $0.40 / 1M input tokens
        "output": 1.60    # $1.60 / 1M output tokens
    },
    "gpt-4.1-nano": {
        "input": 0.10,    # $0.10 / 1M input tokens
        "output": 0.40    # $0.40 / 1M output tokens
    },
    "o1": {
        "input": 2.00,    # $2.00 / 1M input tokens
        "output": 8.00    # $8.00 / 1M output tokens
    },
    "o3": {
        "input": 2.00,    # $2.00 / 1M input tokens
        "output": 8.00    # $8.00 / 1M output tokens
    },
    "o4-mini": {
        "input": 1.10,    # $1.10 / 1M input tokens
        "output": 4.40    # $4.40 / 1M output tokens
    },
    "gpt-4o": {
        "input": 2.50,    # $2.50 / 1M input tokens
        "output": 10.00   # $10.00 / 1M output tokens
    },
    "gpt-4o-mini": {
        "input": 0.15,    # $0.15 / 1M input tokens
        "output": 0.60    # $0.60 / 1M output tokens
    }
}


def count_tokens(text, model):
  if model == 'gpt-4.1':
    encoding = tiktoken.get_encoding('cl100k_base')
  else:
    encoding = tiktoken.encoding_for_model(model)

  encoded = encoding.encode(text)
  return len(encoded)


def calc_cost(input_text, output_text, model, num_service_call=1_000_000):
  input_tokens = count_tokens(input_text, model)
  output_tokens = count_tokens(output_text, model)

  # 모델별 단가 가져오기
  price = PRICING[model]

  # 비용계산
  input_cost = (input_tokens / num_service_call) * price['input']
  output_cost = (output_tokens / num_service_call) * price['output']

  total_cost = (input_cost + output_cost) * num_service_call

  return total_cost

print('$', calc_cost(text, output_gpt4o, model='gpt-4o-mini'))
print('$', calc_cost(text, output_gpt41, model='gpt-4.1'))

$ 203.85
$ 8317.999999999998
