# Chat Completions API

Chat Completions API는 OpenAI에서 제공하는 대화형 인공지능 모델(GPT 계열)을 활용해, 사용자의 메시지에 대해 자연스러운 대화 응답을 생성하는 API이다. 이 API는 챗봇, AI 비서, 자동화된 상담 시스템 등 다양한 대화형 서비스에 적용할 수 있다.


- **대화 문맥 유지**  
  Chat Completions API는 여러 메시지(대화 내역)를 입력받아, 이전 대화의 맥락을 이해하고 그에 맞는 응답을 생성한다. 즉, 단순히 한 문장만을 이어 쓰는 것이 아니라, 대화의 흐름을 반영하여 자연스러운 대화를 이어갈 수 있다.

- **역할(Role) 기반 메시지 구조**  
  입력 메시지는 배열 형태로 전달하며, 각 메시지는 `role`과 `content`로 구성된다.  
  - `system`: AI의 태도, 성격, 역할을 정의(예: "너는 친절한 도우미야.")
  - `user`: 사용자의 질문이나 요청
  - `assistant`: AI의 응답(이전 대화 내용 포함 가능)
  
  이 구조를 통해 AI의 응답 스타일이나 맥락을 세밀하게 제어할 수 있다[1][3][5].

**주요 파라미터 설명**

| 파라미터        | 설명                                                                 |
|----------------|----------------------------------------------------------------------|
| model          | 사용할 언어 모델명 (예: gpt-3.5-turbo, gpt-4o 등)                    |
| messages       | 대화 내역(역할/내용 포함) 배열                                        |
| max_tokens     | 생성할 응답의 최대 토큰 수(선택)                                     |
| temperature    | 창의성 조절(0~2, 낮을수록 일관성↑, 높을수록 다양성↑, 선택)           |
| top_p          | 누적 확률 기반 샘플링(temperature와 유사, 선택)                      |
| n              | 한 번에 생성할 응답 개수(선택)                                       |
| stop           | 응답 생성을 중단할 문자열 목록(선택)                                 |
| presence_penalty, frequency_penalty | 반복 억제 및 창의성 유도(선택)                 |
| user           | 사용자 식별자(선택, abuse monitoring 등 활용)                        |


- 위 예시에서 `messages` 배열에는 대화의 모든 메시지가 순서대로 들어가야 한다.  
- OpenAI는 이전 요청을 기억하지 않기 때문에, 매 API 호출마다 대화 내역 전체를 함께 보내야 한다.

In [3]:
import os
from google.colab import userdata
from openai import OpenAI

# OPENAI_API_KEY=userdata.get("OPENAI_API_KEY")

# client=OpenAI(api_key=OPENAI_API_KEY)

#환경변수 지정
os.environ["OPENAI_API_KEY"]=userdata.get("OPENAI_API_KEY")
client=OpenAI()

## 대화형 챗봇


In [9]:
response=client.chat.completions.create(
    model='gpt-4o-mini',
    messages=[
        {'role':'system','content':'너는 친절한 챗봇입니다.'},
        {'role':'user','content':'안녕 내이름은 유연석이야~'},
        {'role':'assistant','content':'안녕하세요, 유연석님! 만나서 반가워요! 어떻게 도와드릴까요?'},
        {'role':'user','content':'잘 지냈어? 내이름 기억하니?'}
    ]
)
print(response.choices[0].message.content)

네, 유연석님! 이름 잘 기억하고 있어요. 잘 지내셨어요? 어떤 이야기 나누고 싶으세요?


In [22]:
response = client.chat.completions.create(
    model='gpt-4o-mini',
    messages=[
        {'role': 'system', 'content': '너는 LLM 전문가입니다.'},
        {'role': 'user', 'content': '안녕, 나는 LLM 꿈나무 차은우야~'},
        {'role': 'assistant', 'content': '안녕하세요, 차은우님! LLM 꿈나무라니 멋지네요! 어떤 부분에 대해 이야기하고 싶으신가요? LLM에 대한 질문이나 궁금한 점이 있다면 언제든지 말씀해 주세요.'},
        {'role': 'user', 'content': 'Transformer모델을 공부하고 싶어.'},
        {'role': 'assistant', 'content': """좋아요! Transformer 모델은 자연어 처리(NLP) 분야에서 매우 중요한 혁신을 가져온 아키텍처입니다. 기본적인 구조와 작동 원리를 설명해드릴게요.

### 1. Transformer의 기본 구조
Transformer는 크게 두 가지 부분으로 구성되어 있습니다: **인코더(Encoder)**와 **디코더(Decoder)**.

- **인코더**: 입력 문장을 처리하고, 문장의 의미를 포착하는 고차원 표현을 생성합니다.
- **디코더**: 인코더의 출력을 바탕으로 출력 문장을 생성합니다. 주로 번역, 텍스트 요약 등에 사용됩니다.

### 2. 자기 주의 메커니즘 (Self-Attention)
Transformer의 핵심 개념 중 하나는 자기 주의 메커니즘입니다. 이는 입력 시퀀스 내의 단어들이 서로에게 얼마나 주의를 기울이는지를 학습하는 방법입니다. 이를 통해 문맥을 더 잘 이해할 수 있습니다.

### 3. 포지셔널 인코딩 (Positional Encoding)
Transformers는 순차적인 정보를 처리하지 않기 때문에 단어의 순서를 이해하기 위한 포지셔널 인코딩을 사용합니다. 이를 통해 단어의 위치 정보를 추가합니다.

### 4. 다중 헤드 주의 (Multi-head Attention)
Transformer는 하나의 자기 주의 메커니즘 대신 여러 개의 주의 헤드를 사용하여 서로 다른 표현을 학습합니다. 각 헤드는 다른 부분에 초점을 맞출 수 있어 정보의 다양성을 높입니다.

### 5. 피드포워드 신경망
각 인코더와 디코더의 구조에는 자기 주의 레이어 뒤에 위치한 피드포워드 신경망이 있습니다. 이는 각 단어의 표현을 독립적으로 처리하는 역할을 합니다.

### 6. Layer Normalization & Residual Connections
모든 레이어에는 레이어 정규화와 잔차 연결이 포함되어 있어, 훈련이 더 쉽게 이루어지도록 돕습니다.

### 학습 방법
Transformer 모델은 대량의 데이터를 통해 사전 학습(pre-training)되고, 특정 작업에 대해 미세 조정(fine-tuning)됩니다. 여러 가지 변종이 있으며, BERT, GPT 같은 모델들이 이 구조를 기반으로 하고 있습니다.

이해가 잘 되셨나요? 더 궁금한 부분이나 구체적인 질문이 있다면 말씀해 주세요!
"""},
        {'role': 'user', 'content': '어려워~ 어텐션을 초등학생도 이해할 수 있게 설명해줘.'},
        {'role': 'assistant', 'content': """물론이죠! 어텐션(attention)을 초등학생도 이해할 수 있게 쉽게 설명해볼게요.

### 어텐션을 설명하는 이야기

상상해보세요! 여러분이 친구들과 함께 학교에서 이야기를 나누고 있다고 합시다. 그 많은 친구들 중에서 누군가가 아주 중요한 이야기를 하고 있어요. 여러분은 그 친구의 말을 잘 듣고 싶어서 그 친구에게 집중합니다. 반면, 주변의 다른 소리나 대화는 잘 듣지 않으려고 해요. 이런 식으로 우리는 중요한 정보에 주의를 기울이고, 다른 것들은 잠깐 잊어버리는 거예요.

### 어텐션은 같아요!

어텐션은 컴퓨터가 텍스트를 읽을 때 어떻게 중요한 단어에 집중하는지를 설명하는 방법이에요. 예를 들어, "내가 어제 강아지와 함께 놀았어요"라는 문장이 있다고 해볼까요. 이 문장에서 "강아지"라는 단어는 이야기에 중요한 부분이에요. 어텐션 메커니즘은 이 "강아지"라는 단어에 더 많은 주의를 기울이고, 나머지 단어는 그만큼 덜 신경 쓰는 거죠.

### 간단한 예시

이제 조금 더 구체적인 예를 들어볼게요. 만약 여러분이 "사과는 빨갛고 맛있다"라는 문장을 읽고 있을 때, 어텐션은 "사과"라는 단어에 특히 주목하게 해요. 왜냐하면 이 단어가 문장에서 가장 중요한 의미를 갖고 있기 때문이죠.

어텐션은 이처럼 중요한 정보를 찾아내어 컴퓨터가 더 똑똑하게 텍스트를 이해하도록 도와주는 역할을 해요.

이해가 안 되거나 더 알고 싶은 부분이 있다면 언제든지 물어보세요!
"""},
        {'role':'user', 'content':'이해가 되는 것같아. 트랜스포머 내용을 요약해서 하나의 markdown문서로 정리해줘'}
    ]
)
print(response.choices[0].message.content)

물론입니다! Transformer에 대한 내용을 요약한 Markdown 문서를 아래에 작성해드릴게요.

```markdown
# Transformer 모델 개요

Transformer는 자연어 처리(NLP) 분야에서 혁신적인 모델로, 인코더와 디코더 구조를 사용하여 정보를 처리합니다.

## 1. 기본 구조

- **인코더 (Encoder)**: 입력 문장을 처리하여 고차원 표현을 생성합니다.
- **디코더 (Decoder)**: 인코더의 출력을 바탕으로 최종 출력을 생성합니다.

## 2. 주요 개념

### 자기 주의 메커니즘 (Self-Attention)
- 입력 시퀀스의 각 단어가 다른 단어에 얼마나 주의를 기울이는지를 학습합니다.
- 단어 간의 관계를 이해하도록 도와줍니다.

### 포지셔널 인코딩 (Positional Encoding)
- 단어의 순서를 인식하기 위해 사용됩니다.
- 주로 위치 정보를 추가하여 순서 관계를 파악합니다.

### 다중 헤드 주의 (Multi-head Attention)
- 여러 개의 주의 헤드를 사용하여 다양한 표현을 학습합니다.
- 각 헤드가 서로 다른 부분에 초점을 맞출 수 있습니다.

### 피드포워드 신경망
- 각 인코더와 디코더의 구성에 포함되어 있습니다.
- 입력을 독립적으로 처리합니다.

### 레이어 정규화 & 잔차 연결
- 학습을 더 쉽게 하기 위해 사용됩니다.
- 각 레이어의 출력을 개선합니다.

## 3. 학습 방법
- **사전 학습 (Pre-training)**: 대량의 데이터로 모델을 훈련합니다.
- **미세 조정 (Fine-tuning)**: 특정 작업에 맞게 모델을 조정합니다.

## 4. 대표 모델
- BERT: 양방향 인코딩을 통해 문맥을 이해합니다.
- GPT: 텍스트 생성을 위한 주목받는 모델입니다.

## 결론
Transformer 모델은 자연어 처리의 많은 문제를 해결하는 데 강력한 도구로 자리잡고 있으며, 다양한 변형들이 연구되고 있습니다.
```

이 마크다운 문서를 통해 Tra

## 반복처리

In [21]:
# 대화내역을 로깅
messages = [
    {'role': 'system', 'content': '너는 친절한 챗봇이다.'}
]

print('종료하려면, exit를 입력하세요...')
while True:
    # 사용자 입력
    user_input = input('User: ')

    if user_input.strip().lower() == 'exit':
        print('채팅을 종료합니다...')
        break

    # messages에 사용자 입력 추가
    messages.append({'role': 'user', 'content': user_input})

    # LLM 요청
    response = client.chat.completions.create(
        model='gpt-4.1',
        messages=messages,
        temperature=1
    )
    assistant_message = response.choices[0].message.content
    print(f'Assistant: {assistant_message}')

    # messages 챗봇 출력 추가
    messages.append({'role': 'assistant','content': assistant_message})

종료하려면, exit를 입력하세요...
User: 안녕
Assistant: 안녕하세요! 만나서 반가워요 😊  
오늘은 어떤 이야기를 나눠볼까요?
User: 맘스터치 메뉴 알려줘
Assistant: 물론이죠! 맘스터치는 대표적인 치킨버거, 치킨, 사이드 메뉴로 유명한 패스트푸드 브랜드예요. 2024년 6월 기준 맘스터치의 주요 메뉴를 소개해드릴게요.

---

### 🍔 대표 버거 메뉴
- 싸이버거
- 언빌리버블버거
- 인크레더블버거
- 딥치즈버거
- 불싸이버거
- 휠렛버거
- 화이트갈릭버거
- 새우버거

### 🍗 치킨/치킨팩
- 후라이드치킨
- 양념치킨
- 간장마늘치킨
- 마라치킨 (기간 한정)
- 싸이순살
- 치킨텐더
- 치즈볼

### 🍟 사이드/SET 메뉴
- 후렌치프라이
- 케이준양념감자
- 코울슬로
- 맘스콘 (콘샐러드)
- 치즈스틱
- 치즈볼
- 에그타르트

### 🥤 음료/디저트
- 콜라, 사이다, 환타, 망고에이드 등

---

**참고:**  
지점별 메뉴가 살짝 다를 수 있으니, 방문 전에 공식 홈페이지나 앱, 배달앱에서 자세한 메뉴와 가격을 확인하는 게 가장 정확해요!

혹시 특정 메뉴 칼로리, 추천 메뉴, 세트 구성 등 더 궁금한 게 있나요? 😊


KeyboardInterrupt: Interrupted by user

## streamlit

In [28]:
stream=client.chat.completions.create(
    model='gpt-4o-mini',
    messages=[{'role':'user','content':'지금 stream테스트할거야,아주 긴 응답 메시지를 보내줘.'}],
    stream=True
)
for chunk in stream:
    content=chunk.choices[0].delta.content
    if content is not None:
        print(content,end='')

물론입니다! 아래는 긴 응답 메시지의 예시입니다.

---

안녕하세요! 이 메시지는 긴 응답 테스트를 위한 것입니다. 많은 정보를 포함하여 여러 주제에 걸쳐 이야기해 보겠습니다.

**1. 일상생활:** 
매일 아침 눈을 뜨고 일어나는 것은 많은 사람들에게 일상적인 루틴입니다. 아침을 먹고, 세수를 하고, 옷을 입는 등 준비를 하는 과정은 다양한 사람들의 하루를 시작하는 중요한 부분이죠. 아침식사는 뇌의 에너지를 공급하고 하루의 생산성을 높이는 데 도움이 됩니다. 영양가 있는 식사를 하는 것이 중요하며, 과일, 채소, 단백질이 포함된 균형 잡힌 식사가 좋은 선택입니다.

**2. 업무 환경:** 
많은 직장에서 재택근무가 일반화되면서 업무 환경이 변화하고 있습니다. 재택근무는 유연한 근무 시간을 제공할 수 있지만, 자기 관리를 철저히 해야 효율성을 유지할 수 있습니다. 커뮤니케이션 도구를 활용하여 팀원들과 소통하는 것도 중요합니다. Slack, Zoom, Microsoft Teams와 같은 플랫폼들은 팀 내 협업을 더욱 원활하게 만들어 줍니다.

**3. 여행:** 
여행은 새로운 문화를 경험하고 다양한 사람들을 만나는 기회를 제공합니다. 여름 휴가는 많은 사람들이 기다리는 시간 중 하나입니다. 해변, 산, 도시 탐험 등 다양한 목적지에서 할 수 있는 활동들이 많습니다. 여행 계획을 세울 때는 숙소 예약은 물론 교통편과 현지 음식을 고려하는 것도 좋은 경험을 위해 중요합니다.

**4. 건강과 운동:** 
건강 유지는 우리 삶에서 매우 중요한 요소입니다. 규칙적인 운동은 신체 건강뿐만 아니라 정신 건강에도 긍정적인 영향을 줍니다. 걷기, 수영, 요가와 같은 다양한 운동 방법이 있으며, 본인의 라이프스타일에 맞는 운동을 선택하는 것이 중요합니다.

**5. 취미 생활:** 
추가적인 여가 시간을 활용하여 취미 생활을 즐기는 것은 스트레스를 해소하고 창의성을 높이는 데 좋은 방법입니다. 사진 촬영, 그림 그리기, 글쓰기, 정원 가꾸기 등의 다양한 취미가 있습니다

In [30]:
from openai import OpenAI

client = OpenAI()

# 대화 내역 저장
messages = [
    {"role": "system", "content": "너는 친절한 챗봇이다."}
]

print("종료하려면, exit를 입력하세요...")

while True:
    user_input = input("User: ")

    if user_input.strip().lower() == "exit":
        print("채팅을 종료합니다...")
        break

    # messages에 사용자 입력 추가
    messages.append({'role': 'user', 'content': user_input})

    print("Assistant: ", end='', flush=True)

    # 스트리밍 응답 받기
    stream = client.chat.completions.create(
        model="gpt-4o",
        messages=messages,
        stream=True,
        temperature=1
    )

    print(f'Assistant: ',end='')
    for chunk in stream:
        content = chunk.choices[0].delta.content
        if content is not None:
            print(content, end='', flush=True) #내부 buffer  사용하지 않음


    print()  # 줄바꿈

    # assistant 응답 메시지를 messages에 추가
    messages.append({"role": "assistant", "content": assistant_content})


종료하려면, exit를 입력하세요...
User: 안녕
Assistant: Assistant: 안녕하세요! 어떻게 도와드릴까요?
User: 스트림릿에대해 설명해줘
Assistant: Assistant: Streamlit은 파이썬을 사용하여 데이터 애플리케이션을 빠르게 만들 수 있도록 도와주는 오픈 소스 라이브러리입니다. 데이터 과학자, 머신러닝 엔지니어, 애널리스트들이 주로 사용하며, 웹 애플리케이션을 간단하게 생성하고 배포할 수 있게 해줍니다. 주요 특징은 다음과 같습니다:

1. **간단한 사용법**: Streamlit은 복잡한 웹 개발 지식 없이도 쉽게 사용할 수 있습니다. 몇 줄의 파이썬 코드만으로 대화형 애플리케이션을 만들 수 있습니다.

2. **자동 업데이트**: 코드를 저장할 때마다 애플리케이션이 자동으로 업데이트됩니다. 이를 통해 개발자는 즉각적인 피드백을 받을 수 있습니다.

3. **풍부한 위젯 지원**: 슬라이더, 선택 항목, 체크박스 등 다양한 대화형 위젯을 제공하여 사용자 입력을 쉽게 받을 수 있습니다.

4. **데이터 시각화**: Plotly, Matplotlib, Altair와 같은 시각화 라이브러리를 쉽게 통합하여 데이터를 효과적으로 시각화할 수 있습니다.

5. **쉽게 배포 가능**: Streamlit Cloud나 다른 클라우드 서비스에서 쉽게 애플리케이션을 배포할 수 있습니다.

Streamlit은 프로토타입을 빠르게 만들고, 데이터 분석 결과를 쉽게 시각화하며, 팀원이나 외부와 쉽게 공유하려는 경우 매우 유용한 도구입니다.
User: 몇일이야?
Assistant: Assistant: 오늘 날짜를 확인하려면 사용 중인 장치나 시스템의 달력을 참고하세요. 저는 현재 실시간 정보를 확인할 수 있는 기능이 없기 때문에 정확한 날짜를 제공할 수 없습니다. 죄송합니다!


KeyboardInterrupt: Interrupted by user

# Token counting

((입출력 토큰수 * 단가) + (출력 토큰수 * 단가)) * 월 서비스 호출수

In [31]:
!pip install tiktoken




In [39]:
# 각 모델에 따른 토커나이져(인코딩) 가져오기
import tiktoken
gpt35=tiktoken.encoding_for_model('gpt-3.5')
gpt4o=tiktoken.encoding_for_model('gpt-4o') #gpt-4o,gpt-4o-mini
# gpt41=tiktoken.encoding_for_model('gpt-4.1')
gpt41=tiktoken.get_encoding('cl100k_base')

print(gpt35)
print(gpt4o)
print(gpt41)

<Encoding 'cl100k_base'>
<Encoding 'o200k_base'>
<Encoding 'cl100k_base'>


In [40]:
# 토큰수 세기
encoded_gpt35=gpt35.encode('아버지가 방에 들어가신다.')
encoded_gpt_4o=gpt4o.encode('아버지가 방에 들어가신다.')
print(len(encoded_gpt35))
print(len(encoded_gpt_4o))

13
10


## 토큰비용 계산하기

In [41]:
text = """
더불어민주당이 6일 한동훈 국민의힘 대표가 윤석열 대통령 탄핵에 사실상 찬성 입장을 시사하자 7일로 예정됐던 윤석열 대통령의 탄핵소추안 표결을 앞당기는 방안을 고심하고 있다. 이재명 민주당 대표는 “한 대표의 입장을 정확하게 파악하는 것이 우선”이라며 신중한 태도를 보였다.

이 대표는 이날 기자들을 만나 윤 대통령 탄핵 표결을 앞당기는 방안에 대해 “지금 저렇게 불확실한 얘기를 믿고 미리 당겨서 협의를 할 필요가 있는가, 그런 생각이 일단 든다”고 말했다. 한 대표와의 회동 가능성에 대해서는 “요청은 했는데 아직 결정을 통보받지 못했다. (한 대표 측에서) 오후에 다시 연락하자는 연락이 왔다”고 전했다.

이 대표는 또 “사실 오늘 밤이 저는 매우 위험하다고 생각이 드는데, 제가 가진 감으로 본다면 오늘 밤 새벽에 또 뭔가 일을 벌이지 않을까 그런 걱정이 들긴 한다”며 ‘2차 계엄’ 가능성을 우려했다.

민주당은 이날 오전 한동훈 대표가 “윤 대통령의 조속한 직무 집행 정지가 필요하다”며 입장을 선회하자 긴급 의원총회를 열고 당내 의견 수렴에 나섰다. 의원총회에서는 탄핵소추안 표결 시점을 앞당기는 방안도 논의될 전망이다.

노종면 원내대변인은 비공개 최고위원 간담회가 끝난 뒤 “한 대표의 입장이 보도된 이후 긴장감이 높아지고 있고, 12월 3일 당일에 짐작했던 것 이상으로 치밀하게 의원, 정치인 체포 시도가 있었던 것과 이번 내란 사태에서 매우 중요한 작전이었던 걸로 파악되고 있다”며 “윤 대통령 옹위 세력이 어떻게 나올지 모르는 상황이라고 판단해 이런 비상한 상황 인식 떄문에 긴급 의원총회를 소집했다”고 전했다.

탄핵소추안 표결 시점 변경에 대해서는 “의장실에 본회의 일정 변경을 요청한 바는 아직 없다”며 “일단 신중하고 침착하게 대응할 것이고, 지금 한 대표 쪽의 입장이 뭔지 정확하게 파악하는 것이 우선이다. 필요하면 본회의를 앞당기는 방안도 의장실과 협조해서 추진할 수 있지만 아직은 결정된 바 없다”고 밝혔다.

민주당에서는 7일 오후 7시로 예정됐던 표결을 2시간 당겨 오후 5시에 추진하는 방안도 거론된다. 박성준 원내운영수석부대표는 이날 MBC 라디오 ‘김종배의 시선집중’ 인터뷰에서 “당초 오후 7시 정도 표결을 예상했는데 5시 정도는 해야 한다고 보고 있다”며 “국민의힘에서 탄핵소추안 투표 관련 상당한 지연 전략을 펼쳐서 시간을 늦출 수 있는 상황까지 고려하고 있다”고 설명했다.
"""
encoded_text_gpt4o=gpt4o.encode(text)
encoded_text_gpt41=gpt41.encode(text)

print("gpt-4o 토큰수: ",len(encoded_text_gpt4o))
print("gpt-4.1 토큰수:",len(encoded_text_gpt41))


gpt-4o 토큰수:  703
gpt-4.1 토큰수: 1215


In [43]:
response_gpt4o = client.chat.completions.create(
    model='gpt-4o',
    messages=[
        {'role': 'system', 'content': '너는 똑부러지는 시사/경제 전문가로써, 제공된 뉴스기사의 핵심을 잘 요약해서 정리해주는 챗봇이야.'},
        {'role': 'user', 'content': text}
    ],
    temperature=.2
)

response_gpt41 = client.chat.completions.create(
    model='gpt-4.1',
    messages=[
        {'role': 'system', 'content': '너는 똑부러지는 시사/경제 전문가로써, 제공된 뉴스기사의 핵심을 잘 요약해서 정리해주는 챗봇이야.'},
        {'role': 'user', 'content': text}
    ],
    temperature=.2
)

output_gpt4o = response_gpt4o.choices[0].message.content
output_gpt41 = response_gpt41.choices[0].message.content

print("gpt-4o 응답: ", output_gpt4o)
print("gpt-4.1 응답: ", output_gpt41)

print('\n', 'gpt-4o 토큰수: ', len(gpt4o.encode(output_gpt4o)))
print('gpt-4.1 토큰수: ', len(gpt41.encode(output_gpt41)))

gpt-4o 응답:  더불어민주당은 한동훈 국민의힘 대표가 윤석열 대통령의 탄핵에 사실상 찬성하는 입장을 시사하자, 7일로 예정된 탄핵소추안 표결을 앞당기는 방안을 검토하고 있습니다. 이재명 민주당 대표는 한 대표의 입장을 정확히 파악하는 것이 우선이라며 신중한 태도를 보였습니다. 민주당은 한 대표의 입장 변화에 따라 긴급 의원총회를 열어 당내 의견을 수렴하고 있으며, 표결 시점을 오후 5시로 앞당기는 방안도 논의 중입니다. 그러나 아직 본회의 일정 변경 요청은 하지 않았고, 상황을 신중하게 대응할 계획입니다.
gpt-4.1 응답:  ### 기사 핵심 요약

**1. 민주당, 윤석열 대통령 탄핵소추안 표결 앞당길지 고심**
- 한동훈 국민의힘 대표가 윤 대통령 탄핵에 사실상 찬성하는 듯한 입장을 내비치자, 더불어민주당이 7일로 예정된 탄핵소추안 표결을 앞당기는 방안을 논의 중임.
- 이재명 민주당 대표는 한동훈 대표의 정확한 입장 파악이 우선이라며 신중한 태도를 보임.

**2. 긴장 고조, 비상 대응**
- 민주당은 한동훈 대표의 발언 이후 긴급 의원총회를 소집해 당내 의견을 수렴하고 있음.
- 노종면 원내대변인은 최근 정치인 체포 시도와 내란 사태 등으로 비상 상황 인식이 높아졌다고 설명.

**3. 표결 시점 조정 가능성**
- 민주당은 7일 오후 7시로 예정된 표결을 오후 5시로 앞당기는 방안도 검토 중.
- 국민의힘이 표결 지연 전략을 쓸 가능성에 대비해 시간 조정 논의가 이뤄지고 있음.

**4. 결론**
- 민주당은 한동훈 대표의 입장 변화와 국민의힘의 대응을 주시하며, 탄핵소추안 표결 시점 조정 등 신속하고 신중한 대응을 모색하고 있음.

 gpt-4o 토큰수:  161
gpt-4.1 토큰수:  525


In [46]:
# 모델별 가격(2025년 6월 기준, 1M=1,000,000 토큰)
PRICING = {
    "gpt-4.1": {
        "input": 2.00,    # $2.00 / 1M input tokens
        "output": 8.00    # $8.00 / 1M output tokens
    },
    "gpt-4.1-mini": {
        "input": 0.40,    # $0.40 / 1M input tokens
        "output": 1.60    # $1.60 / 1M output tokens
    },
    "gpt-4.1-nano": {
        "input": 0.10,    # $0.10 / 1M input tokens
        "output": 0.40    # $0.40 / 1M output tokens
    },
    "o1": {
        "input": 2.00,    # $2.00 / 1M input tokens
        "output": 8.00    # $8.00 / 1M output tokens
    },
    "o3": {
        "input": 2.00,    # $2.00 / 1M input tokens
        "output": 8.00    # $8.00 / 1M output tokens
    },
    "o4-mini": {
        "input": 1.10,    # $1.10 / 1M input tokens
        "output": 4.40    # $4.40 / 1M output tokens
    },
    "gpt-4o": {
        "input": 2.50,    # $2.50 / 1M input tokens
        "output": 10.00   # $10.00 / 1M output tokens
    },
    "gpt-4o-mini": {
        "input": 0.15,    # $0.15 / 1M input tokens
        "output": 0.60    # $0.60 / 1M output tokens
    }
}

def count_tokens(text, model):
    if model == 'gpt-4.1':
        encoding = tiktoken.get_encoding('cl100k_base')
    else:
        encoding = tiktoken.encoding_for_model(model)
    encoded = encoding.encode(text)
    return len(encoded)

def calc_cost(input_text, output_text, model, num_service_call=1_000_000):
    input_tokens = count_tokens(input_text, model)
    output_tokens = count_tokens(output_text, model)

    # 모델별 단가 가져오기
    price = PRICING[model]

    # 비용계산
    input_cost = (input_tokens / 1_000_000) * price['input']
    output_cost = (output_tokens / 1_000_000) * price['output']

    total_cost = (input_cost + output_cost) * num_service_call
    return total_cost

print('$',calc_cost(text, output_gpt4o, model='gpt-4o-mini'))
print('$',calc_cost(text, output_gpt41, model='gpt-4.1'))


$ 202.05
$ 6630.0
