# Chat Completion

In [1]:
# 환경설정

from dotenv import load_dotenv

load_dotenv()

True

In [2]:
import os

OPENAI_API_KEY = os.getenv('OPENAI_API_KEY')

In [12]:
from openai import OpenAI

client = OpenAI(api_key = OPENAI_API_KEY)

response = client.chat.completions.create(
    model = 'gpt-4o-mini',
    messages = [
        {
            "role" : "system",
            "content" : "넌 친절하고, 상세한 설명을 잘하는 챗봇이야."
        },
        {
            "role" : "user",
            "content" : "안녕 내이름은 문이야"
        },
        {
            "role" : "assistant",
            "content" : "안녕하세요, 문님! 만나서 반갑습니다. 어떻게 도와드릴까요?"
        },
        {
            "role" : "user",
            "content" : "내이름이 뭔지 기억해?"
        }
    ],
    temperature=1,
    max_tokens=4096,
    top_p=1
)

print(response.choices[0].message.content)

네, 문님이라고 말씀하셨습니다! 계속해서 도움이 필요하시면 언제든지 말씀해 주세요.


## stream 처리

In [14]:
client = OpenAI()   # api_key를 작성하지 않으면, 자동으로 환경변수 OPENAI_API_KEY를 참조

stream_response = client.chat.completions.create(
    model = "gpt-4o-mini",
    messages = [
        {
            "role" : "user",
            "content" : "스트림 테스트하는데, 긴 응답메세지를 보내"
        }
    ],
    stream = True   # 생성되는 단어(토큰)조각들을 실시간으로 계속해서 보내준다.
)

for chunk in stream_response:
    if chunk.choices[0].delta.content is not None:
        print(chunk.choices[0].delta.content, end="")

print("응답 완료 ⭕")

물론입니다! 스트림 테스트를 위해 긴 응답 메시지를 준비했습니다. 다음은 예시입니다:

---

안녕하세요! 이 메시지는 스트림 테스트를 위한 것입니다. 스트리밍 기술은 데이터가 계속해서 흐르는 형태로 전송되는 것을 의미하며, 다양한 애플리케이션에서 사용됩니다. 예를 들어, 실시간 비디오 스트리밍, 온라인 게임, 데이터 분석 등에서 활용됩니다. 현재 세계는 데이터의 양이 급격히 증가하고 있으며, 이를 효과적으로 처리하는 것이 점점 더 중요해지고 있습니다.

스트리밍 데이터는 연속적으로 생성되는 데이터를 실시간으로 처리하는 방식으로, 이를 통해 사용자는 항상 최신 정보를 받을 수 있습니다. 스트리밍 플랫폼의 예로는 Apache Kafka, Apache Flink, Amazon Kinesis 등이 있으며, 이러한 플랫폼들은 대규모 데이터를 실시간으로 처리하고 분석할 수 있는 기능을 제공합니다.

또한, 스트리밍 데이터의 처리 기술은 이벤트 기반 아키텍처 및 마이크로서비스의 발전과 함께 중요성이 더욱 커지고 있습니다. 이러한 기술들은 시스템의 응답성을 높이고, 사용자 경험을 향상시키는 데 기여합니다.

이제, 스트리밍의 주제에 대해 몇 가지 핵심 개념을 말씀드리겠습니다:

1. **데이터 흐름**: 스트리밍 처리에서는 데이터가 지속적으로 생산되고 소비됩니다. 이는 데이터를 실시간으로 분석하고 반응할 수 있게 합니다.

2. **지연 시간**: 스트리밍 시스템의 성능은 데이터 전송의 지연 시간에 크게 의존합니다. 가능한 한 낮은 지연 시간을 유지하는 것이 중요합니다.

3. **스케일링**: 스트리밍 애플리케이션은 수많은 데이터 소스를 동시에 처리할 수 있어야 합니다. 따라서 수평적 확장이 용이한 구조가 필요합니다.

4. **패턴 인식**: 스트리밍 데이터에서 패턴을 식별하기 위한 알고리즘이 중요합니다. 이를 통해 예측 분석 및 실시간 경고 시스템을 구축할 수 있습니다.

마지막으로, 스트리밍 애플리케이션을 설계할 때는 데이터의 품질, 보안, 내구성 등을 고려해야 

### Token Counting

- 온라인 테스트 : http://platform.openai.com/tokenizer
- 파이썬 테스트 : tiktoken

In [15]:
%pip install tiktoken

Collecting tiktoken
  Downloading tiktoken-0.12.0-cp312-cp312-win_amd64.whl.metadata (6.9 kB)
Collecting regex>=2022.1.18 (from tiktoken)
  Downloading regex-2025.11.3-cp312-cp312-win_amd64.whl.metadata (41 kB)
Downloading tiktoken-0.12.0-cp312-cp312-win_amd64.whl (878 kB)
   ---------------------------------------- 0.0/878.7 kB ? eta -:--:--
   ----------------------------------- ---- 786.4/878.7 kB 4.8 MB/s eta 0:00:01
   ---------------------------------------- 878.7/878.7 kB 4.0 MB/s  0:00:00
Downloading regex-2025.11.3-cp312-cp312-win_amd64.whl (277 kB)
Installing collected packages: regex, tiktoken

   -------------------- ------------------- 1/2 [tiktoken]
   ---------------------------------------- 2/2 [tiktoken]

Successfully installed regex-2025.11.3 tiktoken-0.12.0
Note: you may need to restart the kernel to use updated packages.


In [18]:
import tiktoken

gpt35 = tiktoken.encoding_for_model("gpt-3.5-turbo")
gpt4o = tiktoken.encoding_for_model("gpt-4o")

In [25]:
text = """
철도·지하철 파업 예고…서울시 "1~8호선 출근시간대 운행률 100%"
지하철 1·3·4호선 18회 증회 및 5편성 비상 대기
시내버스·출퇴근 맞춤버스 집중배차 시간 1시간씩 연장
정민구 기자입력 2025.12.22 10:07댓글 0

서울시는 전국철도노동조합(이하 철도노조)이 12월 23일 오전 9시부터 파업을 예고함에 따라 시민 불편을 최소화하기 위한 비상수송대책을 추진한다. 정부합동 비상대책본부가 22일 오전 9시부터 운영됨에 따라 시는 관내 지하철과 버스 운행 지원, 현장 관리 등을 지속적으로 모니터링할 계획이다. 서울시와 서울교통공사, 코레일 등 유관기관은 24시간 연락 체계를 유지하며 비상수송에 대응한다.

코레일 파업으로 인한 수도권 광역전철의 운행률 감소에 대비해 서울교통공사가 운영하는 지하철 1·3·4호선 구간의 열차 운행을 평일과 공휴일 모두 18회 증회한다. 증회 운영 구간은 1호선 ‘서울역~청량리’, 3호선 ‘구파발~오금’, 4호선 ‘당고개~사당’ 구간이다.

시는 이번 증회로 일일 3만 6천 명의 추가 수송이 가능할 것으로 보고 있으며, 승객 급증 등 만일의 사태에 대비해 전동차 5편성을 비상 대기시킨다. 한편 서울교통공사가 운영하는 1~8호선 전체 노선과 9호선, 신림선, 우이신설선 등 민자철도는 모두 정상 운행한다.

시내버스는 지하철 이용이 어려운 시민들을 위해 대체 교통편을 확대한다. 344개 일반 노선의 출퇴근 집중배차 시간대를 평소보다 1시간씩 연장해 운영한다. 이에 따라 출근 시간대는 오전 6시부터 9시까지, 퇴근 시간대는 오후 5시부터 8시까지 배차를 집중한다. 또한 17개 노선의 출퇴근 맞춤버스와 20개 노선의 동행버스도 기존 2시간에서 3시간으로 운행 시간을 1시간 연장한다.

서울시는 정류소 버스정보안내단말기(BIT), 도로전광표지(VMS), 토피스 누리집 등을 통해 실시간 교통 정보와 도로 통제 구간 정보를 시민들에게 전달할 계획이다. 여장권 서울시 교통실장은 파업 종료 시까지 시민 불편이 최소화되도록 만전을 기하겠다고 밝히며, 노사 간 합의가 조속히 이루어지기를 당부했다.
"""

gpt35_tokens = gpt35.encode(text)
gpt4o_tokens = gpt4o.encode(text)
print(f"gpt35 : {len(gpt35_tokens)}")
print(f"gpt4o : {len(gpt4o_tokens)}")

gpt35 : 1073
gpt4o : 680
