# Chat Completion

### 환경 설정
- .env 파일

In [None]:
# .env : only 내 로컬에서만. (공유대상이 아님)
# 환경파일 내에서 = 양옆에 공백 X (붙여서 작성)
# 민감 정보(API 키, 비밀번호 등)를 코드에 직접 쓰지 않고 분리
# 설정을 한 곳에 모아두고, 쉽게 수정 가능
# 개발/테스트/운영 환경에 따라 변수만 바꿔서 유연하게 실행 가능
# 깃헙에 안 올림 (보안 유지)
# Google Colab은 클라우드 환경이라, 노트북 코드에 API 키나 토큰을 바로 적으면 노출될 위험이 있어서 .env 파일을 따로 만들고, 안전하게 불러오는 식으로 사용

In [None]:
!pip install python-dotenv

Collecting python-dotenv
  Downloading python_dotenv-1.1.0-py3-none-any.whl.metadata (24 kB)
Downloading python_dotenv-1.1.0-py3-none-any.whl (20 kB)
Installing collected packages: python-dotenv
Successfully installed python-dotenv-1.1.0


In [None]:
from dotenv import load_dotenv

load_dotenv() # 시스템 환경변수로 일종의 등록을 한다고 보면 됨. True -> .env가 존재를 하고, 로드를 해서 시스템 환경변수로 등록했다는 것을 True가 뜨는 것으로 확인할 수 있다.

True

In [None]:
import os

OPENAI_API_KEY = os.getenv('OPENAI_API_KEY')


### Chat Completion

In [None]:
from openai import OpenAI

client = OpenAI(api_key=OPENAI_API_KEY)

response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[  # 배열형태인 이유는 이전에 대화가 있었던 것처럼 모델에 전달하기 위해서 (모델이 문맥을 이해하게 하기 위해서)
        {"role": "system", "content":"당신은 친절하고 상세한 설명을 잘하는 챗봇입니다."},
        {"role": "user", "content":"안녕하세요. 저는 토끼 선생님입니다."},
        {"role": "assistant", "content":"안녕하세요. 토끼 선생님, 무엇을 도와드릴까요?"},
        {"role": "user", "content": "제 이름이 뭐라구요?"}
    ],
    temperature=1,
    max_tokens=4096,
    top_p=1
)

print(response.choices[0].message.content)

토끼 선생님이라고 말씀하셨습니다! 맞나요? 다른 이름이 있으신가요?


### stream 처리

In [None]:
client = OpenAI() # 응? api-key가 없네? -> 넣지 않으면 환경변수(.env를 만들고 인스톨, 임포트 했기 때문에)에서 우리가 가져왔던 api-key변수를 자동으로 찾아서 넣어주기 때문에 문제가 생기지 않는다.

stream_response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {"role": "user", "content": "stream 테스트를 할건데, 아주 긴 응답 메세지를 보내주세요."}  # 왜 user밖에 없지?
    ],
    stream=True # 만들어지는 과정을 chatgpt가 응답해줄때처럼 생성해나가는대로 출력하는것 (청크 단위로 끊어서 가져옴)
)

for chunk in stream_response:
  if chunk.choices[0].delta.content is not None:  # delta.content : streaming된 조각을 뜻한다
    print(chunk.choices[0].delta.content, end='') # 청크, 조각단위로 출력하기 때문에 end='' 지정안해주면 개행없이 이어져서 나오게된다.

print('👌응답 완료👌')

물론입니다! 아래에 긴 응답 메시지를 작성해 보겠습니다. 특정 주제나 내용을 원하신다면 말씀해 주시면 그에 맞춰 조정할 수 있습니다. 여기서는 일반적인 정보 주제로 긴 메시지를 작성해 보겠습니다.

---

### 인공지능(AI)의 발전과 미래

인공지능(AI)은 최근 몇 년 간 눈부신 발전을 이루어 왔습니다. 1950년대 처음 개념이 등장한 이후, AI는 여러 분야에서 혁신적인 변화를 이끌고 있습니다. 초기 AI 연구는 주로 기초적인 알고리즘과 규칙 기반 시스템에 초점을 맞추었으나, 현재는 머신러닝과 딥러닝 기술의 발전에 힘입어 더욱 정교하고 강력한 시스템으로 진화했습니다.

#### 1. AI의 역사

인공지능의 역사는 크게 몇 가지 단계로 나눌 수 있습니다. 첫 번째 단계는 1950년대와 1960년대 초반으로, 이 시기에는 기본적인 문제 해결 기법과 기계 학습의 원초적인 형태가 개발되었습니다. 그 후 1970년대와 1980년대에는 전문가 시스템이 등장하며 특정 분야에서의 문제 해결에 활용되기 시작했습니다. 1990년대에는 AI 연구가 한동안 침체기를 겪었지만, 2000년대 들어서는 데이터와 컴퓨팅 파워의 비약적인 발전 덕분에 다시 빠르게 성장하게 됩니다.

#### 2. 현재의 AI 기술

현재의 AI는 주로 머신러닝, 딥러닝, 자연어 처리(NLP), 컴퓨터 비전 등 다양한 범주로 나눌 수 있습니다. 머신러닝은 데이터를 통해 스스로 학습하고 예측할 수 있는 모델을 만드는 기술입니다. 그중 딥러닝은 인공신경망을 활용해 보다 복잡한 패턴을 인식하는 데 중점을 두고 있습니다. 자연어 처리는 컴퓨터가 인간의 언어를 이해하고 생성하도록 돕는 기술로, 번역기, 챗봇, 음성 인식 시스템 등 다양한 애플리케이션에 활용됩니다. 컴퓨터 비전은 이미지와 비디오에서 의미 있는 정보를 추출하는 기술로, 자율주행차, 의료 영상 분석 등에서 중요한 역할을 하고 있습니다.

#### 3. AI의 응용 분야

AI의 활용 분야는 무궁무진하며, 매일 새롭고 혁신적인 방법으로 다양한 산업

### Token Counting

- 한번의 프롬프트 입출력 토큰과 서비스 호출 빈도를 고려해 서비스 제공 비용을 산정할 수 있음

In [None]:
!pip install tiktoken

Collecting tiktoken
  Downloading tiktoken-0.9.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (6.7 kB)
Downloading tiktoken-0.9.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (1.2 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.2/1.2 MB[0m [31m21.5 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: tiktoken
Successfully installed tiktoken-0.9.0


In [None]:
import tiktoken

gpt35_tokenizer = tiktoken.encoding_for_model("gpt-3.5-turbo")
gpt4o_tokenizer = tiktoken.encoding_for_model("gpt-4o")

text="""
KT가 태국 ‘자스민(Jasmine)’ 그룹의 IT 전문 기업 ‘자스민 테크놀로지 솔루션(Jasmine Technology Solutions, 이하 JTS)’과 추진한 태국어 대형언어모델(LLM) 플랫폼 구축 프로젝트를 성공적으로 마무리했다고 15일 밝혔다.

KT는 자체 모델 개발 경험과 노하우를 토대로 국내 LLM 전문 기업 업스테이지(대표 김성훈)와 태국어 전용 LLM을 공동 개발했다. 이 모델은 태국어, 영어, 한국어 등을 지원한다. 태국의 방대한 고유 데이터를 학습해 태국 정치, 역사, 문화 관련 질문에도 정확하게 응대할 수 있다.

KT는 지난해 3월 JTS와 태국어 LLM 플랫폼 개발 프로젝트를 위한 계약을 체결하고 1년여간 프로젝트를 수행해왔다. 이 프로젝트는 LLM 운영 관리 환경 ‘LLM 옵스(Ops)’와 AI 서비스 인프라 ‘GPU 팜(Farm)’을 구축하고 ‘태국어 전용 ‘LLM 모델’까지 개발하는 원스톱 프로젝트다. 해외에 종합 AI 인프라를 구축해 생성형 AI 서비스의 개발과 운영, 확장 환경을 마련한 것은 국내 기업 중 KT 그룹이 처음이다.

LLM 옵스는 다양한 LLM 모델의 학습·배포·운영 전 과정을 관리할 수 있는 환경이다. KT는 이를 고객사 맞춤형으로 구축해 JTS는 복잡한 생성형 AI 운영 환경을 보다 효율적, 안정적으로 운용할 수 있게 됐다.

더불어 KT는 클라우드 자회사 KT Cloud와 함께 GPU 자원 관리를 위한 GPU 팜도 태국 현지에 조성했다. 여기에 기반해 JTS는 태국 기업과 기관에 GPU 구독 서비스(GPU as a Service, GPUaaS)를 공급하고 본격적으로 태국 내 AI 생태계 확장을 촉진할 계획이다.

한편, KT는 대한민국 AX 생태계 발전을 위해 지난 2023년 업스테이지에 투자했다. 이번 프로젝트는 대기업과 스타트업이 공동으로 글로벌 AX 사업을 성공한 사례로서 의미를 더했다.

KT는 앞으로도 JTS의 전문 기술 파트너로서 AI 플랫폼 고도화, GPU 인프라 확장 및 유지 보수, AI 기반 신규 서비스 발굴 등 다분야에서 지속적인 협력을 이어 나간다. 또한 양 사는 태국 AX 시장을 겨냥한 AI 서비스를 단계적으로 선보일 계획이다..

KT는 이번 프로젝트로 성공적인 글로벌 AX 사업 레퍼런스를 확보했다. 이를 통해 한층 고도화된 AI 사업 역량을 확보하고 동남아 시장뿐만 아니라 중동, 유럽 등 다른 글로벌 시장까지 AX 사업 영역을 본격적으로 확대해 나갈 방침이다.

KT 전략·사업컨설팅부문 AI사업전략담당 이진형 상무는 “태국어 특화 LLM 플랫폼 개발과 상용화는 KT의 AI 기술력과 글로벌 사업 역량을 다시 한번 입증한 성과”라며 “이번 프로젝트에서 얻은 경험과 노하우를 포함해 KT는 마이크로소프트, 팔란티어와의 전략적 제휴를 기반으로 AI, 클라우드의 서비스형 상품 라인업도 다각화해 나갈 계획이다”라고 밝혔다.

"""
# gpt35_tokenizer.encode(text) : 인덱스로 반환해줌
print(len(gpt35_tokenizer.encode(text)))
print(len(gpt4o_tokenizer.encode(text)))

1286
731
