# OpenAI Chat Completions API
https://platform.openai.com/docs/overview  
https://platform.openai.com/docs/api-reference/chat  

배포된 openai의 api key를 .env의 OPENAI_API_KEY에 등록하여 사용합니다.

In [None]:
import requests
from pprint import pprint
import os
from dotenv import load_dotenv

load_dotenv()

OPENAI_API_KEY = os.getenv('OPENAI_API_KEY')
URL = "https://api.openai.com/v1/chat/completions"
model = "gpt-4o-mini"

### REST API 요청
라이브러리 없이 직접 HTTP 통신을 통해 api를 호출한다.

In [None]:
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {OPENAI_API_KEY}"
}

payload = {
    "model": model,
    "messages": [
        {"role": "system", "content": "당신은 친절한 AI 강사입니다."},
        {"role": "user", "content": "Chat Completions API가 뭐야? 2~3문장으로 답변해줘"}
    ]
}

response = requests.post(URL, headers=headers, json=payload)
pprint(response.json())
print(response.json()['choices'][0]['message']['content'])

{'choices': [{'finish_reason': 'stop',
              'index': 0,
              'logprobs': None,
              'message': {'annotations': [],
                          'content': 'Chat Completions API는 사용자 입력에 대한 자연어 응답을 '
                                     '생성하는 인공지능 모델을 제공하는 인터페이스입니다. 이 API는 대화형 '
                                     '애플리케이션에서 사용자와 상호작용을 향상시킬 수 있도록 돕고, 다양한 '
                                     '주제에 대한 질문에 답변하거나 정보를 제공할 수 있습니다. 쉽게 말해, '
                                     '사람처럼 대화할 수 있는 AI 기능을 웹이나 앱에 통합할 수 있게 해주는 '
                                     '도구입니다.',
                          'refusal': None,
                          'role': 'assistant'}}],
 'created': 1768924172,
 'id': 'chatcmpl-D08GyDuCCqoL1iso1jknR7OKTv8Gk',
 'model': 'gpt-4o-mini-2024-07-18',
 'object': 'chat.completion',
 'service_tier': 'default',
 'system_fingerprint': 'fp_29330a9688',
 'usage': {'completion_tokens': 103,
           'completion_tokens_details': {'accepted_prediction_tokens': 0,

### OpenAI SDK를 활용한 요청
공식 라이브러리를 사용하여 생산성을 높이는 표준 방식이다.  
`pip install openai` 를 통해 설치한다.

In [3]:
from openai import OpenAI

client = OpenAI(api_key=OPENAI_API_KEY)

completion = client.chat.completions.create(
    model=model,
    messages=[
        {"role": "user", "content": "Openai SDK를 사용하면 어떤 점이 좋아?"}
    ]
)

print(completion.choices[0].message.content)

OpenAI SDK를 사용하면 여러 가지 이점이 있습니다:

1. **간편한 사용**: OpenAI SDK는 API에 대한 간편한 인터페이스를 제공하여, 개발자가 복잡한 설정 없이 쉽게 모델을 사용할 수 있게 해줍니다.

2. **강력한 모델 지원**: GPT와 같은 최신 언어 모델에 접근할 수 있으며, 텍스트 생성, 요약, 번역, 질의응답 등 다양한 작업에 활용할 수 있습니다.

3. **커스터마이징**: SDK를 통해 특정 작업에 맞게 모델의 응답을 조정하거나, 원하는 스타일로 텍스트를 생성하는 등의 커스터마이징이 가능합니다.

4. **효율적인 개발**: 사전 훈련된 모델을 사용하여 머신러닝 모델을 처음부터 끝까지 개발하는 데 드는 시간과 노력을 줄일 수 있습니다.

5. **사용 사례 다양성**: 고객 지원, 콘텐츠 생성, 코드 작성, 데이터 분석 등 다양한 분야에서 활용할 수 있어 다양한 애플리케이션을 개발할 수 있습니다.

6. **정기적인 업데이트**: OpenAI는 지속적으로 모델을 개선하고 업데이트하므로 최신 기술을 손쉽게 활용할 수 있습니다.

7. **커뮤니티와 문서**: 활성화된 개발자 커뮤니티와 풍부한 문서가 제공되어, 문제 해결이나 참고자료를 쉽게 찾을 수 있습니다.

이러한 이점 덕분에 OpenAI SDK는 다양한 프로젝트에서 유용하게 사용될 수 있습니다.


### System Prompt 비교

동일한 질문에 대해 AI의 페르소나에 따라 답변이 어떻게 달라지는지 확인해 보자

In [2]:
user_input = "아침 일찍 일어나는 습관의 장점에 대해 말해줘."

personas = {
    "열정적인 셰프": "당신은 요리에 인생을 건 셰프입니다. 인생의 모든 이치를 요리 과정과 재료에 비유하여 설명하세요.",
    "엄격한 헬스 트레이너": "당신은 매우 엄격한 운동 전문가입니다. 강한 어조로 자기관리를 강조하며 답변하세요.",
    "지혜로운 판다": "당신은 대나무 숲에 사는 느긋하고 지혜로운 판다입니다. 느릿느릿하고 평화로운 말투로 조언을 건네세요."
}

for name, prompt in personas.items():
    print(f"--- [{name}] 버전 ---")
    response = client.chat.completions.create(
        model=model,
        messages=[
            {"role": "system", "content": prompt},
            {"role": "user", "content": user_input}
        ]
    )
    print(response.choices[0].message.content)
    print("\n")

--- [열정적인 셰프] 버전 ---


NameError: name 'client' is not defined

### Temperature 비교

동일한 질문에 대해 temperature에 따라 답변이 어떻게 달라지는지 확인해 보자

In [3]:
creative_topic = "운동화 브랜드의 새로운 슬로건을 5개 제안해줘. 단, '속도'나 '승리' 같은 뻔한 단어는 제외하고 아주 기발하게 작성해줘."
temperatures = [0.3, 0.8, 1.0, 1.3, 1.5, 1.6, 1.8]

for t in temperatures:
    print(f"### 설정값 (Temperature): {t} ###")
    response = client.chat.completions.create(
        model=model,
        messages=[{"role": "user", "content": creative_topic}],
        temperature=t,
        max_completion_tokens=200, 
        timeout=15.0
    )
    print(response.choices[0].message.content)
    print("=" * 50)

### 설정값 (Temperature): 0.3 ###


NameError: name 'client' is not defined

In [None]:
creative_topic = "우리집 강아지의 별명을 3개 지어줘."
temperatures = [0.3, 0.8, 1.0, 1.3, 1.5, 1.6, 1.8]

for t in temperatures:
    print(f"### 설정값 (Temperature): {t} ###")
    response = client.chat.completions.create(
        model=model,
        messages=[{"role": "user", "content": creative_topic}],
        temperature=t,
        max_completion_tokens=200, 
        timeout=15.0
    )
    print(response.choices[0].message.content)
    print("=" * 50)

### `messages` 배열을 활용한 대화 맥락 유지 (Context Window)
Chat Completions API는 상태를 저장하지 않는(Stateless) 방식이므로, 이전 대화 내역을 리스트에 계속 누적해서 보내야 한다.

In [None]:
def chat_without_memory(user_input):
    
    response = client.chat.completions.create(
        model=model,
        messages=[
            {"role": "user", "content": user_input}
        ]
    )
    
    # 3. 모델의 답변을 기록에 추가 (이것이 맥락 유지의 핵심)
    answer = response.choices[0].message.content
    
    return answer

# 실습 테스트
print("Q1: 내 이름은 jun이야.")
print(f"A1: {chat_without_memory('내 이름은 jun이야')}\n")

print("Q2: 내 이름이 뭐라고?")
print(f"A2: {chat_without_memory('내 이름이 뭐라고?')}")

In [None]:
# 대화 내역을 저장할 리스트 초기화
history = [
    {"role": "system", "content": "당신은 사용자의 이름을 기억하는 비서입니다."}
]

def chat_with_memory(user_input):
    # 1. 사용자 질문을 기록에 추가
    history.append({"role": "user", "content": user_input})
    
    # 2. 전체 기록을 API에 전송
    response = client.chat.completions.create(
        model=model,
        messages=history
    )
    
    # 3. 모델의 답변을 기록에 추가 (이것이 맥락 유지의 핵심)
    answer = response.choices[0].message.content
    history.append({"role": "assistant", "content": answer})
    
    return answer

# 실습 테스트
print("Q1: 내 이름은 jun이야.")
print(f"A1: {chat_with_memory('내 이름은 jun이야.')}\n")

print("Q2: 내 이름이 뭐라고?")
print(f"A2: {chat_with_memory('내 이름이 뭐라고?')}")

### Structured Outputs (구조화된 출력)
모델의 답변을 단순히 텍스트로 받는 것이 아니라, JSON 형태로 고정하여 받을 수 있다.  
웹 서비스의 백엔드에서 데이터를 바로 처리해야 할 때 필수적인 기능이다.  
여기서는 `JSON mode(json_object)`로 json format을 활용하지만,  
이후에는 pydantic 라이브러리를 활용한 `JSON Scheme` 방식을 통해 명확한 json 응답 형식을 지정한다.

In [1]:
import json

response = client.chat.completions.create(
    model=model,
    messages=[
        {"role": "system", "content": "너는 요리사야. 답변은 반드시 JSON 형식으로 해줘."},
        {"role": "user", "content": "떡볶이 레시피 알려줘."}
    ],
    # JSON 모드 활성화
    response_format={"type": "json_object"}
)

# 문자열로 온 답변을 직접 파싱해야 함
res_json = json.loads(response.choices[0].message.content)
print(res_json)

NameError: name 'client' is not defined

### Streaming (실시간 응답 처리)
stream=True 설정을 통해 활성화한다.  
서버는 SSE(Server-Sent Events) 프로토콜을 사용하여 응답을 끊지 않고 조각(Chunk) 단위로 지속적으로 전송한다.  
응답 객체는 제너레이터 형식으로, for 루프를 사용해 활용할 수 있다.

In [None]:
prompt = "양자 역학에 대해 초등학생도 이해할 수 있게 설명해줘."
print(f"질문: {prompt}\n")
print("답변: ", end="")

response = client.chat.completions.create(
    model=model,
    messages=[{"role": "user", "content": prompt}],
    stream=True 
)

full_response = ""
for chunk in response:
    content = chunk.choices[0].delta.content
    if content:
        print(content, end="", flush=True) # flush 옵션을 통해 출력 버퍼를 즉시 비워 스트리밍 답변이 지연 없이 실시간으로 표시되도록 한다.
        full_response += content

print("\n\n--- 스트리밍 종료 ---")

### 비동기 요청


In [None]:
from openai import AsyncOpenAI
import asyncio

async_client = AsyncOpenAI(api_key=OPENAI_API_KEY)

async def get_food_recommendation(city):
    print(f"[{city}] 맛집 검색 시작...")
    response = await async_client.chat.completions.create(
        model="gpt-4o-mini",
        messages=[{"role": "user", "content": f"{city}에 가면 꼭 먹어야 할 음식 딱 한 가지만 추천해줘."}]
    )
    print(f"[{city}] 검색 완료!")
    return f"{city}: {response.choices[0].message.content}"

async def main():
    cities = ["서울", "파리", "뉴욕", "도쿄", "방콕", "로마"]
    tasks = [get_food_recommendation(c) for c in cities]
    
    # 여러 요청을 동시에(병렬로) 처리
    results = await asyncio.gather(*tasks)
    
    print("\n--- [여행자들을 위한 미식 가이드] ---")
    for r in results:
        print(r)

await main()

### Logprobs - 확률 확인하기

In [4]:
import math

prompt = "새로 오픈한 조용한 북카페 이름을 한글로 딱 하나만 추천해줘."
response = client.chat.completions.create(
    model=model,
    messages=[{"role": "user", "content": prompt}],
    logprobs=True,
    top_logprobs=3,
    max_completion_tokens=50
)

content = response.choices[0].message.content
logprobs_data = response.choices[0].logprobs.content

print(f"질문: {prompt}")
print(f"답변: {content}\n")
print(f"{'Token':<15} | {'Probability':<12} | {'Top Alternatives'}")
print("-" * 60)

for lp in logprobs_data:
    prob = math.exp(lp.logprob) * 100
    alternatives = [f"{top.token}({math.exp(top.logprob)*100:.1f}%)" for top in lp.top_logprobs]
    print(f"{lp.token:<15} | {prob:>10.2f}% | {', '.join(alternatives)}")



질문: 새로 오픈한 조용한 북카페 이름을 한글로 딱 하나만 추천해줘.
답변: "책무늬" 어때요? 조용한 분위기와 책의 무늬가 어우러진 느낌을 줍니다.

Token           | Probability  | Top Alternatives
------------------------------------------------------------
"               |      98.42% | "(98.4%), '(1.2%), “(0.2%)
책               |      18.35% | 조(20.8%), 여(18.3%), 책(18.3%)
무               |       0.00% | 향(72.4%), 과(12.6%), 방(2.8%)
\xeb\x8a        |      53.71% | \xeb\x8a(53.7%), 지(25.4%), 드(6.4%)
\xac            |      99.99% | \xac(100.0%), \xa4(0.0%), \x97(0.0%)
"               |      99.99% | "(100.0%),  카(0.0%),  북(0.0%)
 어              |       8.03% |  \xec\x96\xb4\xeb\x96(46.2%), 는(17.0%), 라는(9.1%)
때               |      99.98% | 때(100.0%), 울(0.0%),  때(0.0%)
요               |     100.00% | 요(100.0%), 세요(0.0%), ?(0.0%)
?               |     100.00% | ?(100.0%), ?
(0.0%), ?

(0.0%)
 조              |      64.10% |  조(64.1%),  책(18.4%),  북(6.8%)
용               |     100.00% | 용(100.0%),  quiet(0.0%), 用(0.0%)
한               |      34.34% | 