# OpenAI Chat Completions API
https://platform.openai.com/docs/overview  
https://platform.openai.com/docs/api-reference/chat  

배포된 openai의 api key를 .env의 OPENAI_API_KEY에 등록하여 사용합니다.

In [2]:
import requests
from pprint import pprint
import os
from dotenv import load_dotenv

load_dotenv()

OPENAI_API_KEY = os.getenv('OPENAI_API_KEY')
URL = "https://api.openai.com/v1/chat/completions"
model = "gpt-4o-mini"

### REST API 요청
라이브러리 없이 직접 HTTP 통신을 통해 api를 호출한다.

In [14]:
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {OPENAI_API_KEY}"
}

payload = {
    "model": model,
    "messages": [
        {"role": "system", "content": "당신은 친절한 AI 강사입니다."},
        {"role": "user", "content": "Chat Completions API가 뭐야? 2~3문장으로 답변해줘"}
    ]
}

response = requests.post(URL, headers=headers, json=payload)
#pprint(response.json())
print(response.json()['choices'][0]['message']['content'])

Chat Completions API는 사용자가 입력한 텍스트에 기반하여 이어지는 대화를 생성하는 인공지능 API입니다. 이를 통해 자연스러운 대화 흐름을 유지하면서 다양한 주제에 대해 상호작용할 수 있습니다. 이 API는 챗봇, 고객 지원 및 다양한 애플리케이션에서 활용됩니다.


### OpenAI SDK를 활용한 요청
공식 라이브러리를 사용하여 생산성을 높이는 표준 방식이다.  
`pip install openai` 를 통해 설치한다.

In [15]:
from openai import OpenAI

client = OpenAI(api_key=OPENAI_API_KEY)

completion = client.chat.completions.create(
    model=model,
    messages=[
        {"role": "user", "content": "Openai SDK를 사용하면 어떤 점이 좋아?"}
    ]
)

print(completion.choices[0].message.content)

OpenAI SDK를 사용하면 여러 가지 장점이 있습니다. 이를 통해 개발자와 기업은 다양한 AI 기능을 쉽게 통합하고 활용할 수 있습니다. 주요 장점을 몇 가지 소개하겠습니다.

1. **사용 용이성**: OpenAI SDK는 직관적이고 사용이 간편한 인터페이스를 제공하여, 개발자가 복잡한 AI 모델을 쉽게 사용할 수 있게 합니다. API 호출을 통해 손쉽게 기능을 구현할 수 있습니다.

2. **강력한 성능**: OpenAI의 모델은 자연어 처리와 생성에 있어 높은 성능을 보여줍니다. 이는 고객 지원, 콘텐츠 생성, 코드 작성, 데이터 분석 등 다양한 분야에서 활용 가능하게 합니다.

3. **커스터마이징**: OpenAI의 API를 통해 사용자는 특정한 요구에 맞게 모델을 조정하거나 파인튜닝할 수 있어, 더 나은 결과를 도출할 수 있습니다.

4. **다양한 기능**: 텍스트 생성, 번역, 요약, 질문답변 등 여러 가지 언어 처리 작업을 지원하여, 다양한 애플리케이션에서 활용할 수 있습니다.

5. **지속적인 업데이트**: OpenAI는 지속적으로 모델을 개선하고 업데이트하여 최신의 성능을 유지합니다. 새로운 기능이나 향상된 모델이 지속적으로 제공됩니다.

6. **커뮤니티와 지원**: OpenAI의 SDK를 사용하는 개발자 커뮤니티가 활성화되어 있어, 질문이나 문제 발생 시 다양한 지원을 받을 수 있습니다.

7. **비용 효율성**: 자체적으로 AI 모델을 구축하고 유지하는 것보다 OpenAI API를 사용하는 것이 비용과 시간을 절약할 수 있습니다. 필요한 경우에만 사용할 수 있는 유연한 요금제를 제공하기 때문입니다.

이러한 장점 덕분에 OpenAI SDK는 많은 기업과 개발자에게 유용한 도구로 자리 잡고 있습니다.


### System Prompt 비교

동일한 질문에 대해 AI의 페르소나에 따라 답변이 어떻게 달라지는지 확인해 보자

In [None]:
user_input = "아침 일찍 일어나는 습관의 장점에 대해 말해줘."

personas = {
    "열정적인 셰프": "당신은 요리에 인생을 건 셰프입니다. 인생의 모든 이치를 요리 과정과 재료에 비유하여 설명하세요.",
    "엄격한 헬스 트레이너": "당신은 매우 엄격한 운동 전문가입니다. 강한 어조로 자기관리를 강조하며 답변하세요.",
    "지혜로운 판다": "당신은 대나무 숲에 사는 느긋하고 지혜로운 판다입니다. 느릿느릿하고 평화로운 말투로 조언을 건네세요."
}

for name, prompt in personas.items():
    print(f"--- [{name}] 버전 ---")
    response = client.chat.completions.create(
        model=model,
        messages=[
            {"role": "system", "content": prompt},
            {"role": "user", "content": user_input}
        ]
    )
    print(response.choices[0].message.content)
    print("\n")

### Temperature 비교

동일한 질문에 대해 temperature에 따라 답변이 어떻게 달라지는지 확인해 보자

In [None]:
creative_topic = "운동화 브랜드의 새로운 슬로건을 5개 제안해줘. 단, '속도'나 '승리' 같은 뻔한 단어는 제외하고 아주 기발하게 작성해줘."
temperatures = [0.3, 0.8, 1.0, 1.3, 1.5, 1.6, 1.8]

for t in temperatures:
    print(f"### 설정값 (Temperature): {t} ###")
    response = client.chat.completions.create(
        model=model,
        messages=[{"role": "user", "content": creative_topic}],
        temperature=t,
        max_completion_tokens=200, 
        timeout=15.0
    )
    print(response.choices[0].message.content)
    print("=" * 50)

In [None]:
creative_topic = "우리집 강아지의 별명을 3개 지어줘."
temperatures = [0.3, 0.8, 1.0, 1.3, 1.5, 1.6, 1.8]

for t in temperatures:
    print(f"### 설정값 (Temperature): {t} ###")
    response = client.chat.completions.create(
        model=model,
        messages=[{"role": "user", "content": creative_topic}],
        temperature=t,
        max_completion_tokens=200, 
        timeout=15.0
    )
    print(response.choices[0].message.content)
    print("=" * 50)

### `messages` 배열을 활용한 대화 맥락 유지 (Context Window)
Chat Completions API는 상태를 저장하지 않는(Stateless) 방식이므로, 이전 대화 내역을 리스트에 계속 누적해서 보내야 한다.

In [None]:
def chat_without_memory(user_input):
    
    response = client.chat.completions.create(
        model=model,
        messages=[
            {"role": "user", "content": user_input}
        ]
    )
    
    # 3. 모델의 답변을 기록에 추가 (이것이 맥락 유지의 핵심)
    answer = response.choices[0].message.content
    
    return answer

# 실습 테스트
print("Q1: 내 이름은 jun이야.")
print(f"A1: {chat_without_memory('내 이름은 jun이야')}\n")

print("Q2: 내 이름이 뭐라고?")
print(f"A2: {chat_without_memory('내 이름이 뭐라고?')}")

In [None]:
# 대화 내역을 저장할 리스트 초기화
history = [
    {"role": "system", "content": "당신은 사용자의 이름을 기억하는 비서입니다."}
]

def chat_with_memory(user_input):
    # 1. 사용자 질문을 기록에 추가
    history.append({"role": "user", "content": user_input})
    
    # 2. 전체 기록을 API에 전송
    response = client.chat.completions.create(
        model=model,
        messages=history
    )
    
    # 3. 모델의 답변을 기록에 추가 (이것이 맥락 유지의 핵심)
    answer = response.choices[0].message.content
    history.append({"role": "assistant", "content": answer})
    
    return answer

# 실습 테스트
print("Q1: 내 이름은 jun이야.")
print(f"A1: {chat_with_memory('내 이름은 jun이야.')}\n")

print("Q2: 내 이름이 뭐라고?")
print(f"A2: {chat_with_memory('내 이름이 뭐라고?')}")

### Structured Outputs (구조화된 출력)
모델의 답변을 단순히 텍스트로 받는 것이 아니라, JSON 형태로 고정하여 받을 수 있다.  
웹 서비스의 백엔드에서 데이터를 바로 처리해야 할 때 필수적인 기능이다.  
여기서는 `JSON mode(json_object)`로 json format을 활용하지만,  
이후에는 pydantic 라이브러리를 활용한 `JSON Scheme` 방식을 통해 명확한 json 응답 형식을 지정한다.

In [None]:
import json

response = client.chat.completions.create(
    model=model,
    messages=[
        {"role": "system", "content": "너는 요리사야. 답변은 반드시 JSON 형식으로 해줘."},
        {"role": "user", "content": "떡볶이 레시피 알려줘."}
    ],
    # JSON 모드 활성화
    response_format={"type": "json_object"}
)

# 문자열로 온 답변을 직접 파싱해야 함
res_json = json.loads(response.choices[0].message.content)
print(res_json)

### Streaming (실시간 응답 처리)
stream=True 설정을 통해 활성화한다.  
서버는 SSE(Server-Sent Events) 프로토콜을 사용하여 응답을 끊지 않고 조각(Chunk) 단위로 지속적으로 전송한다.  
응답 객체는 제너레이터 형식으로, for 루프를 사용해 활용할 수 있다.

In [None]:
prompt = "양자 역학에 대해 초등학생도 이해할 수 있게 설명해줘."
print(f"질문: {prompt}\n")
print("답변: ", end="")

response = client.chat.completions.create(
    model=model,
    messages=[{"role": "user", "content": prompt}],
    stream=True 
)

full_response = ""
for chunk in response:
    content = chunk.choices[0].delta.content
    if content:
        print(content, end="", flush=True) # flush 옵션을 통해 출력 버퍼를 즉시 비워 스트리밍 답변이 지연 없이 실시간으로 표시되도록 한다.
        full_response += content

print("\n\n--- 스트리밍 종료 ---")

### 비동기 요청


In [3]:
from openai import AsyncOpenAI
import asyncio

async_client = AsyncOpenAI(api_key=OPENAI_API_KEY)

async def get_food_recommendation(city):
    print(f"[{city}] 맛집 검색 시작...")
    response = await async_client.chat.completions.create(
        model="gpt-4o-mini",
        messages=[{"role": "user", "content": f"{city}에 가면 꼭 먹어야 할 음식 딱 한 가지만 추천해줘."}]
    )
    print(f"[{city}] 검색 완료!")
    return f"{city}: {response.choices[0].message.content}"

async def main():
    cities = ["서울", "파리", "뉴욕", "도쿄", "방콕", "로마"]
    tasks = [get_food_recommendation(c) for c in cities]
    
    # 여러 요청을 동시에(병렬로) 처리
    results = await asyncio.gather(*tasks)
    
    print("\n--- [여행자들을 위한 미식 가이드] ---")
    for r in results:
        print(r)

await main()

[서울] 맛집 검색 시작...
[파리] 맛집 검색 시작...
[뉴욕] 맛집 검색 시작...
[도쿄] 맛집 검색 시작...
[방콕] 맛집 검색 시작...
[로마] 맛집 검색 시작...
[뉴욕] 검색 완료!
[로마] 검색 완료!
[파리] 검색 완료!
[방콕] 검색 완료!
[서울] 검색 완료!
[도쿄] 검색 완료!

--- [여행자들을 위한 미식 가이드] ---
서울: 서울에 가면 꼭 먹어야 할 음식은 '김치찌개'입니다. 김치찌개는 한국의 대표적인 전통 찌개로, 깊고 얼큰한 국물에 숙성된 김치와 돼지고기 또는 두부를 넣어 끓인 요리입니다. 따뜻한 밥과 함께 먹으면 정말 맛있고, 한국의 얼핏 지친 마음을 따뜻하게 녹여주는 음식이죠. 서울에서 맛있는 김치찌개를 꼭 즐겨보세요!
파리: 파리에 간다면 꼭 먹어야 할 음식은 크루아상(Croissant)입니다. 바삭하고 버터 향이 가득한 이 프랑스식 페이스트리는 아침식사로 적합하며, 현지 베이커리에서 갓 구운 크루아상을 즐기면 파리의 맛을 진정으로 느낄 수 있습니다.
뉴욕: 뉴욕에 가면 꼭 먹어야 할 음식은 "슬라이더(Slider)"입니다. 특히 유명한 햄버거 체인인 '화이트 캐슬(White Castle)'의 슬라이더는 작고, 맛있으며, 뉴욕의 정취를 느낄 수 있는 대표적인 음식입니다. 다양한 토핑과 소스와 함께 즐길 수 있어 뉴욕의 빠른 음식 문화도 체험할 수 있습니다!
도쿄: 도쿄에 가면 꼭 먹어야 할 음식으로 **스시**를 추천합니다. 특히, 신선한 생선과 다양한 해산물을 사용할 수 있는 도쿄에서는 옛날 스타일의 스시를 즐길 수 있는 곳이 많습니다. 츠키지 수산시장에서 신선한 스시를 맛보거나, 유명한 스시 전문점에서 셰프가 직접 만드는 스시를 경험해 보세요!
방콕: 방콕에 가면 꼭 먹어야 할 음식은 **팩천(Pad Thai)**입니다. 태국의 대표적인 볶음국수인 팟타이는 새우, 두부, 숙주, 땅콩 등이 들어가고, 특유의 달콤하고 짭짤한 소스와 함께 제공됩니다. 길거리 음식으로도 쉽게 찾을 수 있고, 다양한 맛을 즐길 수 

### Logprobs - 확률 확인하기

In [None]:
import math

prompt = "새로 오픈한 조용한 북카페 이름을 한글로 딱 하나만 추천해줘."
response = client.chat.completions.create(
    model=model,
    messages=[{"role": "user", "content": prompt}],
    logprobs=True,
    top_logprobs=3,
    max_completion_tokens=50
)

content = response.choices[0].message.content
logprobs_data = response.choices[0].logprobs.content

print(f"질문: {prompt}")
print(f"답변: {content}\n")
print(f"{'Token':<15} | {'Probability':<12} | {'Top Alternatives'}")
print("-" * 60)

for lp in logprobs_data:
    prob = math.exp(lp.logprob) * 100
    alternatives = [f"{top.token}({math.exp(top.logprob)*100:.1f}%)" for top in lp.top_logprobs]
    print(f"{lp.token:<15} | {prob:>10.2f}% | {', '.join(alternatives)}")

