# Open API 활용해보기


OpenAI API를 호출하고 활용할 수 있습니다.   

[여기](https://platform.openai.com/account/api-keys)

In [None]:
!pip install openai tiktoken --upgrade

In [None]:
!pip show openai
# 버전 확인

In [None]:
# key 입력


사용 가능한 모델의 목록: https://platform.openai.com/docs/models 

openai의 LLM 모델은 현재 다음의 모델 사용이 가능

- gpt-4o-mini 
- gpt-4o 
- gpt-4-turbo, gpt-4
- gpt-3.5-turbo


  Chat 모델은 채팅 메시지 형태로 데이터를 전달해야 합니다. 

#### Message의 구성    

하나의 채팅 메시지는 `role`과 `content` 조합으로 구성됩니다.   
`role`에 따라 system, user, assistant 메시지로 나누어집니다.   

시스템 메시지는 GPT의 행동을 지정합니다.

In [None]:
messages = [
    {'role':'system', 'content':'you are a helpful assistant.'},
    # you are a helpful assistant. : GPT 기본 프롬프트


    {'role':'user', 'content':'Gpt는 뭐야?'}
    # user message
]

메시지 목록을 전달하여, GPT API를 호출합니다. 

In [None]:
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages = messages,
)

print(response)

In [None]:
print(response.choices[0].message.content)

temperature: 무작위 출력을 조절: (0-2) 0에 가까울수록 정해진 답변을 수행
max_tokens : 출력 최대 토큰 수 조절: 초과할 경우 자름


In [None]:
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages = messages,
    temperature=0.2,
    max_tokens = 512,
    
    # n = 1
    # 여러 개의 출력 가능

)
print(response)

<br><br><br>
### tokens

ChatCompletion의 출력 결과를 보면, usage에 토큰 개수가 저장됩니다.   
토큰의 개수는 모델이 사용하는 토크나이저마다 다르며,   
토큰의 길이는 출력 속도/메모리 사용량/API 요금에 영향을 미칩니다.

tiktoken을 이용하면 모델별 토크나이저를 확인하고, 토큰의 개수를 구할 수 있습니다.

In [None]:
import tiktoken

tokenizer = tiktoken.encoding_for_model("gpt-3.5-turbo-instruct")
tokenizer

In [None]:
prompt = '지금 이 문장의 글자수와 토큰 수를 구할 수 있습니다.'
tokens = tokenizer.encode(prompt)
print(tokens)
print('총 글자 수:',len(prompt))
print('총 토큰 수:',len(tokens))

GPT-4o 모델은 개선된 토크나이저를 지원합니다.

In [None]:
tokenizer_4o = tiktoken.encoding_for_model("gpt-4o")
tokenizer_4o

In [None]:
prompt = '지금 이 문장의 글자수와 토큰 수를 구할 수 있습니다.'

# GPT4o : 줄어든 토큰 수

tokens= tokenizer_4o.encode(prompt)
print(tokens)
print('총 글자 수:',len(prompt))
print('총 토큰 수:',len(tokens))


LLM은 그 특성상 동일한 input prompt가 들어와도 결과가 항상 다르게 출력되는데,   
 seed 파라미터는 이를 조절하기 위해 만들어졌습니다.

* 출력이 길어지면 결과가 달라집니다.  


In [None]:
# 프롬프트 준비
messages = [
    {'role':'system', 'content':'당신은 차량운전자를 위한 비서입니다.'},
    {'role':'user', 'content':'지금 너무 추워 어떻게 해?'}
]


In [None]:
response = client.chat.completions.create(
    model = "gpt-4o-mini",
    messages = messages,
    temperature =  0.5,
    max_tokens = 500,
    seed= 8291

)
print(response.choices[0].message.content)

In [None]:
# 같은 코드로 두 번 실행하기
response = client.chat.completions.create(
    model = "gpt-4o-mini",
    messages = messages,
    temperature =  0.5,
    max_tokens = 500,
    seed= 8291

)
print(response.choices[0].message.content)

번역, 코딩 등의 작업도 수행할 수 있습니다.

In [None]:
# 번역
prompt = '''한국어 문장: 생성형 AI의 능력이 점점 증가하고 있습니다.
영어 문장: '''

# 프롬프트 준비
messages = [
    {'role':'user', 'content':prompt}
]


In [None]:
response = client.chat.completions.create(
    model = "gpt-4o-mini",
    messages = messages,
    temperature =  0.2,
    max_tokens = 500

)
print(response.choices[0].message.content)

In [None]:
# 코딩
prompt = '''# 주어지는 text 문자열에 대해, 공백을 포함한 특수문자를 모두 제거하는 파이썬 코드
text= "2:0→2:3→4:3→4:4→7:4...'내가 제일 좋아하는 음식은 "피자"입니다.

'''

messages = [
    {'role':'system', 'content':'코드만 출력'},
    {'role':'user', 'content':prompt}
]


In [None]:
response = client.chat.completions.create(
    model = "gpt-4o-mini",
    messages = messages,
    temperature =  0.2,
    max_tokens = 500

)
print(response.choices[0].message.content)

In [None]:
# 되는지 확인해보기

다양한 시스템 메시지는 출력의 형식을 크게 변화시킵니다.    
ChatGPT에서는 user 메시지에 포함하는 내용이지만,    
system 메시지에 넣을 경우 더 효과적입니다.

In [None]:
messages = [
    {'role':'system', 'content' : '''당신은 매우 냉소적입니다.
첫 문장은 사용자의 답변을 항상 부정하세요.'''},
    {'role':'user', 'content':'오늘 연구실 가고싶지 않아요.'},

]

In [None]:
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages = messages,
    temperature=0.2
)
print(response.choices[0].message.content)

여러 번의 대화를 저장할 수도 있습니다.

In [None]:
response = client.chat.completions.create(
  model="gpt-4o-mini",
  messages=[
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "Who won the world series in 2020?"},
    {"role": "assistant", "content": "The Los Angeles Dodgers won the World Series in 2020."},
    {"role": "user", "content": "Where was it played?"}
  ]
)
print(response.choices[0].message.content)

만약 대화를 계속 이어나가고 싶다면 어떻게 하면 될까요?

입력과 그 결과를 받아, 형식을 맞춰서 messages에 저장하면 됩니다.

## 실습) Multi-turn Conversation    
아래의 코드는 반복문을 이용해 연속적인 대화를 수행하는 코드의 일부입니다.    
새로운 입력(`input()`)과 모델의 출력(`ai_msg`)을 이용해  
연속적인 대화를 이어갈 수 있도록 코드를 수정하세요.

In [None]:
history = [
  {"role": "system", "content": """당신은 냉정하고 성격이 안좋은 사람입니다. 사용자의 말을 전부 부정하세요."""},
]

# 입력을 4번 수행해야 종료됩니다 (ESC로 중간 종료 가능)

for i in range(4):
    usr_msg = input()  # 사용자 입력 받기
    print ("User:", usr_msg)

    # history에 사용자 입력 추가하기
    history.append(
        {'role': 'user', 'content': usr_msg}
    )

    # AI 응답 생성 (모델 호출하는 부분)
    response = ________________

    # AI의 응답 추출
    ai_msg = ________________


    # AI 응답 출력
    print("AI:", ai_msg)

    # history에 AI 응답 추가하기
    history.append(
        {'role': 'assistant', 'content': ai_msg}
    )



### Embedding

임베딩은 텍스트를 벡터로 변환합니다.   
OpenAI는 3개의 임베딩 모델을 지원합니다.

- text-embedding-3-large
- text-embedding-3-small
- text-embedding-ada-002 (구버전, 기본값)


#### 임베딩의 활용 예시)
- 검색 : 입력 쿼리와 데이터베이스 문장들 간의 관련도 계산하여 순위 매기기
- 추천 : 텍스트의 연관성을 기준으로 추천하기

In [None]:
emb = client.embeddings.create(
    model = 'text-embedding-3-large',
    input = 'AI도 가성비 시대, 저렴한 소형 언어모델 빅테크 선점 경쟁 치열',
)

In [None]:
emb

In [None]:
emb.data[0].embedding[0:3]

방금 넣은 문장의 임베딩을 다른 문장들의 임베딩과 비교해 보겠습니다.   
아래의 코드는 다소 길지만, 실제 어플리케이션에서는 코드 한 두 줄로 표현할 수 있습니다.

In [None]:
import numpy as np

# 입력 텍스트의 임베딩 생성
query = 'AI도 가성비 시대, 저렴한 소형 언어모델 빅테크 선점 경쟁 치열'

response = client.embeddings.create(
    input=query,
    model="text-embedding-3-large"
)

query_emb = response.data[0].embedding
query_emb = np.array(query_emb).astype("float32") # 계산을 빠르게 하기 위해서

# 대상 텍스트의 임베딩 생성
target_texts = [
    "경량화 언어모델(smaller Large Language Model·sLLM)은 방대한 양의 데이터를 학습해 자연어(NLP)처리 작업을 수행할 수 있는 인공지능(AI) 모델 중 하나다. 일반적으로 알려진 거대언어모델(LLM)보다 작은 매개변수(파라미터) 크기로 운영이 가능하다. 통상적으로 매개변수가 1000억개 이하인 모델이 sLLM으로 분류된다.",
    "잘나가던 탕후루 인기가 시들해진 원인은 무엇일까. 가장 크게는 지난해 가을 불거진 과도한 설탕 섭취에 따른 어린이·청소년 건강 문제가 꼽힌다. ",
    "1114회 로또 1등 각 15억원씩…1곳서 수동 5명(종합)",
    "오늘(9일) 로이터통신에 따르면 컨설팅업체 KPMG는 최근 미국 소비자 1천100명을 대상으로 전기차 선호 조사를 한 결과 같은 가격과 성능을 갖췄을 경우 내연기관차나 하이브리드차 대신 전기차를 구매하겠다는 응답 비율이 20%에 그쳤다고 밝혔습니다."
]
response_candidates = client.embeddings.create(
    input=target_texts,
    model="text-embedding-3-large"
)


target_embeds = [record.embedding for record in response_candidates.data] # 4개의 임베딩 구하기
target_embeds = np.array(target_embeds).astype("float32")

In [None]:
# 코사인 유사도 계산
def cosine_similarity(embedding1, embedding2):
    dot_product = np.dot(embedding1, embedding2.T)
    norm1 = np.linalg.norm(embedding1)
    norm2 = np.linalg.norm(embedding2, axis=1)
    similarity = dot_product / (norm1 * norm2)
    return similarity

# query_emb와 target_embeds의 코사인 유사도 계산
similarities = cosine_similarity(query_emb, target_embeds)

print('Query:',query)
print('---')

for i, similarity in enumerate(similarities):

    print(target_texts[i])
    print(f"유사도: {similarity:.4f}")
    print('---')


문제의 질문에 가장 가까웠던 텍스트는 첫 번째 텍스트라는 것을 확인할 수 있습니다.

## 이미지 생성 (DALL-E 3)
DALL-E 는 OpenAI의 이미지 생성 인공지능입니다.   
prompt에 원하는 그림의 묘사를 넣으면 생성 가능합니다.

`dall-e-2`, `dall-e-3`를 사용 가능

In [None]:
# 계정당 8~16회 /1분 제한

response  = client.images.generate(
  model="dall-e-3",
  prompt="""Please draw a unicorn on top of the Incheon Bridge.""",
  n=1,
  size="1024x1024"
)
response

response에는 생성된 그림의 링크가 포함되어 있습니다.    

In [None]:
response.data[0].url

In [None]:
from IPython.display import Image
import requests

# 이미지 출력
img =Image(url="https://oaidalleapiprodscus.blob.core.windows.net/private/org-8ja1zmL1JQYxwM0CONfqb0mW/user-kFZIFsjikxvZAHAG2O9ZZTca/img-jzt2ipkwSJqxUmz3Ggcyi3UE.png?st=2024-09-03T07%3A29%3A09Z&se=2024-09-03T09%3A29%3A09Z&sp=r&sv=2024-08-04&sr=b&rscd=inline&rsct=image/png&skoid=d505667d-d6c1-4a0a-bac7-5c84a87759f8&sktid=a48cca56-e6da-484e-a814-9c849652bcb3&skt=2024-09-02T23%3A44%3A55Z&ske=2024-09-03T23%3A44%3A55Z&sks=b&skv=2024-08-04&sig=M3NRQojSJtq8qWslVBbLD%2Bc682MnaIRVTgvQwUNWmS8%3D")
response = requests.get("https://oaidalleapiprodscus.blob.core.windows.net/private/org-8ja1zmL1JQYxwM0CONfqb0mW/user-kFZIFsjikxvZAHAG2O9ZZTca/img-jzt2ipkwSJqxUmz3Ggcyi3UE.png?st=2024-09-03T07%3A29%3A09Z&se=2024-09-03T09%3A29%3A09Z&sp=r&sv=2024-08-04&sr=b&rscd=inline&rsct=image/png&skoid=d505667d-d6c1-4a0a-bac7-5c84a87759f8&sktid=a48cca56-e6da-484e-a814-9c849652bcb3&skt=2024-09-02T23%3A44%3A55Z&ske=2024-09-03T23%3A44%3A55Z&sks=b&skv=2024-08-04&sig=M3NRQojSJtq8qWslVBbLD%2Bc682MnaIRVTgvQwUNWmS8%3D")

# 이미지를 파일로 저장
with open('your_image.png', 'wb') as file:
    file.write(response.content)

img


##  이미지 프롬프트 전달하기

이미지 파일을 OpenAI에 전달하여 프롬프트에 추가할 수도 있습니다.   
content에 image_url이나 base64로 불러온 이미지를 전달하면 됩니다.

In [None]:
# 링크로 이미지 전달하기

messages = [
    {"role": "user", "content": [
        {"type": "text",
                 "text": "이 그림을 묘사하고, 일반적인 그림과 비교해서 특이한 점을 언급하세요."
        },

        {"type": "image_url",
                "image_url": {"url": "https://oaidalleapiprodscus.blob.core.windows.net/private/org-8ja1zmL1JQYxwM0CONfqb0mW/user-kFZIFsjikxvZAHAG2O9ZZTca/img-jzt2ipkwSJqxUmz3Ggcyi3UE.png?st=2024-09-03T07%3A29%3A09Z&se=2024-09-03T09%3A29%3A09Z&sp=r&sv=2024-08-04&sr=b&rscd=inline&rsct=image/png&skoid=d505667d-d6c1-4a0a-bac7-5c84a87759f8&sktid=a48cca56-e6da-484e-a814-9c849652bcb3&skt=2024-09-02T23%3A44%3A55Z&ske=2024-09-03T23%3A44%3A55Z&sks=b&skv=2024-08-04&sig=M3NRQojSJtq8qWslVBbLD%2Bc682MnaIRVTgvQwUNWmS8%3D"}
        },
    ]}

]

response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages= messages,
    max_tokens=1024
)

print(response.choices[0].message.content)

In [None]:
# 오프라인 이미지 base64로 로드하여 저장하기
import base64

def encode_image(image_path):
  with open(image_path, "rb") as image_file:
    return base64.b64encode(image_file.read()).decode('utf-8')

# 이미지 경로
image_path = "your_image.png"
base64_image = encode_image(image_path)

messages = [
    {"role": "user", "content": [
        {"type": "text",
                 "text": "이 그림엔 무엇이 있나요?"
        },

        {"type": "image_url",
                "image_url": {"url": f"data:image/jpeg;base64,{base64_image}"}
        },
    ]}
]


response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages= messages,
    max_tokens=1024,
)

print(response.choices[0].message.content)


------

<br><br><br>

# Voice API(음성 API)

OpenAI의 TTS와 Whisper를 사용할 수 있습니다.

## Text-to-speech (텍스트 음성 변환, TTS)    

모델과 목소리(alloy, echo, fable, onyx, nova, shimmer), input을 입력하면 음성 파일을 생성합니다.


In [None]:
speech_file_path = "./test.mp3"

response = client.audio.speech.create(
  model="tts-1-hd", #"tts-1-hd" : 2x price, HD
  voice="nova",
  input="""LLM은 Large Language Model의 약자입니다. 대용량의 코퍼스를 학습시킨 머신 러닝 모델로,
최근 GPT-4o-mini가 출시되었습니다."""
)

response.stream_to_file(speech_file_path)
# 저장

## Speech-to-Text (음성 인식)   

OpenAI의 Whisper는 오디오 파일을 글자로 변환하는 전사(Transcription) 기능을 지원합니다.


pyaudio와 wave를 이용하여 음성을 녹음할 수 있습니다.

-- **코랩인 경우에는 아래의 코드가 실행되지 않으므로, 녹음 대신 위에서 만든 파일을 활용하겠습니다.**

In [None]:
# 관련 라이브러리 설치
!pip install pyaudio wave

In [None]:
import pyaudio
import wave

# 녹음 설정
FORMAT = pyaudio.paInt16  # 오디오 형식
CHANNELS = 1  # 모노 오디오
RATE = 44100  # 샘플링 레이트 (Hz)
CHUNK = 1024  # 버퍼 크기
RECORD_SECONDS = 5  # 녹음 시간 (초)
OUTPUT_FILENAME = "recorded_audio.wav"  # 저장할 파일 이름

# PyAudio 초기화
audio = pyaudio.PyAudio()

# 오디오 스트림 열기
stream = audio.open(format=FORMAT, channels=CHANNELS,
                    rate=RATE, input=True,
                    frames_per_buffer=CHUNK)

print("녹음 중...")

frames = []

# 녹음 데이터 수집
for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
    data = stream.read(CHUNK)
    frames.append(data)

print("녹음 완료!")

# 오디오 스트림 닫기
stream.stop_stream()
stream.close()
audio.terminate()

# WAV 파일로 저장
with wave.open(OUTPUT_FILENAME, 'wb') as wf:
    wf.setnchannels(CHANNELS)
    wf.setsampwidth(audio.get_sample_size(FORMAT))
    wf.setframerate(RATE)
    wf.writeframes(b''.join(frames))

print(f"녹음된 오디오가 '{OUTPUT_FILENAME}' 파일로 저장되었습니다.")

녹음된 파일의 경로를 집어넣어, 전사(transcript)를 수행합니다.

In [None]:
audio_file= open("./test.mp3", "rb")
transcript = client.audio.transcriptions.create(
  model="whisper-1",
  file=audio_file,
  prompt= 'GPT-4o-mini'
  # prompt를 통해 고유명사, 핵심 단어 등을 전달하여 반영하게 할 수 있음
)
transcript

In [None]:
transcript.text

### 실습) 위의 실습 코드들을 활용하여 OPEN AI의 GPT 모델의 답변을 음성으로 출력하기기