# OpenAI API 사용 실습

In [1]:
%pip install --upgrade openai

Note: you may need to restart the kernel to use updated packages.


In [2]:
%pip show openai

Name: openai
Version: 1.14.3
Summary: The official Python library for the openai API
Home-page: 
Author: 
Author-email: OpenAI <support@openai.com>
License: 
Location: C:\genai-main\py311\Lib\site-packages
Requires: anyio, distro, httpx, pydantic, sniffio, tqdm, typing-extensions
Required-by: 
Note: you may need to restart the kernel to use updated packages.


### 1. Import openai 라이브러리

In [3]:
import os
import json
from openai import OpenAI

### 2. OpenAI API Key 환경변수에 등록 방법   
- Windows : setx OPENAI_API_KEY "your-api-key-here"  
- Linux / MacOS :
  echo "export OPENAI_API_KEY='your-api-key-here'" >> ~/.bashrc ; source ~/.bashrc

- .env 파일 사용 : https://blog.gilbok.com/how-to-use-dot-env-in-python/

**API 키 안전을 위한 모범 사례** : https://help.openai.com/en/articles/5112595-best-practices-for-api-key-safety

In [4]:
# os.environ.get('OPENAI_API_KEY')

In [5]:
# client = OpenAI(
#     api_key=os.environ.get(
#         "OPENAI_API_KEY", "<your OpenAI API key if not set as env var>"
#     )
# )

client = OpenAI()

### 3. chat completion API call 파라미터
- model : 사용하려는 모델의 이름(예 : gpt-3.5-turbo, gpt-4, gpt-3.5-turbo-16k-1106)    
- messages : 메시지 객체의 목록으로, 각 객체에는 두 개의 필수 필드가 있음   
    - role : 메신저의 역할(system, user, assistant, tool 중 하나)   
    - content : 메시지의 내용(예 : 아름다운 시를 써주세요)  
- temperature: 사용할 샘플링 온도(0에서 2 사이), 값이 높을수록 출력을 더 무작위로(random) 만들고,   
  낮은 값은 더  결정론적(deterministic)으로 만듭니다.  
- 참고 : https://cookbook.openai.com/examples/how_to_format_inputs_to_chatgpt_models

In [6]:
MODEL = "gpt-3.5-turbo"
response = client.chat.completions.create(
    model=MODEL,
    messages=[
        {
            "role": "system",
            "content": "당신은 창의적인 감각으로 복잡한 프로그래밍 개념을 설명하는 데 능숙한 시인입니다.",
        },
        {"role": "user", "content": "생성형AI로 AI솔루션을 개발하는 것을 아름답게 표현하는 시를 작성해 주세요."},
    ],
    temperature=0,
)

In [7]:
print(response.choices[0].message.content)

인간의 상상력을 초월하는 창조의 빛,
데이터의 강을 건너 AI의 세계로 향하는 길,
알고리즘의 미로를 헤치며 우리는 나아가네.

코드의 갈대를 휘날리며 미래를 열어가는,
창의의 꽃을 피우는 AI의 정원,
생성형AI가 우리에게 선사하는 선율.

데이터의 물결을 타고 춤추는 AI의 춤,
지식의 바다를 항해하는 AI의 선원,
우리의 손끝에서 탄생하는 창조의 기적.


### 4. Hallucination(환각)

In [8]:
MODEL = "gpt-3.5-turbo"
response = client.chat.completions.create(
    model=MODEL,
    messages=[
        {"role": "system", "content": "당신은 가수 정보를 잘 알고 있는 사람이야"},
        {"role": "user", "content": "나와 내 동년배들이 좋아하는 뉴진스에 대해서 알려줘."},
    ],
    temperature=0,
)

In [9]:
print(response.choices[0].message.content)

뉴진스(New Jeans)는 대한민국의 4인조 남성 보이 그룹으로, 2021년에 데뷔한 신예 그룹입니다. 그들은 다채로운 음악 스타일과 강렬한 퍼포먼스로 주목을 받고 있습니다. 뉴진스는 멤버들 간의 화합과 친밀한 분위기로 유명하며, 팬들 사이에서도 따뜻한 인간미를 발산하고 있습니다. 뉴진스는 앞으로 더 많은 사랑을 받을 것으로 기대되는 그룹 중 하나입니다. 현재까지는 데뷔 싱글 앨범인 'New Jeans'로 활동 중이며, 앞으로 더 다채로운 음악과 활동을 펼칠 것으로 예상됩니다.


In [10]:
MODEL = "gpt-3.5-turbo"
response = client.chat.completions.create(
    model=MODEL,

    messages=[

        {"role": "system", "content": "당신이 모르는 내용이거나, 답변 내용이 정확하지 않다면 '잘 모르겠어'라고 대답해야 해"},

        {"role": "user", "content": "나와 내 동년배들이 좋아하는 뉴진스에 대해서 알려줘."},

    ],
    temperature=0,
)

In [11]:
print(response.choices[0].message.content)

죄송하지만, '뉴진스'에 대해서 정확한 정보를 알고 있지는 않습니다. 잘 모르겠어요. 다른 질문이 있으시면 도와드릴 수 있을 것 같아요.


### 5. 내용을 목록으로 생성

In [12]:
def complete(prompt):
    MODEL = "gpt-3.5-turbo"
    response = client.chat.completions.create(
        model=MODEL,
        messages=[{"role": "user", "content": prompt}],
        temperature=0,
    )
    return response.choices[0].message.content

In [13]:
item = "생성형 AI 활용방법"
prompt = f'"{item}"에 대한 발표자료 개요를 계층적 구조로 번호를 붙혀서 작성해줘.\n\n다음은 구조의 예이야.\n\n1. 서론 \n a. 디지털 마케팅의 정의 \n2. 디지털 마케팅의 유형 \n a. 검색 엔진 최적화 \n b. 소셜 미디어 마케팅 \n c. 콘텐츠 마케팅 \n d. 클릭당 지불 광고 \n e. 이메일 마케팅 \n3. 디지털 마케팅의 이점 \n a. 비용 효율적 \n b. 타겟 고객 \n c. 측정 가능한 결과 \n d. 도달 범위 증가 \n\n----\n'
result = complete(prompt)

In [14]:
print(result)

1. 소개
 a. AI의 개념
 b. 생성형 AI 소개
2. 생성형 AI의 활용 분야
 a. 음성 인식 기술
 b. 이미지 분석 기술
 c. 자연어 처리 기술
3. 생성형 AI의 장점
 a. 작업 자동화
 b. 정확성 향상
 c. 시간 절약
4. 생성형 AI의 활용 방법
 a. 고객 서비스 자동화
 b. 콘텐츠 생성
 c. 예측 분석
5. 결론
 a. 생성형 AI의 미래 전망


### 6. 임베딩(Embedding)
- https://platform.openai.com/docs/guides/embeddings

In [15]:
from openai import OpenAI

client = OpenAI()

In [16]:
def get_embedding(text, model="text-embedding-3-small"):
    text = text.replace("\n", " ")
    return client.embeddings.create(input=[text], model=model).data[0].embedding

In [17]:
embedding = get_embedding("I love this candy.")

In [18]:
print(embedding)

[0.02236716, -0.020631887, -0.069308855, -0.022635108, -0.032230146, -0.023834487, -0.00978005, 0.031005248, -0.0343482, -0.039554022, -0.012740223, -0.05175197, 0.011068746, -0.029780349, 0.02059361, -0.016702004, -0.0032025997, 0.010207489, 0.055886004, -0.018858336, 0.025403889, 0.013945982, -0.013971501, 0.037104223, 0.006290365, -0.03200048, 0.033123303, 0.025659075, 0.01940699, -0.035675175, -0.0013134168, -0.027483664, -0.033404008, -0.064409256, -0.00027392755, -0.045321252, -0.021001909, 0.00999058, 0.0089953495, 0.015923683, -0.036466256, 0.006453047, 0.018054496, 0.032434296, 0.022086455, 0.0010781661, -0.08114954, 0.028606487, 0.0059394827, 0.020427737, -0.05055259, 0.04958288, -0.031030767, 0.034679946, 0.02356654, 0.020733962, 0.005913964, 0.016842358, 0.0012863032, -0.0025008349, 0.0007675553, -0.0047177738, -0.017365491, -0.035624135, 0.0048070895, 0.024919033, 0.0032648016, -0.04917458, 0.03960506, 0.012032078, 0.021729192, 0.022647867, -0.048766278, 0.002837363, 0.006

In [19]:
len(embedding)

1536

### 7. 임베딩 벡터 유사도 비교 

In [20]:
%pip install -qU numpy faiss-cpu

Note: you may need to restart the kernel to use updated packages.


##### Vector 유사도 비교 흐름도
![similarity_img](https://miro.medium.com/v2/resize:fit:1400/0*mlEd2VVuBPWYUmmD.png)

In [21]:
import faiss
import numpy as np
import openai

In [22]:
class Chatbot:
    def __init__(self, index, embeddings, documents, system_message):
        self.index = index
        self.embeddings = embeddings
        self.documents = documents
        self.system_message = system_message
        self.chat_history = []
    
    def get_embedding(self, text, model="text-embedding-3-small"):
        text = text.replace("\n", " ")
        return openai.embeddings.create(input=[text], model=model).data[0].embedding

    def find_similar_document(self, user_embedding):
        _, top_indices = self.index.search(np.array([user_embedding]), 1)
        top_index = top_indices[0][0]
        return self.documents[top_index]

    def chat(self, user_input):
        user_embedding = self.get_embedding(user_input)
        similar_document = self.find_similar_document(user_embedding)
        system_message = self.system_message + " " + similar_document

        messages = [{"role": "system", "content": system_message}]
        for message in self.chat_history:
            messages.append(message)
        messages.append({"role": "user", "content": user_input})

        response = client.chat.completions.create(
            model="gpt-3.5-turbo",
            messages=messages,
            temperature=0,
        )
        assistant_message = response.choices[0].message.content

        self.chat_history.append({"role": "user", "content": user_input})
        self.chat_history.append({"role": "assistant", "content": assistant_message})

        return assistant_message

In [23]:
# 사용자 제공 데이터 
documents = [
    "생성형 AI 강의 신청 기간: 2024년 2월 25일 15시 30분",
    "생성형 AI 강의 신청 사이트: https://github.com/kgpark88/genai",
    "생성형 AI 정의 : 생성형 AI는 새로운 텍스트, 이미지, 동영상, 오디오 또는 코드를 만들 수 있는 인공지능의 한 범주입니다."
]

In [24]:
# 임베딩 벡터 사전 생성
embeddings = [get_embedding(doc) for doc in documents]
embedding_matrix = np.array(embeddings)
index = faiss.IndexFlatL2(embedding_matrix.shape[1])
index.add(embedding_matrix)

In [25]:
# 시스템 메시지
system_message = "당신은 다음 내용을 참고해서 답변하는 친철한 도우미 챗봇입니다. 당신이 모르는 내용은 '아직, 해당 내용을 알 수 없습니다.' 답변해야 합니다."

In [26]:
# 챗봇 객체 생성
chatbot = Chatbot(index, embeddings, documents, system_message)

In [27]:
# 사용자 입력 
user_input = "생성형 AI 강의를 듣고 싶은데, 언제까지 신청하면 되니?"
# user_input = "생성형 AI 강의 수강신청은 어디서 하면 될까?"
# user_input = "생성형 AI 과목은 몇학점이야?"

In [28]:
# 사용자 데이터 기반 채팅 결과
result = chatbot.chat(user_input)
print(result)

생성형 AI 강의 신청 기간은 2024년 2월 25일 15시 30분까지입니다. 빠르게 신청해주시기 바랍니다!


### 8. 음성인식 : Whisper(ASR, Automatic Speech Recognition) 
- 참고 : https://github.com/openai/whisper

In [29]:
%pip install -U openai-whisper

Collecting openai-whisper
  Using cached openai_whisper-20231117-py3-none-any.whl
Collecting numba (from openai-whisper)
  Using cached numba-0.59.1-cp311-cp311-win_amd64.whl.metadata (2.8 kB)
Collecting torch (from openai-whisper)
  Using cached torch-2.2.1-cp311-cp311-win_amd64.whl.metadata (26 kB)
Collecting more-itertools (from openai-whisper)
  Using cached more_itertools-10.2.0-py3-none-any.whl.metadata (34 kB)
Collecting tiktoken (from openai-whisper)
  Using cached tiktoken-0.6.0-cp311-cp311-win_amd64.whl.metadata (6.8 kB)
Collecting llvmlite<0.43,>=0.42.0dev0 (from numba->openai-whisper)
  Using cached llvmlite-0.42.0-cp311-cp311-win_amd64.whl.metadata (4.9 kB)
Collecting regex>=2022.1.18 (from tiktoken->openai-whisper)
  Using cached regex-2023.12.25-cp311-cp311-win_amd64.whl.metadata (41 kB)
Collecting filelock (from torch->openai-whisper)
  Using cached filelock-3.13.3-py3-none-any.whl.metadata (2.8 kB)
Collecting sympy (from torch->openai-whisper)
  Using cached sympy-1.12

#### ffmpeg 설치 및 PATH 환경변수에 등록  

https://www.gyan.dev/ffmpeg/builds/

In [1]:
import whisper

model = whisper.load_model("base")
result = model.transcribe("./audio.mp3")



In [2]:
print(result["text"])

 당신이 지금 살고 있는 삼도한 수백만의 꿈입니다. 그래서 항상 당신의 삶에 만족하십시오 인생의 모든 순간에 행복하십시오.


### 9. 이미지 생성 : DALL-E 
- 참고 : https://platform.openai.com/docs/guides/images/usage?context=node

In [3]:
from openai import OpenAI
client = OpenAI()

# model="dall-e-3"
model="dall-e-2"

response = client.images.generate(
  model=model,
  prompt="a white siamese cat",
  size="1024x1024",
  quality="standard",
  n=1,
)

image_url = response.data[0].url

In [4]:
print(image_url)

https://oaidalleapiprodscus.blob.core.windows.net/private/org-kZ0rtkNPWWTOJAB91GrAQwrl/user-kBavtEUmFAbrBn4Kg2NkOqbG/img-0VFFnHrvAo3NCY3x6XgQJ6wf.png?st=2024-03-26T13%3A29%3A20Z&se=2024-03-26T15%3A29%3A20Z&sp=r&sv=2021-08-06&sr=b&rscd=inline&rsct=image/png&skoid=6aaadede-4fb3-4698-a8f6-684d7786b067&sktid=a48cca56-e6da-484e-a814-9c849652bcb3&skt=2024-03-25T21%3A13%3A05Z&ske=2024-03-26T21%3A13%3A05Z&sks=b&skv=2021-08-06&sig=X0IHprz0IC8NPioG%2BccOSAIlqqVaKXnjP8KXUlo1jNs%3D


![image.png](attachment:8736aeae-726d-4600-8bd7-41ed10937850.png)