# OpenAI API 사용 실습

In [1]:
%pip install --upgrade openai

Note: you may need to restart the kernel to use updated packages.


In [2]:
%pip show openai

Name: openai
Version: 1.12.0
Summary: The official Python library for the openai API
Home-page: 
Author: 
Author-email: OpenAI <support@openai.com>
License: 
Location: D:\강의자료\생성형AI로AI애플리케이션개발하기\py311\Lib\site-packages
Requires: anyio, distro, httpx, pydantic, sniffio, tqdm, typing-extensions
Required-by: 
Note: you may need to restart the kernel to use updated packages.


### 1. Import openai 라이브러리

In [1]:
import os
import json
from openai import OpenAI

### 2. OpenAI API Key 환경변수에 등록 방법   
- Windows : setx OPENAI_API_KEY "your-api-key-here"  
- Linux / MacOS : echo "export OPENAI_API_KEY='your-api-key-here'" >> ~/.bashrc ; source ~/.bashrc

- .env 파일 사용 : https://blog.gilbok.com/how-to-use-dot-env-in-python/

**Best Practices for API Key Safety** : https://help.openai.com/en/articles/5112595-best-practices-for-api-key-safety

In [5]:
# client = OpenAI(
#     api_key=os.environ.get(
#         "OPENAI_API_KEY", "<your OpenAI API key if not set as env var>"
#     )
# )

client = OpenAI()

### 3. chat completion API call 파라미터
- model : 사용하려는 모델의 이름(예 : gpt-3.5-turbo, gpt-4, gpt-3.5-turbo-16k-1106)    
- messages : 메시지 객체의 목록으로, 각 객체에는 두 개의 필수 필드가 있음   
    - role : 메신저의 역할(system, user, assistant, tool 중 하나)   
    - content : 메시지의 내용(예 : 아름다운 시를 써주세요)  
- temperature: 사용할 샘플링 온도(0에서 2 사이)
    값이 높을수록 출력을 더 무작위로(random) 만들고, 낮은 값은 더 결정적임(deterministic)
- 참고 : https://cookbook.openai.com/examples/how_to_format_inputs_to_chatgpt_models

In [9]:
MODEL = "gpt-3.5-turbo"
response = client.chat.completions.create(
    model=MODEL,
    messages=[
        {
            "role": "system",
            "content": "당신은 창의적인 감각으로 복잡한 프로그래밍 개념을 설명하는 데 능숙한 시인입니다.",
        },
        {"role": "user", "content": "생성형AI로 AI솔루션을 개발하는 것을 아름답게 표현하는 시를 작성해 주세요."},
    ],
    temperature=0,
)

In [10]:
print(response.choices[0].message.content)

인간의 상상력을 초월하는 창조의 능력,
데이터의 강력한 힘을 이끌어내는 창조의 미학.

코드의 갈고리로 뜻을 엮어,
알고리즘의 춤으로 미래를 예언하리.

데이터의 바다를 누비는 AI의 선원,
창조의 세계를 탐험하는 AI의 항해사.

생성형 AI가 불어넣는 생명의 숨결,
미래를 밝히는 AI의 빛나는 꿈.


### 4. Hallucination(환각)

In [15]:
MODEL = "gpt-3.5-turbo"
response = client.chat.completions.create(
    model=MODEL,
    messages=[
        {"role": "system", "content": "당신은 가수 정보를 잘 알고 있는 사람이야"},
        {"role": "user", "content": "나와 내 동년배들이 좋아하는 뉴진스에 대해서 알려줘."},
    ],
    temperature=0,
)

In [16]:
print(response.choices[0].message.content)

뉴진스(New Jeans)는 대한민국의 4인조 남성 보이 그룹으로, 2021년에 데뷔한 신예 그룹입니다. 멤버들은 김민석, 이태윤, 김민규, 김민재로 구성되어 있습니다. 뉴진스는 데뷔 이후 꾸준한 활동을 펼치며 다채로운 음악과 매력적인 무대 퍼포먼스로 팬들의 사랑을 받고 있습니다. 또한 멤버들은 각자의 개성과 보컬 실력으로 다양한 음악 장르를 소화하며 다채로운 음악 세계를 보여주고 있습니다. 뉴진스는 앞으로 더욱 더 성장하여 음악 씬에서 빛을 발휘할 것으로 기대됩니다.


In [17]:
MODEL = "gpt-3.5-turbo"
response = client.chat.completions.create(
    model=MODEL,

    messages=[

        {"role": "system", "content": "당신이 모르는 내용이거나, 답변 내용이 정확하지 않다면 '잘 모르겠어'라고 대답해야 해"},

        {"role": "user", "content": "나와 내 동년배들이 좋아하는 뉴진스에 대해서 알려줘."},

    ],
    temperature=0,
)

In [18]:
print(response.choices[0].message.content)

잘 모르겠어. 뉴진스가 무엇인지 자세히 설명해줄 수 있겠니?


### 5. 목록 생성

In [1]:
def complete(prompt):
    MODEL = "gpt-3.5-turbo"
    response = client.chat.completions.create(
        model=MODEL,
        messages=[{"role": "user", "content": prompt}],
        temperature=0,
    )
    return response.choices[0].message.content

In [21]:
item = "생성형 AI 활용방법"
prompt = f'"{item}"에 대한 발표자료 개요를 계층적 구조로 번호를 붙혀서 작성해줘.\n\n다음은 구조의 예이야.\n\n1. 서론 \n a. 디지털 마케팅의 정의 \n2. 디지털 마케팅의 유형 \n a. 검색 엔진 최적화 \n b. 소셜 미디어 마케팅 \n c. 콘텐츠 마케팅 \n d. 클릭당 지불 광고 \n e. 이메일 마케팅 \n3. 디지털 마케팅의 이점 \n a. 비용 효율적 \n b. 타겟 고객 \n c. 측정 가능한 결과 \n d. 도달 범위 증가 \n\n----\n'
result = complete(prompt)

In [22]:
print(result)

1. 소개
 a. AI의 개념
 b. 생성형 AI 소개
2. 생성형 AI의 활용 방법
 a. 콘텐츠 생성
 b. 음성 인식 기술
 c. 이미지 생성
 d. 자동 번역
3. 생성형 AI의 장점
 a. 작업 효율성 향상
 b. 인간 에러 감소
 c. 시간 절약
 d. 창의성 증대
4. 생성형 AI의 활용 사례
 a. 마케팅 분야
 b. 의료 분야
 c. 교육 분야
 d. 예술 분야
5. 결론
 a. 생성형 AI의 미래 가능성
 b. 발전 방향과 과제


### 6. 임베딩(Embedding)
- https://platform.openai.com/docs/guides/embeddings

In [31]:
from openai import OpenAI

client = OpenAI()

In [32]:
def get_embedding(text, model="text-embedding-3-small"):
    text = text.replace("\n", " ")
    return client.embeddings.create(input=[text], model=model).data[0].embedding

In [34]:
embedding = get_embedding("I love this candy.")

In [37]:
print(embedding)

[0.022345887, -0.02064857, -0.069424115, -0.022613885, -0.03221075, -0.023839017, -0.009801052, 0.03101114, -0.034380253, -0.039536014, -0.012755405, -0.05171076, 0.011058087, -0.02978601, 0.020597523, -0.016756225, -0.0032526602, 0.0102285715, 0.055896625, -0.018849159, 0.025383193, 0.013948632, -0.0139358705, 0.03708575, 0.0063043223, -0.032006558, 0.033104073, 0.02565119, 0.019385153, -0.035630908, -0.0013184521, -0.027514411, -0.033410355, -0.0644215, -0.0003359939, -0.045355387, -0.020993138, 0.009973336, 0.00900344, 0.015913947, -0.036447663, 0.0064702258, 0.018096212, 0.032414936, 0.022103414, 0.0011190491, -0.08111391, 0.028637448, 0.0059374208, 0.020406095, -0.050536674, 0.049541254, -0.031036664, 0.034609962, 0.023596542, 0.02071238, 0.0059342305, 0.016832795, 0.0013248329, -0.002458239, 0.0007681, -0.0047122897, -0.017381553, -0.035630908, 0.0048335264, 0.02493653, 0.0032670172, -0.049183924, 0.03963811, 0.012034364, 0.021822654, 0.022626646, -0.048775546, 0.0028347117, 0.00

In [38]:
len(embedding)

1536

### 7. 임베딩 벡터 유사도 비교 
![similarity_img](https://miro.medium.com/v2/resize:fit:1400/0*mlEd2VVuBPWYUmmD.png)

In [44]:
%pip install numpy faiss-cpu

Collecting numpy
  Using cached numpy-1.26.4-cp311-cp311-win_amd64.whl.metadata (61 kB)
Using cached numpy-1.26.4-cp311-cp311-win_amd64.whl (15.8 MB)
Installing collected packages: numpy
Successfully installed numpy-1.26.4
Note: you may need to restart the kernel to use updated packages.


##### Vector 유사도 비교 흐름도
![similarity_img](https://miro.medium.com/v2/resize:fit:1400/0*mlEd2VVuBPWYUmmD.png)

In [45]:
import faiss
import numpy as np
import openai

In [46]:
class Chatbot:
    def __init__(self, index, embeddings, documents, system_message):
        self.index = index
        self.embeddings = embeddings
        self.documents = documents
        self.system_message = system_message
        self.chat_history = []
    
    def get_embedding(self, text, model="text-embedding-3-small"):
        text = text.replace("\n", " ")
        return openai.embeddings.create(input=[text], model=model).data[0].embedding

    def find_similar_document(self, user_embedding):
        _, top_indices = self.index.search(np.array([user_embedding]), 1)
        top_index = top_indices[0][0]
        return self.documents[top_index]

    def chat(self, user_input):
        user_embedding = self.get_embedding(user_input)
        similar_document = self.find_similar_document(user_embedding)
        system_message = self.system_message + " " + similar_document

        messages = [{"role": "system", "content": system_message}]
        for message in self.chat_history:
            messages.append(message)
        messages.append({"role": "user", "content": user_input})

        response = client.chat.completions.create(
            model="gpt-3.5-turbo",
            messages=messages,
            temperature=0,
        )
        assistant_message = response.choices[0].message.content

        self.chat_history.append({"role": "user", "content": user_input})
        self.chat_history.append({"role": "assistant", "content": assistant_message})

        return assistant_message

In [47]:
# 사용자 제공 데이터 
documents = [
    "생성형 AI 강의 신청 기간: 2024년 2월 25일 15시 30분",
    "생성형 AI 강의 신청 사이트: https://github.com/kgpark88/genai",
    "생성형 AI 정의 : 생성형 AI는 새로운 텍스트, 이미지, 동영상, 오디오 또는 코드를 만들 수 있는 인공지능의 한 범주입니다."
]

In [48]:
# 임베딩 벡터 사전 생성
embeddings = [get_embedding(doc) for doc in documents]
embedding_matrix = np.array(embeddings)
index = faiss.IndexFlatL2(embedding_matrix.shape[1])
index.add(embedding_matrix)

In [55]:
# 시스템 메시지
system_message = "당신은 다음 내용을 참고해서 답변하는 친철한 도우미 챗봇입니다. 당신이 모르는 내용은 '아직, 해당 내용을 알 수 없습니다.' 답변해야 합니다."

In [56]:
# 챗봇 객체 생성
chatbot = Chatbot(index, embeddings, documents, system_message)

In [66]:
# 사용자 입력 
user_input = "생성형 AI 강의를 듣고 싶은데, 언제까지 신청하면 되니?"
# user_input = "생성형 AI 강의 수강신청은 어디서 하면 될까?"
# user_input = "생성형 AI 과목은 몇학점이야?"

In [67]:
# 사용자 데이터 기반 채팅 결과
result = chatbot.chat(user_input)
print(result)

생성형 AI 강의 신청 기간은 2024년 2월 25일 15시 30분까지입니다. 빠르게 신청하시어 원하는 강의를 수강하시기 바랍니다.


### 8. 음성인식 -  Whisper(ASR, Automatic Speech Recognition) 
- 참고 : https://github.com/openai/whisper

In [19]:
%pip install -U openai-whisper

Collecting openai-whisper
  Downloading openai-whisper-20231117.tar.gz (798 kB)
     ---------------------------------------- 0.0/798.6 kB ? eta -:--:--
      --------------------------------------- 10.2/798.6 kB ? eta -:--:--
      --------------------------------------- 10.2/798.6 kB ? eta -:--:--
      --------------------------------------- 10.2/798.6 kB ? eta -:--:--
      --------------------------------------- 10.2/798.6 kB ? eta -:--:--
     - ----------------------------------- 30.7/798.6 kB 145.2 kB/s eta 0:00:06
     - ----------------------------------- 41.0/798.6 kB 151.3 kB/s eta 0:00:06
     - ----------------------------------- 41.0/798.6 kB 151.3 kB/s eta 0:00:06
     -- ---------------------------------- 61.4/798.6 kB 204.8 kB/s eta 0:00:04
     ---- -------------------------------- 92.2/798.6 kB 275.8 kB/s eta 0:00:03
     ------ ----------------------------- 153.6/798.6 kB 416.7 kB/s eta 0:00:02
     ---------- ------------------------- 235.5/798.6 kB 576.2 kB/s eta

#### ffmpeg 설치 및 PATH 환경변수에 등록  

https://www.gyan.dev/ffmpeg/builds/

In [6]:
import whisper

model = whisper.load_model("base")
result = model.transcribe("./audio.mp3")

In [7]:
print(result["text"])

 당신이 지금 살고 있는 삼도한 수백만의 꿈입니다. 그래서 항상 당신의 삶에 만족하십시오 인생의 모든 순간에 행복하십시오.


### 9. 이미지 생성 - DALL·E 3

In [None]:
from openai import OpenAI

client = OpenAI()
response = client.images.generate(
    model="dall-e-3",
    prompt="균일한 외관, 넓은 도로 및 녹지 공간의 통합을 보여주는 파리의 오스만 대로 이미지를 생성해줘.",
    n=1, 
    size="1024x1024" 
)

In [None]:
print(response)

In [None]:
print(response.data[0].url)