## Open AI API 활용
- Open AI API를 활용하여 실습을 진행합니다.
- Open AI 공식 문서
  - https://platform.openai.com/docs/overview

In [1]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


### Open API 인증 및 초기 설정
- 라이브러리 설치 ( openai, eotenv )
  - openai : openai에서 제공하는 api기능을 편리하게 사용할 수 있도록 해주는 라이브러리
  - dotenv : 파이썬에서 .env파일을 읽고 적용할 수 있도록 해주는 라이브러리

In [2]:
!pip install openai
!pip install python-dotenv

Collecting openai
  Downloading openai-1.35.3-py3-none-any.whl (327 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/327.4 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [91m━━━━━━━━━━━━━━━━━━━━━━━━━[0m[90m╺[0m[90m━━━━━━━━━━━━━━[0m [32m204.8/327.4 kB[0m [31m6.0 MB/s[0m eta [36m0:00:01[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m327.4/327.4 kB[0m [31m6.5 MB/s[0m eta [36m0:00:00[0m
Collecting httpx<1,>=0.23.0 (from openai)
  Downloading httpx-0.27.0-py3-none-any.whl (75 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m75.6/75.6 kB[0m [31m10.7 MB/s[0m eta [36m0:00:00[0m
Collecting httpcore==1.* (from httpx<1,>=0.23.0->openai)
  Downloading httpcore-1.0.5-py3-none-any.whl (77 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m77.9/77.9 kB[0m [31m11.1 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting h11<0.15,>=0.13 (from httpcore==1.*->httpx<1,>=0.23.0->openai)
  Downloading h11-0.14.0

In [3]:
# env파일 로드
from dotenv import load_dotenv

dotenv_path = '/content/drive/MyDrive/Colab Notebooks/Project/Chungbuk University/Capstone Design/AI_Model/PlantDiseaseDetection/env/gpt.env'
# verbose는 함수 작동시 추가정보 제공의 여부이다.
load_dotenv(dotenv_path, verbose=True)

True

#### openAI 객체 생성
- openai api를 다룰수있는 객체를 생성한다.
- 인자
  - organization= 조직 id
  - api_key= API key
  - project = project_id

In [4]:
import os
from openai import OpenAI

api_key = os.getenv('GPT_API_KEY')
organization = os.getenv('ORG_ID')
# project_id = os.getenv('PROJECT_ID')

client = OpenAI(
  organization=organization,
  api_key=api_key,
  # project = project_id
)

### Open AI API 주요 기능
  - Text generation
  - assistants
  - Speech to text (STT)
  - Text to speech (TTS)
  - Embeddings
  - Image generation
  - Vision
  - Fine-tuning

#### Text generation
- openAI의 텍스트 생성 모델은 자연어, 코드, 이미지를 이해할 수 있는 모델로 입력에 대한 응답으로 텍스트를 생성하여 출력한다. 이때 입력한 텍스트를 "프롬프트"라고 한다.
  - {openai 객체}.chat.completions.create(매개변수들): 해당 함수는 매개변수를 바탕으로 GPT가 새로운 텍스트 출력을 생성해내는 함수이다.
    - 인자
      - model : 현재 OpenAI가 제공하는 언어모델을 적는다
        - "gpt-4o" : GPT4의 가장 최신버전
        - "gpt-4-turbo" : 비전 기술을 탐지한 GPT4 모델. 비싸다.
        - "gpt-3.5-turbo": GPT 3의 최신 버전
      - message : 사용자와 시스템 또는 어시스턴트의 대화 히스토리를 담고있는 리스트
        - 대화객체
          - 예) {"role": "system", "content": "You are a helpful assistant."},
            - role (필수) : system, user, assistant가 있다.
            - content (필수) : 대화 내용이다.
            - name (선택) : 해당 참여자의 이름을 지정할 수 있다.
            - 각 role 별로 사용가능한 인자들이 더있지만 API문서를 참고바란다.
      - frequency_penalty: -2.0 ~ 2.0 의 숫자를 입력, 반복 된 답변을 제거 하기위해 패널티를 준다.
      - max_tokens : 최대 토큰을 설정한다. -> 돈아낌
      - response_format : 출력 형태를 지정할 수 있다.
        - 해당 기능은 gpt-3.5-Turbo 모델 중 "gpt-3.5-turbo-1106"보다 늦게 출시된 모델은 다 사용가능하고 GPT-4 Turbo모델마 사용가능하다.  
        - { "type" : "jsosn_object" } : 해당 값을 지정하면 모든 출력은 사용자가 정의한 json형식으로 제공된다.
        - { "type" : "text" } : 기본 모드이다
      - stream : 생성된 텍스트를 한번에 받을지 아니면 천천히 하나씩 받을지 정하는 매개변수이다.
      - temperature : 0~2 사이로 높으면 높을수록 랜덤한 답변이 만들어지고 낮으면 인풋과 관련성이 높아진다.
        - 일반적으로 높으면 0.8 낮으면 0.2 이다.



##### 기본 호출

In [None]:
# 호출 방법

response = client.chat.completions.create(
  model="gpt-3.5-turbo",
  messages=[
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "Who won the world series in 2020?"},
    {"role": "assistant", "content": "The Los Angeles Dodgers won the World Series in 2020."},
    {"role": "user", "content": "Where was it played?"}
  ]
)

print(response.choices[0].message.content)

The 2020 World Series was played at Globe Life Field in Arlington, Texas.


In [None]:
# 예시 응답 객체(json)
{
  "choices": [
    {
      "finish_reason": "stop",
      "index": 0,
      "message": {
        "content": "The 2020 World Series was played in Texas at Globe Life Field in Arlington.",
        "role": "assistant"
      },
      "logprobs": null
    }
  ],
  "created": 1677664795,
  "id": "chatcmpl-7QyqpwdfhqwajicIEznoc6Q47XAyW",
  "model": "gpt-3.5-turbo-0613",
  "object": "chat.completion",
  "usage": {
    "completion_tokens": 17,
    "prompt_tokens": 57,
    "total_tokens": 74
  }
}

##### Stream 활용
- stream은 OpenAI API의 비동기 스트림 API를 통해 반환된 데이터를 나타냄.
  - api 호출이 끝날때까지 모든 결과를 한번에 가져오는것이 아니라 순차적 전달
  - 대화를 조각조각 받아오면서 사용자에게 천천히 전달 가능
- 대량의 데이터를 처리할때 유리
- stream = True 설정


In [None]:

stream = client.chat.completions.create(
    model="gpt-3.5-turbo",
    messages=[{"role": "user", "content": "길게 말해줘"}],
    stream=True,
)
for chunk in stream:
    if chunk.choices[0].delta.content is not None:
        print(chunk.choices[0].delta.content, end="")

#### Function Calling
- GPT에게 함수를 미리 알려주면 필요할 때 함수를 GPT가 부른다는 것이다. 따라서 GPT가 자연어를 분석하고 함수를 실행할 때 필요한 인자를 알려준다.
- 즉, 사용자가 입력한 자연어를 이해하고 사용자 정의를 알맞게 작동할 수 있도록 해주는것이다.
- 해당 실습에는 chat Completions API를 사용하지만 Assistants API으로도 충분히 사용할 수 있다.

In [6]:
import json
def get_current_weather(location, unit="섭씨"):
    weather_info = {
        "location": location,
        "temperature": "24",
        "unit": unit,
        "forecast": ["sunny", "windy"],
    }
    return json.dumps(weather_info)

In [27]:
tools = [
    {
        "type": "function",
        "function": {
            "name": "get_current_weather",
            "description": "Get the current weather",
            "parameters": {
                "type": "object",
                "properties": {
                    "location": {
                        "type": "string",
                        "description": "지역이름 eg. 서울, 부산, 제주도",
                    },
                    "format": {
                        "type": "string",
                        "enum": ["섭씨", "화씨"],
                        "description": "온도의 단위를 지정합니다.",
                    },
                },
                "required": ["location", "format"],
            },
        }
    }
]

In [31]:
messages = [{"role": "user", "content": "지금 서울날씨를 화씨로 알려줘."}]
chat_response = client.chat.completions.create(
    model = 'gpt-3.5-turbo',
    messages = messages,
    tools = tools,
    tool_choice = None
)
# 만약 tool_calls = None이라면 함수를 사용할 필요가 없는 질문이다.
chat_response

ChatCompletion(id='chatcmpl-9dDwFoSV4LvuOIfPplK0a8Grg4dNy', choices=[Choice(finish_reason='tool_calls', index=0, logprobs=None, message=ChatCompletionMessage(content=None, role='assistant', function_call=None, tool_calls=[ChatCompletionMessageToolCall(id='call_UUirIkOd1kYQMentsFxlU9x0', function=Function(arguments='{"location":"서울","format":"화씨"}', name='get_current_weather'), type='function')]))], created=1719135399, model='gpt-3.5-turbo-0125', object='chat.completion', service_tier=None, system_fingerprint=None, usage=CompletionUsage(completion_tokens=24, prompt_tokens=118, total_tokens=142))

In [32]:
# None이면 정상 작
print(chat_response.choices[0].message.content)
# 인자
arg=chat_response.choices[0].message.tool_calls[0].function.arguments
print(arg)

None
{"location":"서울","format":"화씨"}


In [33]:
import json
json.loads(get_current_weather(arg))

{'location': '{"location":"서울","format":"화씨"}',
 'temperature': '24',
 'unit': '섭씨',
 'forecast': ['sunny', 'windy']}

#### Assistants API
- 기존 openAI.chat.complation과 달리 Assistants API는 개발자가 다양한 작업을 수행할 수 있는 강력한 AI 도우미를 구축할 수 있도록 설계되었다.
  - 예를들어 code_interpreter 및 file_serch와 같은 호스팅 도구로써 보조자를 실행시키거나 구축하는도구로 사용할 수 있다.
  - 영구 스레드에 액세스가 가능하다. 스레드는 메시지 기록을 저장하고 모델의 컨텍스트 길이에 비해 대화가 너무 길어지면 이를 잘라서 AI애플리케이션 개발을 단순화한다.
  - 아직 배타 버전이며 기존의 Text generation 방식(chat.complation)과 크게 다르진 않다. 하지만 어시스턴트는 영구적으로 시스템에게 자료나 벡터 디비를 연결하여 에이전트 역할을 수행하게 할 수 있다.
- GPT API에서 대화형 인공지능 모델을 지칭하는데 기본 gpt와 달리 특정 상황과 목적에 맞게 훈련되어 제공되는 모델이다.
  - 흐름
    - 사용자가 원하는대로 어시스턴트를 설정한다.
    - 대화를 시작하기 위해 스레드를 생성한다. (방 만들기)
    - 사용자가 질문을 위해 스레드에 메시지를 추가한다 ( 메시지 전송 )
    - 모델이 스레드에서 응답한다.

##### 1. 어시스턴트 생성
- 어시스턴트를 사용자에게 알맞게 설정하여 생성한다.
- 인수
  - instructions : 어시스턴트의 성경과 목표를 지정 할 수 있다.
  - tools : 어시스턴트에 openapi에서 제공하는 다양한 도구에 대한 엑세스 권한을 부여한다.
    - 주요 도구
      - type
        - code_interpreter
        - file_search
        - Function
    - tool_resources : 각각의 도구에서 사용할 수 있는 파일 형태의 자료를 제공해줄 수 있다.
      - 각 최대 크기는 512MB, vector_store 개체 사용

In [None]:
assistant = client.beta.assistants.create(
  name="이종현",
  instructions="너는 충북대학교 소프트웨어학과 이종현이야.",
  tools=[{"type": "code_interpreter"}],
  model="gpt-3.5-turbo",
)

##### 2. 스레드 생성
- 스레드는 어시스턴트와 사용자간의 대화 세션이다. 스레드는 메시지를 저장하고 자동으로 길이를 조절하여 모델의 크기를 관리한다.
- 스레드 및 메시지 관리
  - 스레드에 저장할 수 있는 메시지 수에 제한은 없지만 메시지의 크기가 너무 크면 스레드는 가장 덜 중요하다고 생각되는 메시지를 삭제한

In [None]:
# 초기 메시지가 들어있는 스레드 생성(파일을 첨부)
thread = client.beta.threads.create(
  messages=[
    {
      "role": "user",
      "content": "Create 3 data visualizations based on the trends in this file.",
      # "attachments": [
      #   {
      #     "file_id": file.id,
      #     "tools": [{"type": "code_interpreter"}]
      #   }
      # ]
    }
  ]
)

In [None]:
# 이미지 url을 같이 메시지에 첨부 (vision을 지원하는 gpt model만 사용가능)

# file = client.files.create(
#   file=open("myimage.png", "rb"),
#   purpose="vision"
# )

thread = client.beta.threads.create(
  messages=[
    {
      "role": "user",
      "content": [
        {
          "type": "text",
          "text": "What is the difference between these images?"
        },
        # {
        #   "type": "image_url",
        #   "image_url": {
            #   "url": "https://example.com/image.png",
            #   "detail": "high" # 고해상도 이미지
            # }
        # },
        # {
        #   "type": "image_file",
        #   "image_file": {"file_id": file.id}
        # },
      ],
    }
  ]
)

##### 3. 스레드에 메시지 추가

In [None]:
message = client.beta.threads.messages.create(
  thread_id=thread.id,
  role="user",
  content="I need to solve the equation `3x + 11 = 14`. Can you help me?"
)

##### 4. 응답(Create a Run)
- 사용자가 메시지를 추가하면 assistant를 활용하여 응답 메시지를 제

In [None]:
run = client.beta.threads.runs.create_and_poll(
  thread_id=thread.id,
  assistant_id=assistant.id,
  # 보통 어시스턴트를 생성할때 설정하지만 유연성을 높이기 위해 재정의할 수 있다.
  # model="gpt-4o",
  # instructions="New instructions that override the Assistant instructions",
  # tools=[{"type": "code_interpreter"}, {"type": "file_search"}]
)

In [None]:
if run.status == 'completed':
  messages = client.beta.threads.messages.list(
    thread_id=thread.id
  )
  print(messages)
else:
  print(run.status)

#### Speech to text

In [None]:
audio_file = open("/content/drive/MyDrive/Colab Notebooks/Project/Chungbuk University/Capstone Design/AI_Model/PlantDiseaseDetection/public/audio/testAudio.mp3", "rb")

transcription = client.audio.transcriptions.create(
  model="whisper-1",
  file=audio_file,
  response_format="text"
)
print(transcription)

안녕하세요. 저는 충북대학교에 다니는 이종현입니다. 저는 개발자를 꿈꾸고 있고요. 지금 취업을 준비하고 있습니다. 감사합니다.



#### Text to Speech

In [None]:
from pathlib import Path
import os

# 현재 작업 디렉토리를 기반으로 파일 경로 생성
speech_file_path = Path(os.getcwd()) / "speech.mp3"

# 나머지 코드는 동일하게 유지
response = client.audio.speech.create(
  model="tts-1",
  voice="alloy",
  input="안녕하세요. 이종현이에요. 야구선수 원성준은 성준이가 아니에용",
  timeout=30,
)

response.stream_to_file(speech_file_path)

  response.stream_to_file(speech_file_path)


In [None]:
from IPython.display import Audio

# mp3 파일을 읽고 재생
Audio(speech_file_path, autoplay=True)

#### Translations
- 오디오파일을 읽고 영어로 번역됨 ( 설정 가능 )

In [None]:
audio_file= open("/content/drive/MyDrive/Colab Notebooks/Project/Chungbuk University/Capstone Design/AI_Model/PlantDiseaseDetection/public/audio/gizmo.mp4", "rb")
translation = client.audio.translations.create(
  model="whisper-1",
  file=audio_file
)
print(translation.text)

Please exit. Thank you.
