In [1]:
pip install --upgrade openai

Collecting openai
  Downloading openai-1.54.4-py3-none-any.whl.metadata (24 kB)
Downloading openai-1.54.4-py3-none-any.whl (389 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m389.6/389.6 kB[0m [31m6.3 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: openai
  Attempting uninstall: openai
    Found existing installation: openai 0.28.0
    Uninstalling openai-0.28.0:
      Successfully uninstalled openai-0.28.0
Successfully installed openai-1.54.4


In [1]:
pip install openai==0.28



In [2]:
import openai
import requests
from PIL import Image
from io import BytesIO

# OpenAI API 키 설정
openai.api_key = ""

# 1. Whisper API: 오디오 파일에서 텍스트 추출
def transcribe_audio_with_whisper(audio_file_path):
    """
    최신 OpenAI Python 라이브러리를 사용하여 Whisper API를 호출합니다.
    """
    try:
        print("Transcribing audio using Whisper API...")
        with open(audio_file_path, "rb") as audio_file:
            transcription = openai.Audio.transcribe(
                model="whisper-1",  # Whisper 모델
                file=audio_file    # 오디오 파일
            )
        print("Transcription completed.")
        return transcription["text"]
    except Exception as e:
        print(f"Error in transcription: {e}")
        return None

# 2. ChatGPT API: 텍스트 요약
def summarize_text(text):
    """
    ChatGPT API를 사용하여 텍스트를 요약합니다.
    """
    try:
        print("Summarizing text using ChatGPT...")
        response = openai.ChatCompletion.create(
            model="gpt-4-turbo",  # 또는 gpt-3.5-turbo
            messages=[
                {"role": "system", "content": "Summarize the following text concisely:"},
                {"role": "user", "content": text}
            ]
        )
        summary = response['choices'][0]['message']['content']
        print("Summary generated.")
        return summary
    except Exception as e:
        print(f"Error in summarization: {e}")
        return None

# 3. DALL-E API: 요약 내용을 기반으로 이미지 생성
def generate_thumbnail_image(summary_text):
    """
    DALL-E API를 사용하여 텍스트 기반 이미지를 생성합니다.
    """
    try:
        print("Generating thumbnail using DALL-E...")
        image_response = openai.Image.create(
            prompt=f"Create a visually appealing thumbnail representing: {summary_text}",
            size="1024x1024"
        )
        print("DALL-E Response:", image_response)  # 응답 출력
        image_url = image_response['data'][0]['url']
        print("Thumbnail generated.")
        return image_url
    except Exception as e:
        print(f"Error in thumbnail generation: {e}")
        return None

# 4. 이미지 표시
def display_image_from_url(image_url):
    """
    생성된 이미지를 로컬에서 표시합니다.
    """
    try:
        response = requests.get(image_url)
        image = Image.open(BytesIO(response.content))
        image.show()  # 로컬 이미지 뷰어에서 표시
    except Exception as e:
        print(f"Error displaying image: {e}")

# 5. 메인 실행 흐름
def main(audio_file_path):
    # Step 1: 오디오 파일에서 텍스트 추출
    extracted_text = transcribe_audio_with_whisper(audio_file_path)
    if not extracted_text:
        print("Failed to transcribe audio.")
        return

    # Step 2: 텍스트 요약
    summary = summarize_text(extracted_text)
    if not summary:
        print("Failed to summarize text.")
        return
    print(f"Summary:\n{summary}")

    # Step 3: 썸네일 이미지 생성
    thumbnail_url = generate_thumbnail_image(summary)
    if not thumbnail_url:
        print("Failed to generate thumbnail.")
        return
    print(f"Thumbnail Image URL: {thumbnail_url}")

    # Step 4: 이미지 표시
    display_image_from_url(thumbnail_url)

# 6. 오디오 파일 경로 입력
audio_file_path = "cat.mp3"  # 오디오 파일 경로
main(audio_file_path)


Transcribing audio using Whisper API...
Transcription completed.
Summarizing text using ChatGPT...
Summary generated.
Summary:
여자가 남자친구를 찾으려고 하면서 방문한 집에서 고양이들의 행동과 집의 환경을 비평하고, 집주인에게 여러 가지 개인적인 질문을 한다. 여자는 매우 솔직하고 때로는 무례한 태도로 말을 하며, 집주인과의 대화는 종종 산만해진다. 이 과정에서 고양이들의 사회성과 여러 특성에 대해 언급하며, 여자는 다양한 가정 환경과 물건들을 평가한다. 전반적으로, 대화는 여자가 이상적인 남자친구와 고양이를 찾는 과정에서 발생하는 특이하고 때로는 코믹한 상황들을 포함한다.
Generating thumbnail using DALL-E...
DALL-E Response: {
  "created": 1731981268,
  "data": [
    {
      "url": "https://oaidalleapiprodscus.blob.core.windows.net/private/org-aVogxSgbxq1vvtKDskJlwhys/user-PJN54fxyiyD7eq5emdzQEfVc/img-FisA29BCLjxKUHfScJjNcqFb.png?st=2024-11-19T00%3A54%3A28Z&se=2024-11-19T02%3A54%3A28Z&sp=r&sv=2024-08-04&sr=b&rscd=inline&rsct=image/png&skoid=d505667d-d6c1-4a0a-bac7-5c84a87759f8&sktid=a48cca56-e6da-484e-a814-9c849652bcb3&skt=2024-11-18T19%3A12%3A25Z&ske=2024-11-19T19%3A12%3A25Z&sks=b&skv=2024-08-04&sig=Xi5mxMvJs914KfD3fmVGXo6RDKLP41yoJi//owe784M%3D"
    }
  ]
}
Thumbnail generated.