## CHAPTER 10. 오픈AI TTS를 활용한 음성 변환

### 목차
- 10.1 오픈 AI TTS 소개
- 10.2 오픈 AI TTS 사용 방법

### 기본 환경 설정
### chatgpt.env 환경파일 준비
 * 일반적으로 환경 변수는 .env 파일에 저장되지만, 구글 코랩 사용자의 편의를 위해 이 책에서는 chatgpt.env를 사용합니다.
 * 실제 개발 환경에서는 보통 .env를 사용하니, 이 점을 기억해 두세요.


 ### 사전 준비
 * 구글 코랩 환경은 일정 시간이후에 초기화가 되기 때문에 두가지 작업을 매번 수행해야 함.
   * chatgpt.env 파일 생성이 필요.
     * 준비된 chatgpt.env를 내용을 변경하여 업로드 하거나 또는 API_KEY와 ORG_ID를 확인하여 생성한다.
   * pip install openai 설치
    * 라이브러리 불일치로 인한 에러 발생시, 추가 라이브러리 설치 필요.
    * 에러 : TypeError: Client.__init__() got an unexpected keyword argument 'proxies'

In [None]:
# 폴더 생성
!mkdir -p src/data/tts

!echo "안녕 네오 – 매트릭스에 오신 것을 환영합니다." > src/data/tts/speech_ko.txt
!cat src/data/tts/speech_ko.txt

안녕 네오 – 매트릭스에 오신 것을 환영합니다.


In [None]:
import os
from openai import OpenAI

# OpenAI API 키 설정 및 초기화
def init_api():
    with open("chatgpt.env") as env:
       for line in env:
           key, value = line.strip().split("=")
           os.environ[key] = value

init_api()
client = OpenAI(api_key  = os.environ.get("API_KEY"))

print(client)


<openai.OpenAI object at 0x7cbfb98bec50>


In [None]:
# tts.py

import os

# 텍스트 파일의 경로 정의
text_file_path = os.path.abspath(
    "src/data/tts/speech_ko.txt"  # 텍스트 파일의 경로를 설정합니다.
)

# 오디오 파일의 경로 정의
audio_file_path = os.path.abspath(
    "src/data/tts/speech_ko.mp3"  # 오디오 파일의 경로를 설정합니다.
)

# 파일에서 텍스트 읽기
with open(text_file_path, 'r') as file:
    text = file.read()  # 파일의 내용을 읽어 텍스트 변수에 저장합니다.

# 음성 모델 및 캐릭터 정의
voice_model = "tts-1"  # 사용하려는 음성 모델을 정의합니다.
voice_character = "alloy"  # 사용할 음성 캐릭터를 정의합니다.

# 텍스트를 음성으로 변환하기
response = client.audio.speech.create(
    model=voice_model,
    voice=voice_character,
    input=text  # 입력 텍스트를 음성으로 변환합니다.
)

# 오디오 파일로 저장하기
response.stream_to_file(audio_file_path)  # 변환된 음성을 파일로 저장합니다.
print(f"오디오가 {audio_file_path}에 저장되었습니다.")  # 저장된 오디오 파일 경로를 출력합니다.


오디오가 /content/src/data/tts/speech_ko.mp3에 저장되었습니다.


  response.stream_to_file(audio_file_path)  # 변환된 음성을 파일로 저장합니다.


In [None]:
# tts_all.py
# 구글 코랩이 아닌 .py 파일 작성 후, 실행할 때는 인증 부분을 추가해 주세요.

import os

# 텍스트 파일의 경로 정의
text_file_path = os.path.abspath(
    "src/data/tts/speech_ko.txt"  # 텍스트 파일의 경로를 설정합니다.
)

# 파일에서 텍스트 읽기
with open(text_file_path, 'r') as file:
    text = file.read()  # 파일의 내용을 읽어 텍스트 변수에 저장합니다.

# 음성 모델 및 캐릭터 정의
voice_model = "tts-1"  # 사용하려는 음성 모델을 정의합니다.
voice_characters = [  # 사용 가능한 음성 캐릭터 목록입니다.
    "alloy",
    "echo",
    "fable",
    "onyx",
    "nova",
    "shimmer"
]

# 각 음성 캐릭터에 대해 텍스트를 음성으로 변환
for voice_character in voice_characters:
    # 오디오 파일의 경로 정의
    audio_file_path = os.path.abspath(
        "src/data/tts/speech_" + voice_character + "_ko.mp3"  # 각 캐릭터에 맞는 파일 이름을 설정합니다.
    )

    # 텍스트를 음성으로 변환
    response = client.audio.speech.create(
        model=voice_model,
        voice=voice_character,
        input=text  # 입력 텍스트를 음성으로 변환합니다.
    )

    # 오디오 파일로 저장하기
    response.stream_to_file(audio_file_path)  # 변환된 음성을 파일로 저장합니다.
    print(f"오디오가 {audio_file_path}에 저장되었습니다.")  # 저장된 오디오 파일 경로를 출력합니다.

  response.stream_to_file(audio_file_path)  # 변환된 음성을 파일로 저장합니다.


오디오가 /content/src/data/tts/speech_alloy_ko.mp3에 저장되었습니다.
오디오가 /content/src/data/tts/speech_echo_ko.mp3에 저장되었습니다.
오디오가 /content/src/data/tts/speech_fable_ko.mp3에 저장되었습니다.
오디오가 /content/src/data/tts/speech_onyx_ko.mp3에 저장되었습니다.
오디오가 /content/src/data/tts/speech_nova_ko.mp3에 저장되었습니다.
오디오가 /content/src/data/tts/speech_shimmer_ko.mp3에 저장되었습니다.
