In [1]:
import google.auth
import google.auth.transport.requests
import json
import requests
import base64 # 오디오 파일 저장에 필요

def synthesize_text_to_speech_from_input():
    """
    Google Cloud Text-to-Speech API를 사용하여 사용자 입력 텍스트를 음성으로 합성합니다.
    """
    # 1. 사용자로부터 텍스트 입력 받기
    user_text = input("음성으로 변환할 텍스트를 입력하세요: ")
    if not user_text:
        print("텍스트가 입력되지 않았습니다. 프로그램을 종료합니다.")
        return

    # 2. 인증 정보 가져오기
    credentials, project_id = google.auth.default()

    # 인증 요청 객체 생성
    request_auth = google.auth.transport.requests.Request()
    credentials.refresh(request_auth) # 인증 정보 갱신 (필요한 경우)

    access_token = credentials.token

    # 3. API 엔드포인트 및 헤더 설정
    url = "https://texttospeech.googleapis.com/v1/text:synthesize"
    headers = {
        "Content-Type": "application/json",
        "X-Goog-User-Project": project_id,
        "Authorization": f"Bearer {access_token}"
    }

    # 4. 요청 본문(Payload) 설정
    payload = {
        "input": {
            "text": user_text  # 사용자로부터 입력받은 텍스트 적용
        },
        "voice": {
            "languageCode": "ko-KR",
            "name": "ko-KR-Chirp3-HD-Achernar",
            "voiceClone": {}
        },
        "audioConfig": {
            "audioEncoding": "LINEAR16"
        }
    }

    # 5. API 호출
    response = None # 초기화
    try:
        print(f"'{user_text}' 텍스트를 음성으로 합성 중...")
        response = requests.post(url, headers=headers, data=json.dumps(payload))
        response.raise_for_status()  # HTTP 오류 발생 시 예외 발생

        # 6. 응답 처리
        response_data = response.json()
        audio_content_base64 = response_data['audioContent']

        audio_data = base64.b64decode(audio_content_base64)

        output_filename = "output.wav"
        with open(output_filename, "wb") as out_file:
            out_file.write(audio_data)
            print(f"오디오 콘텐츠가 '{output_filename}' 파일로 저장되었습니다.")

    except requests.exceptions.RequestException as e:
        print(f"API 호출 중 오류 발생: {e}")
        if response is not None:
            print(f"응답 상태 코드: {response.status_code}")
            print(f"응답 본문: {response.text}")
    except Exception as e:
        print(f"예기치 않은 오류 발생: {e}")

if __name__ == "__main__":
    synthesize_text_to_speech_from_input()


음성으로 변환할 텍스트를 입력하세요: 안녕하세요.
'안녕하세요.' 텍스트를 음성으로 합성 중...
오디오 콘텐츠가 'output.wav' 파일로 저장되었습니다.


In [3]:
import google.auth
import google.auth.transport.requests
import requests

def list_supported_voices_ko():
    """
    Text-to-Speech API에서 지원하는 한국어 음성 목록만 가져옵니다.
    """
    credentials, project_id = google.auth.default()
    request_auth = google.auth.transport.requests.Request()
    credentials.refresh(request_auth)
    access_token = credentials.token

    url = "https://texttospeech.googleapis.com/v1/voices?languageCode=ko-KR"  # 한국어 코드 지정
    headers = {
        "X-Goog-User-Project": project_id,
        "Authorization": f"Bearer {access_token}"
    }

    try:
        response = requests.get(url, headers=headers)
        response.raise_for_status()
        voices = response.json()['voices']
        return voices
    except requests.exceptions.RequestException as e:
        print(f"API 호출 중 오류 발생: {e}")
        return None

voices_ko = list_supported_voices_ko()
if voices_ko:
    for voice in voices_ko:
        print(f"언어 코드: {voice['languageCodes']}, 음성 이름: {voice['name']}")



언어 코드: ['ko-KR'], 음성 이름: ko-KR-Chirp3-HD-Achernar
언어 코드: ['ko-KR'], 음성 이름: ko-KR-Chirp3-HD-Achird
언어 코드: ['ko-KR'], 음성 이름: ko-KR-Chirp3-HD-Algenib
언어 코드: ['ko-KR'], 음성 이름: ko-KR-Chirp3-HD-Algieba
언어 코드: ['ko-KR'], 음성 이름: ko-KR-Chirp3-HD-Alnilam
언어 코드: ['ko-KR'], 음성 이름: ko-KR-Chirp3-HD-Aoede
언어 코드: ['ko-KR'], 음성 이름: ko-KR-Chirp3-HD-Autonoe
언어 코드: ['ko-KR'], 음성 이름: ko-KR-Chirp3-HD-Callirrhoe
언어 코드: ['ko-KR'], 음성 이름: ko-KR-Chirp3-HD-Charon
언어 코드: ['ko-KR'], 음성 이름: ko-KR-Chirp3-HD-Despina
언어 코드: ['ko-KR'], 음성 이름: ko-KR-Chirp3-HD-Enceladus
언어 코드: ['ko-KR'], 음성 이름: ko-KR-Chirp3-HD-Erinome
언어 코드: ['ko-KR'], 음성 이름: ko-KR-Chirp3-HD-Fenrir
언어 코드: ['ko-KR'], 음성 이름: ko-KR-Chirp3-HD-Gacrux
언어 코드: ['ko-KR'], 음성 이름: ko-KR-Chirp3-HD-Iapetus
언어 코드: ['ko-KR'], 음성 이름: ko-KR-Chirp3-HD-Kore
언어 코드: ['ko-KR'], 음성 이름: ko-KR-Chirp3-HD-Laomedeia
언어 코드: ['ko-KR'], 음성 이름: ko-KR-Chirp3-HD-Leda
언어 코드: ['ko-KR'], 음성 이름: ko-KR-Chirp3-HD-Orus
언어 코드: ['ko-KR'], 음성 이름: ko-KR-Chirp3-HD-Puck
언어 코드: ['ko-KR'], 음성 이름: ko-KR

In [4]:
import ipywidgets as widgets
from IPython.display import display

def create_voice_selection_widgets_ko(voices):
    """
    사용 가능한 한국어 음성 목록을 기반으로 음성 선택 드롭다운 목록을 생성합니다.
    """
    # 한국어 음성만 필터링
    korean_voices = [voice for voice in voices if voice['languageCodes'][0] == 'ko-KR']

    voice_name_dropdown = widgets.Dropdown(
        options=[voice['name'] for voice in korean_voices],
        description='음성:',
        disabled=False,
    )

    display(voice_name_dropdown)
    return voice_name_dropdown

# voices 변수가 이미 정의되어 있다고 가정합니다.
voice_name_dropdown_ko = create_voice_selection_widgets_ko(voices_ko)


Dropdown(description='음성:', options=('ko-KR-Chirp3-HD-Achernar', 'ko-KR-Chirp3-HD-Achird', 'ko-KR-Chirp3-HD-Al…

In [12]:
selected_voice_name = voice_name_dropdown_ko.value
selected_voice_name

'ko-KR-Chirp3-HD-Callirrhoe'

In [13]:
import google.auth
import google.auth.transport.requests
import json
import requests
import base64
import ipywidgets as widgets
from IPython.display import display

def synthesize_text_to_speech_from_input(selected_voice_name):
    """
    Google Cloud Text-to-Speech API를 사용하여 사용자 입력 텍스트를 음성으로 합성합니다.
    선택된 음성 이름을 인자로 받습니다.
    """
    # 1. 사용자로부터 텍스트 입력 받기
    user_text = input("음성으로 변환할 텍스트를 입력하세요: ")
    if not user_text:
        print("텍스트가 입력되지 않았습니다. 프로그램을 종료합니다.")
        return

    # 2. 인증 정보 가져오기
    credentials, project_id = google.auth.default()

    # 인증 요청 객체 생성
    request_auth = google.auth.transport.requests.Request()
    credentials.refresh(request_auth)

    access_token = credentials.token

    # 3. API 엔드포인트 및 헤더 설정
    url = "https://texttospeech.googleapis.com/v1/text:synthesize"
    headers = {
        "Content-Type": "application/json",
        "X-Goog-User-Project": project_id,
        "Authorization": f"Bearer {access_token}"
    }

    # 4. 요청 본문(Payload) 설정
    payload = {
        "input": {
            "text": user_text
        },
        "voice": {
            "languageCode": "ko-KR",
            "name": selected_voice_name,  # 드롭다운에서 선택된 음성 이름 사용
            "voiceClone": {}
        },
        "audioConfig": {
            "audioEncoding": "LINEAR16"
        }
    }

    # 5. API 호출
    response = None
    try:
        print(f"'{user_text}' 텍스트를 음성으로 합성 중...")
        response = requests.post(url, headers=headers, data=json.dumps(payload))
        response.raise_for_status()

        # 6. 응답 처리
        response_data = response.json()
        audio_content_base64 = response_data['audioContent']

        audio_data = base64.b64decode(audio_content_base64)

        output_filename = "output.wav"
        with open(output_filename, "wb") as out_file:
            out_file.write(audio_data)
            print(f"오디오 콘텐츠가 '{output_filename}' 파일로 저장되었습니다.")

    except requests.exceptions.RequestException as e:
        print(f"API 호출 중 오류 발생: {e}")
        if response is not None:
            print(f"응답 상태 코드: {response.status_code}")
            print(f"응답 본문: {response.text}")
    except Exception as e:
        print(f"예기치 않은 오류 발생: {e}")

# 드롭다운 위젯 생성 함수 (이전 코드와 동일)
def create_voice_selection_widgets_ko(voices):
    """
    사용 가능한 한국어 음성 목록을 기반으로 음성 선택 드롭다운 목록을 생성합니다.
    """
    # 한국어 음성만 필터링
    korean_voices = [voice for voice in voices if voice['languageCodes'][0] == 'ko-KR']

    voice_name_dropdown = widgets.Dropdown(
        options=[voice['name'] for voice in korean_voices],
        description='음성:',
        disabled=False,
    )

    display(voice_name_dropdown)
    return voice_name_dropdown

# 사용 가능한 음성 목록 가져오기 (이전 코드와 동일)
def list_supported_voices_ko():
    """
    Text-to-Speech API에서 지원하는 한국어 음성 목록만 가져옵니다.
    """
    credentials, project_id = google.auth.default()
    request_auth = google.auth.transport.requests.Request()
    credentials.refresh(request_auth)
    access_token = credentials.token

synthesize_text_to_speech_from_input(selected_voice_name)

음성으로 변환할 텍스트를 입력하세요: 안전하게 귀가하세요.
'안전하게 귀가하세요.' 텍스트를 음성으로 합성 중...
오디오 콘텐츠가 'output.wav' 파일로 저장되었습니다.
