# 音声合成のテスト（Google）
このプログラムはGoogle Cloud APIの1つであるText-to-Speech APIをpythonプログラムから扱えるようにするものです。

- 参考ページ
    - GoogleCloud Text-toSpeech
    - https://cloud.google.com/text-to-speech
    - クイックスタート: クライアント ライブラリの使用
    - https://cloud.google.com/text-to-speech/docs/quickstart-client-libraries?hl=ja

## 事前の設定
- Google Cloud PlatformでGoogle Text-to-Speech APIを有効化
- サービスアカウントキーの作成と配置

In [6]:
# 必要なラブラリを読み込む
import os
from google.cloud import texttospeech

from pydub import AudioSegment
from pydub.playback import play

In [2]:
# 認証キーを配置する

path_key = './google-credentials.json'
os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = path_key

In [3]:
# 音声合成のパラメータを設定
voice = texttospeech.VoiceSelectionParams(
  language_code='ja-JP',
  name='ja-JP-Wavenet-A'
)

# 音声の設定
audio_config = texttospeech.AudioConfig(
  audio_encoding=texttospeech.AudioEncoding.MP3,
  pitch = 0.0
)

client = texttospeech.TextToSpeechClient()


In [4]:
# 音声合成を行う文章
synthesis_input = texttospeech.SynthesisInput(text='京都大学へようこそ。')

# 音声合成を実行
response = client.synthesize_speech(input=synthesis_input, voice=voice, audio_config=audio_config)

# 合成したデータをmp3ファイルとして書き出し
with open('./data/tts-temp.mp3', 'wb') as out:
    out.write(response.audio_content)
    print('音声ファイル "./data/tts-temp.mp3" を生成しました。')

音声ファイル "./data/tts-temp.mp3" を生成しました。


In [7]:
# 音声を再生
audio_data = AudioSegment.from_mp3('./data/tts-temp.mp3')
play(audio_data)