# Quick start

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/r9y9/ttslearn/blob/master/notebooks/ch00_Quick-start.ipynb)

「Pythonで学ぶ音声合成」のquick startページへようこそ！

このページ（ノートブック形式）では、書籍中で解説している3つの音声合成について、音声合成のサンプルコード・音声サンプルを示します。「解説を読む前に手を動かしてみたい」という方には、最初の一歩に最適なノートブックです。

ここで示す音声合成は、GitHubリポジトリで学習済みモデルが配布されています。音声サンプルを聴くだけでなく、ぜひ自分で音声合成を試してみて下さい。
そして、音声合成の詳細を理解するためには、ソースコードと書籍を併せて参照してください。

## 準備

### ttslearn のインストール

In [None]:
%%capture
try:
    import ttslearn
except ImportError:
    !pip install ttslearn

In [None]:
import ttslearn
ttslearn.__version__

### パッケージのインポート

In [None]:
%pylab inline
import IPython
from IPython.display import Audio
import librosa
import librosa.display
from tqdm.notebook import tqdm
import torch

## DNN音声合成 (第5章・第6章)

In [None]:
from ttslearn.dnntts import DNNTTS
dnntts_engine = DNNTTS()

In [None]:
%time wav, sr = dnntts_engine.tts("あらゆる現実を、すべて自分のほうへねじ曲げたのだ。")
IPython.display.display(Audio(wav, rate=sr))

## WaveNet音声合成 (第7章・第8章)

In [None]:
from ttslearn.wavenet import WaveNetTTS
wavenet_engine = WaveNetTTS()

In [None]:
%time wav, sr = wavenet_engine.tts("小さな鰻屋に、熱気のようなものがみなぎる", tqdm=tqdm)
IPython.display.display(Audio(wav, rate=sr))

## Tacotron 2 (第9章・第10章)

In [None]:
from ttslearn.tacotron import Tacotron2TTS
tacotron_engine = Tacotron2TTS()

In [None]:
%time wav, sr = tacotron_engine.tts("昼にはペスカトーレを、夜には寿司をパクパク食べた。", tqdm=tqdm)
IPython.display.display(Audio(wav, rate=sr))

## おわりに

In [None]:
text = "これから音声合成を始める皆様にとって、少しでも学習の助けになれば幸いです。"
print(text)

for idx, (name, engine) in enumerate([
    ("DNNTTS", dnntts_engine), 
    ("WaveNet TTS", wavenet_engine),
    ("Tacotron 2", tacotron_engine),
]):
    %time wav, sr = engine.tts(text, tqdm=tqdm)
    IPython.display.display(Audio(wav, rate=sr))