# Quick start

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/r9y9/ttslearn/blob/master/notebooks/ch00_Quick-start.ipynb)

「Python으로 배우는 음성합성」의 quick start 페이지에 오신 것을 환영합니다!

이 페이지(노트북 형식)에서는, 책 속에서 해설하고 있는 3개의 음성 합성에 대해서, 음성 합성의 샘플 코드·음성 샘플을 나타냅니다. 해설을 읽기 전에 손을 움직여보고 싶다고 하는 분들에게는 첫걸음에 최적의 노트북입니다.

여기서 보여주는 음성합성은 GitHub 저장소에서 학습된 모델이 배포되고 있습니다. 음성 샘플을 듣는 것뿐만 아니라 꼭 스스로 음성 합성을 시도해 보십시오.
그리고 음성 합성에 대한 자세한 내용을 이해하기 위해서는 소스 코드와 서적을 함께 참조하십시오.

## 준비

### ttslearn 설치하기

In [None]:
%%capture
try:
    import ttslearn
except ImportError:
    !pip install ttslearn

In [None]:
import ttslearn
ttslearn.__version__

### 패키지 임포트

In [None]:
%pylab inline
import IPython
from IPython.display import Audio
import librosa
import librosa.display
from tqdm.notebook import tqdm
import torch

## DNN음성합성 (5장·6장)

In [None]:
from ttslearn.dnntts import DNNTTS
dnntts_engine = DNNTTS()

In [None]:
%time wav, sr = dnntts_engine.tts("あらゆる現実を、すべて自分のほうへねじ曲げたのだ。")
IPython.display.display(Audio(wav, rate=sr))

## WaveNet음성합성 (7장·8장)

In [None]:
from ttslearn.wavenet import WaveNetTTS
wavenet_engine = WaveNetTTS()

In [None]:
%time wav, sr = wavenet_engine.tts("小さな鰻屋に、熱気のようなものがみなぎる", tqdm=tqdm)
IPython.display.display(Audio(wav, rate=sr))

## Tacotron 2 (9장·10장)

In [None]:
from ttslearn.tacotron import Tacotron2TTS
tacotron_engine = Tacotron2TTS()

In [None]:
%time wav, sr = tacotron_engine.tts("昼にはペスカトーレを、夜には寿司をパクパク食べた。", tqdm=tqdm)
IPython.display.display(Audio(wav, rate=sr))

## 마지막

In [None]:
text = "これから音声合成を始める皆様にとって、少しでも学習の助けになれば幸いです。"
print(text)

for idx, (name, engine) in enumerate([
    ("DNNTTS", dnntts_engine), 
    ("WaveNet TTS", wavenet_engine),
    ("Tacotron 2", tacotron_engine),
]):
    %time wav, sr = engine.tts(text, tqdm=tqdm)
    IPython.display.display(Audio(wav, rate=sr))