___
<a href='https://cafe.naver.com/jmhonglab'><p style="text-align:center;"><img src='https://lh3.googleusercontent.com/lY3ySXooSmwsq5r-mRi7uiypbo0Vez6pmNoQxMFhl9fmZJkRHu5lO2vo7se_0YOzgmDyJif9fi4_z0o3ZFdwd8NVSWG6Ea80uWaf3pOHpR4GHGDV7kaFeuHR3yAjIJjDgfXMxsvw=w2400'  class="center" width="50%" height="50%"/></p></a>
___
<center><em>Content Copyright by HongLab, Inc.</em></center>

# 음성 합성 

음성 합성은 음성 인식의 반대 과정을 거칩니다. 대표적인 기술로는 구글의 [타코트론](https://ai.googleblog.com/2017/12/tacotron-2-generating-human-like-speech.html)이 있습니다.


### [Google Text-to-Speech](https://github.com/pndurette/gTTS)

구글에서 제공해주는 음성 합성 패키지입니다. 인터넷이 연결되어 있어야 사용할 수 있습니다.

```
pip install gtts
pip install pydub
```

맥에서는 ffmpeg을 추가로 설치해야 합니다.
```
brew install ffmpeg
```

사용 가능한 언어들의 목록을 출력해보겠습니다.

In [18]:
import gtts

#print("사용 가능한 모든 언어들", gtts.lang.tts_langs())

# 영어와 한국어만 보기
# 딕트 컴프리헨션 (C언어 블럭과 혼동 주의)
{
    k: v
    for k, v in gtts.lang.tts_langs().items()
    if v.lower() == "korean" or v.lower() == "english"
}

{'en': 'English', 'ko': 'Korean'}

In [19]:
import gtts
from pydub import AudioSegment
from pydub.playback import play

# 텍스트를 음성으로 바꿉니다.
tts = gtts.gTTS("안녕하세요? 인공지능입니다.", lang="ko")

# mp3 파일로 저장합니다.
tts.save("temp.mp3")

# mp3 파일을 다시 읽어들입니다.
my_sound = AudioSegment.from_mp3("temp.mp3")

# 컴퓨터로 재생합니다.
play(my_sound)

파일로 저장하지 않고 바로 재생하는 방법도 있습니다.

In [17]:
import gtts
from pydub import AudioSegment
from pydub.playback import play
from io import BytesIO

# 텍스트를 음성으로 바꿉니다.
tts = gtts.gTTS("Hi! I am an artificial intelligence.", lang="en")

# mp3 오디오 데이터를 메모리에 저장합니다.
fp = BytesIO()
tts.write_to_fp(fp)
fp = BytesIO(fp.getvalue())

# 오디오 데이터를 메모리로부터 가져옵니다.
my_sound = AudioSegment.from_file(fp, format="mp3")

# 컴퓨터로 재생합니다.
play(my_sound)

ModuleNotFoundError: No module named 'gtts'

[참고] ```gTTS()```와 ```write_to_ft()```의 문서를 참고해서 예외 처리를 할 수 있습니다.

### [pyttsx3](https://github.com/nateshmbhat/pyttsx3)


운영체제에서 제공해주는 음성 합성 엔진을 사용하기 때문에 인터넷 연결 불필요

- [SAPI5](https://en.wikipedia.org/wiki/Microsoft_Speech_API) on Windows
- [NSSpeechSynthesizer](https://developer.apple.com/documentation/appkit/nsspeechsynthesizer) on Mac OS

```
pip install pyttsx3
```

윈도우에서는 음성 설정에서 사용 가능한 언어를 추가할 수 있습니다.  
맥에서는 accessibility -> spoken contents에서 사용 가능한 목소리를 추가할 수 있습니다.


설치되어 있는 언어를 먼저 확인해봅시다.


In [5]:
import pyttsx3

engine = pyttsx3.init()

voices = engine.getProperty("voices")

for id, voice in enumerate(voices):
    print(id, voice)


error: RunLoopStopper is overriding existing Objective-C class

기본적인 재생 방법은 다음과 같습니다.


In [6]:
import pyttsx3

engine = pyttsx3.init()

engine.say("안녕하세요? 인공지능입니다.")

engine.runAndWait()

error: RunLoopStopper is overriding existing Objective-C class

더 간단하게 사용할 수도 있습니다.

In [7]:
import pyttsx3

# 더 간단한 방법
pyttsx3.speak("안녕하세요? 인공지능입니다.")

error: RunLoopStopper is overriding existing Objective-C class

그 외에도 말하는 속도, 소리 크기, 목소리(언어) 등을 바꿀 수 있습니다.

In [16]:
# 여러가지 속성 바꾸기
import pyttsx3

engine = pyttsx3.init()

# 말하는 속도
engine.setProperty("rate", 200)
rate = engine.getProperty("rate")

# 소리 크기
engine.setProperty("volume", 1.0)  # 0~1
volume = engine.getProperty("volume")

# 목소리
voices = engine.getProperty("voices")
engine.setProperty("voice", voices[1].id)

# 말하기
engine.say("12345")
engine.say("안녕하세요? 홍정모입니다.")
engine.say("I will speak this text")
engine.runAndWait()
engine.stop()

error: RunLoopStopper is overriding existing Objective-C class

### [Naver Cloud Platform](https://www.ncloud.com/)

비공식 API [NaverTTS](https://github.com/scottgigante/NaverTTS) Unofficial Python API for NAVER [Papago TTS](https://papago.naver.com/)

[클로바 스피치 가격](https://www.ncloud.com/product/aiService/clovaSpeech)

```
pip install NaverTTS
```


In [15]:
from io import BytesIO
#from gtts import gTTS
from navertts import NaverTTS

from pydub import AudioSegment
from pydub.playback import play

tts = NaverTTS("안녕하세요? 인공지능입니다.", lang="ko")
fp = BytesIO()
tts.write_to_fp(fp)
fp = BytesIO(fp.getvalue())
my_sound = AudioSegment.from_file(fp, format="mp3")
play(my_sound)


In [14]:
# 목소리 산뜻함
from navertts import NaverTTS

# 여러 옵션들 https://github.com/scottgigante/NaverTTS/blob/master/navertts/tts.py
tts = NaverTTS('hello')
tts.save('hello.mp3')

# mp3 파일을 다시 읽어들입니다.
my_sound = AudioSegment.from_mp3("hello.mp3")

# 컴퓨터로 재생합니다.
play(my_sound)