# ALTextToSpeech 
___
: 이번 튜토리얼은 어떻게 문장을 이야기 하는지, 음성효과를 어떻게 바꾸는지, 혹은 합성엔진의 언어와 음성을 어떻게 바꾸는지를 설명해줄 예정이다.


## Creating a proxy on the module
___
: TTS command를 사용하기 전에 RRS module을 생성해야만한다

In [None]:
#! /usr/bin/env python
# -*- encoding: UTF-8 -*-

from naoqi import ALProxy

IP = "<IP ADDRESS>"
tts = ALProxy("ALTextToSpeech", IP, 9559)

## Saying a text string
___
: say 함수를 사용하여 문장을 말하도록 한다

In [None]:
#example : Sends a string to the text-to-speech module

tts.say("Hello world!")

## Modifying speed
___
: API는 음성의 속도를 수정할 수 있도록 한다. 예를 들면 :

In [None]:
tts.setParameter("speed", 200)

더 자세한 내용을 알고 싶으면  ALTextToSpeechProxy::setParameter 를 봐라. 다시 default speed 로 가고 싶다면,

In [None]:
tts.setParameter("speed", 200)
tts.setParameter()

default 값을 변경하고 싶다면 :

In [None]:
tts.setParameter("defaultVoiceSpeed", 200)

default 속도를 변경하는 것은 현재 속도 값 또한 reset 시킨다.

default 속도를 변경하는 것은 비영구적 수정이다. 만약에 다른언어로 바꾸고 다시 돌아오면, default 값은 다시 100으로 돌아가 있다. 특정값을 유지 시키려면, language package안에 저장되있는 voiceSetting.xml 파일에 밑의 내용을 추가 하면 된다.

In [None]:
<Setting name = "defaultVoiceSpeed" description = "Voice speed" value = "150.0"/>

이 값은 해당 언어를 사용할 때마다 load된다.

## Modifying pitch
___
: API는 음성의 높낮이를 수정할 수 있도록 한다. 예를들면,

In [None]:
tts.setParameter("pitchShift", 1.1)

이 command는 주 음성의 높낮이를 제기한다. 1.1 은 변형된 voice와 원래 voice 사이의 기본적인 주파수 비율이다.

## Modifying double voice parameters
___
: 3가지 파라미터들을 사용하여 이중 음성 랜더링이 수정될 수 있다.

+ doubleVoice : 변형된 voice와 원래 voice 사이의 기본적인 주파수 비율
+ doubleVoiceLevel : 두번째 음성과 첫번째 음성 사이의 volume 비율
+ doubleVoiceTimeShift : 두번째 음성과 첫번째 음성 사이의 시간 이동

예를 들면, "robotic sounding" 음성은 아래의 command들을 사용하여 생성될 수 있다.

In [None]:
tts.setParameter("doubleVoice", 1)
tts.setParameter("doubleVoiceLevel", 0.5)
tts.setParameter("doubleVoiceTimeShift", 0.1)
tts.setParameter("pitchShift", 1.1)

## Changing the language of the synthesis engine
___
: 합성 엔진의 언어는 setLanguage 함수를 사용하여 변경될 수 있다. 사용가능한 언어들의 list는 getAvailableLanguages 함수를 사용하여 얻을 수 있다.

In [None]:
#Example : set the language of the synthesis engine to English:

tts.setLanguage("Enlish")

## Changing the voice of the synthesis engine
___
: 합성 엔진의 음성은 또한 setVoice 함수를 사용하여 변경할 수 있다. 사용가능한 음성들의 list는 getAvailableVoices 함수를 사용하여 얻을수 있다. 음성을 변경하면, 현재의 언어는 변경한 음성에 해당하는 언어로 자동적으로 변경된다. 


In [None]:
#Example : use the voice of Kenny

tts.setVoice("Kenny22Enhanced")

## Using tags for voice tuning
___
### Available for all engines
___
: 당신의 어플리케이션의 컨텍스트에 관한 발음을 변경하기 위해 다른 태그를 사용할 수 있다. 사용 가능한 언어 패키지 태그의 엔진에 따라 달라질 수 있다.

#### Changng the pitch
: 모든 엔진에서 사용 가능.

=> text에  \\\vct=value\\\ 를 삽입한다. 값은 50~200% 사이를 갖는다. default = 100%

In [None]:
# 문장을 +50%의 높이로 말한다

tts.say("\\vct=value\\Hello my friends")

#### Changng the speaking rate
: 모든 엔진에서 사용 가능.

=> text에 \\rspd=value\\ 를 삽입한다. 값은 50~400% 사이를 갖는다. default = 100%

In [None]:
# 일반 속도보다 50% 느리게 문장을 말한다.

tts.say("\\rspd=50\\Hello my friends")

#### Inserting a pause
: 모든 엔진에서 사용 가능.

=> text에 \\\pau=value\\\를 삽입한다. 값은 msec의 지속시간으로 나타남. 

In [None]:
# 1초의 멈춤을 추가한다.

tts.say("Hello my friends \\pau=1000\\ how are you ?")

#### Changing the volume
: 모든 엔진에서 사용 가능.

=> text에 \\\vol=value\\\를 삽입한다. 값은 0~100% 사이를 갖는다. default = 80%. values > 80은 오디오 신호에 cliping을 야기한다.

In [None]:
# 50%의 볼륨으로 말한다.

tts.say("\\vol=50\\Hello my friends")

#### Inserting a bookmark
: 모든 엔진에서 사용 가능.

 이 테그는 speech와 로봇의 특정 동작을 동기화 할때 매우 유용하다.

=> text에 \\\mrk=value\\\ 를 삽입한다. 값은 0 ~ 64535 사이에 존재한다.
 
 값은 ALMemory의 event 인 "ALTextToSpeech/CurrentBookMark" 안에서 발생한다.
 

In [None]:
tts.say("\\mrk=0\\ I say a sentence.\\mrk=1\\ And a second one.")

#### Resetting control sequence to the default

: 모든 엔진에서 사용 가능.

text에 \\\rst\\\ 를 삽입한다. 모든 기능을 리셋한다.

In [None]:
# pitch 150% / speaking_rate 50% / hello my friends 이후로 reset

tts.say("\\vct=150\\\\rspd=50\\Hello my friends.\\rst\\ How are you ?")

### Nuance only
___

#### Setting the type of prosodic boundary

: 오직 Nuance 패키지에서만 사용가능

=> text에 \\\bound=value\\\ 를 삽입한다. 가능한 값들로는 :

+ W : Weak phrase boundary (구절의 경계를 약하게)
+ S : Strong phrase boundary (구절의 경계를 강하게)
+ N : No boundary (구절의 경계 없게)

In [None]:
# Say the sentence with a weak phrase boundary (no silence in speech)
tts.say("\\bound=W\\ Hello my friends")

# Say the sentence with a strong phrase boundary (silence in speech)
tts.say("\\bound=S\\ Hello my friends")

#### Setting the word prominence level 

: 오직 Nuance 패키지에서만 사용가능

=> text에 \\\emph=value\\\ 를 삽입한다. 가능한 값들로는 :

+ 0 : 줄이다
+ 1 : 늘리다
+ 2 : 악센트

In [None]:
tts.say("\\emph=0\\ There is a total of 32 apples and 12 oranges")
tts.say("\\emph=1\\ There is a total of 32 apples and 12 oranges")
tts.say("\\emph=2\\ There is a total of 32 apples and 12 oranges")

#### Controlling end-of-sentence detection

: 오직 Nuance 패키지에서만 사용가능

=> text에 \\\eos=value\\\ 를 삽입한다. 가능한 값들로는 :

+ 0 : suppress a sentence break(no break)
+ 1 : force a sentence break(break)

> Warning : break를 유발하는 심볼 이후에 즉시 나타나야만 한다.

In [None]:
tts.say("Hello my friends.\\eos=0\\How are you ?") # no break
tts.say("Hello my friends.\\eos=1\\How are you ?") # break

#### Controlling the read mode
___
: 오직 Nuance 패키지에서만 사용가능

=> text에 \\\readmode=value\\\ 를 삽입한다. 가능한 값으로는:

+ sent : sentence mode (default)
+ char : Character mode (similar to spelling)
+ word : word-by-word 

In [None]:
tts.say("\\readmode=sent\\ Hello my friends")
tts.say("\\readmode=char\\ Hello my friends")
tts.say("\\readmode=word\\ Hello my friends")

#### Guiding text normalization

: 오직 Nuance 패키지에서만 사용가능

=> text에 \\\tn=value\\\ 를 삽입한다. 가능한 값으로는:

+ spell : 입력으로 들어오는 text를 speeling out 한다.
+ address : 입력으로 들어오는 text를 주소처럼 확장한다.
+ sms : 입력으로 들어오는 text를 sms 메세지 처럼 확장한다.
+ normal : 텍스트 normalization을 reset 한다.

In [None]:
tts.say("\\tn=address\ 244 Perryn Rd Ithaca, NY \\tn=normal\\ That’s spelled \\tn=spell\\ Ithaca \\tn=normal\\.")
tts.say("\\tn=sms\\ Carlo, can u give me a lift 2 Helena's house 2nite? David \\tn=normal\\")

#### setting the spelling pause duration

: 오직 Nuance 패키지에서만 사용가능

=> text에 \\\spell=value\\\ 를 삽입한다. 여기서 value는 msec 단위로 나타나며, 문자간 멈춤을 뜻함

In [None]:
tts.say("\\tn=spell\\hello")
tts.say("\\tn=spell\\\\spell=2000\\hello")

#### Inserting a digital audio recording

: 오직 Nuance 패키지에서만 사용가능

=> text에 \\\audio=path\\\ 를 삽입한다. 여기서 path는 로봇의 오디오 파일 경로이다.

Warning : 오디오 파일은 WAV파일(linear 16-bit PCM samples at 22050Hz) 이어야 한다. 

In [None]:
tts.say("\\audio=\"/usr/share/naoqi/wav/0.wav\"\\")

#### Inserting phonetic text

: 오직 Nuance 패키지에서만 사용가능

=> 기본적인 NUANCE 엔진은 입력을 정형 텍스트로 지원하지만, 다른 음성텍스트 또한 지원한다. \toi=value\ 태그에는 control절차 이후 시작하는 입력 유형을 표시한다.

+ lhp: 음성 알파벳 L&H+의 음성 텍스트 (Nuance specific alphabet).
+ orth: 정형적인 텍스트 (default)

Note : 만약 입력의 유형을 리셋하려고 한다면, 단어 이후에 \toi=orth\를 잊지말자.



In [None]:
tts.setLanguage("English")
tts.say("\\toi=lhp\\‘zi.R+o&U \\toi=orth\\")
# Same as
tts.say("zero")

#### Changing the style of the voice

: Nuance 중국어, 영어, 불어 패키지에서만 가능 => 정리 x