# Audiomodule

NAOs "Ohren" sind Lautsprecher.  

Seine vier omnidirektionalen Mikrofone befinden sich am Kopf (2 oberhalbt der Stirn, 2 am Hinterkopf.)

## ALTextToSpeech

Das Modul ALTextToSpeech ermöglicht es dem Roboter zu sprechen.   

Es sendet Befehle an eine Text-to-Speech-Engine und erlaubt auch die Anpassung der Stimme.  

Das Ergebnis der Synthese wird an die Lautsprecher des Roboters gesendet. 

Wurde die Session in der Zwischenzeit beendet, dann muss noch einmal das ALProxy-Modul importiert werden:

In [1]:
from naoqi import ALProxy

Zur Erinnerung: Der Aufbau für den Befehl, mit dem über ALProxy auf die Module zugegriffen wird, sieht folgendermaßen aus:  

**ALProxy(Modulname, IP-Adresse, Port)**  


In [2]:
# WAS? -> Modulname
tts = 'ALTextToSpeech'

In [3]:
# WER? -> NAO-Adresse
NAOIP = '169.254.30.252'     # IP-Adresse bei Bedarf erneut abrufen und ggf. korrigieren  

In [4]:
# WIE? -> Netzwerk-Port
PORT = 9559

Broker für ALRobotPosture:  

In [5]:
text = ALProxy(tts, NAOIP, PORT)

Um für die folgenden Methoden nicht jedesmal einen neuen Beispieltext eingeben zu müssen, werden hier die drei Übungstexte übergeben.  

In [6]:
mandela = "Nelson Mandela once said: The greatest glory in living lies not in never falling, but in rising every time we fall."
disney = "Walt Disney once said: The way to get started is to quit talking and begin doing."
mead = "Margret Mead once said: Always remember that you are absolutely unique. Just like everyone else."

### Methoden aufrufen

Mit unterschiedlichen „set“-Methoden lässt sich festlegen, *wie* der Text von NAO gesprochen wird.

#### setParameter  

**pitchShift**
- bewirkt eine Tonhöhenverschiebung 
- zulässiger Bereich: 1.0 – 4
- 0 schaltet Effekt aus


In [7]:
text.setParameter("pitchShift", 2.0)
text.say(mead)

In [8]:
text.setParameter("pitchShift", 0)
text.say(mead)

**speed**
- regelt Geschwindigkeit der Stimme
- Standardwert: 100
- zulässiger Bereich: 50 - 400


In [9]:
text.setParameter("speed", 50)
text.say(mandela)

In [10]:
text.setParameter("speed", 100)
text.say(mandela)

#### setVolume

- regelt die Sprachlautstärke
- Standardwert: 1.0


In [11]:
text.setVolume(0.3)
text.say(disney)

In [12]:
text.setVolume(1.0)
text.say(disney)

#### Tags  

Der Einsatz von Tags (im Format `\\tag=Wert\\`) erlaubt es, bestimmte Veränderungen der Stimme innerhalb eines Textes durchzuführen.

**Einstellung zurücksetzen: \\rst\\**
- setzt vorgenommene Änderungen zurück


**Tonhöhe wechseln: \\vct=value\\**
- Tonhöhenwert in Prozent
- Standardwert: 100
- zulässiger Bereich: 50 – 200


In [13]:
text.say("\\vct=50\\ Tell me and I forget. \\vct=200\\ Teach me and I remember. \\vct=100\\ Involve me and I learn.")

**Sprechgeschwindigkeit: \\rspd=value\\**
- Geschwindigkeit in Prozent
- Standardwert: 100
- zulässiger Bereich: 50 – 400


In [14]:
text.say("The speed of communications is wondrous to behold. It is also true that speed can \\rspd=300\\ multiply the distribution of information that we know \\rst\\ to be untrue.")

**Sprechpausen: \\pau=value\\**
- Dauer in Millisekunden


In [15]:
text.say("Comedy is all about \\pau=2000\\ the pause.")

---

### Übung
  
Lassen Sie Nao das Gedicht "I'm a little Teapot" von *George Harold Sanders* aufsagen.  
Achten Sie auf die rhythmischen Pausen und versuchen Sie, die direkte Rede hörbar umzusetzen. 

I’m a little teapot <br>
Short and stout <br>
Here is my handle <br>
Here is my spout <br>

When I get all steamed up <br>
Hear me shout <br>
“Tip me over <br>
and pour me out!” <br>

I’m a clever teapot, <br>
Yes, it’s true <br>
Here let me show you <br>
What I can do <br>

I can change my handle <br>
And my spout <br>
Just tip me over and pour me out! <br>

In [None]:
text.say("...")

---

## ALAnimatedSpeech

Dieses Modul fügt dem Roboter beim Sprechen Gestik hinzu.  

Die Bewegungen können entweder zufällig oder kontextuell sein, aber auch ganz deaktiviert werden.  

Die mittels `^mode` übergebenen Befehle gelten jeweils nur für den betreffenden Text und wirken sich nicht global aus. Als Standard bewegt sich Nao kontextuell.  

**^mode(disabled, random, contextual)**


Erstellen des Brokers für dieses Modul: 

In [16]:
asp = "ALAnimatedSpeech"
ansp = ALProxy(asp, NAOIP, PORT)

In [17]:
ansp.say("Hello, ^mode(disabled) I don't need to move the whole time, ^mode(contextual) but I can.")

-----

### Übung
  
Kopieren Sie sich Ihre Version des Gedichts aus der vorherigen Übung in die folgende Codezeile.  
Führen Sie sie nun mit den drei möglichen Einstellmodi für die Bewegungen aus.  

Wie wirkt sich die jeweilige Gestik auf die Darstellung aus?

In [None]:
text.say("^mode(disabled)...")

In [None]:
text.say("^mode(random)...")

In [None]:
text.say("^mode(contextual)...")

----