# 语音控制

- 文本到语音
- 语音播放

## 使用 simpleaudio播放wav文件

<https://simpleaudio.readthedocs.io/en/latest/tutorial.html>

使用pip安装：
```sh
pip install simpleaudio
```

In [None]:
import simpleaudio as sa

从一个wav文件中创建`WaveObject`对象：

In [None]:
wavfile = 'audio.wav'
wave_obj = sa.WaveObject.from_wave_file(wavfile)

调用`play()`返回一个`PlayObject `对象

In [None]:
play_obj = wave_obj.play()

等待结束

In [None]:
play_obj.wait_done()

In [None]:
使用定义函数：

In [None]:
import simpleaudio as sa

def playwavfile(wavfile):
    "使用simpleaudio播放wav文件"
    wave_obj = sa.WaveObject.from_wave_file(wavfile)
    play_obj = wave_obj.play()
    play_obj.wait_done()    

In [None]:
playwavfile(wavfile)

## 文本到语音

语音识别与语音合成中，只有百度是免费的。

### 注册并登录百度语音

<https://cloud.baidu.com/>

选择【人工智能】 =》【百度语音 】 ，然后创建新应用。

### 获得用户Key

- AppID
- API Key
- Secret Key

### 安装Python SDK客户

```
pip install baidu-aip
```

### 语音合成

新建AipSpeech

AipSpeech是语音合成的Python SDK客户端，为使用语音合成的开发人员提供了一系列的交互方法。

```
from aip import AipSpeech

""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
```

请求说明
合成文本长度必须小于1024字节，如果本文长度较长，可以采用多次请求的方式。文本长度不可超过限制
举例，要把一段文字合成为语音文件：

```python
result  = client.synthesis('你好百度', 'zh', 1, {
    'vol': 5,
})

# 识别正确返回语音二进制 错误则返回dict 参照下面错误码
if not isinstance(result, dict):
    with open('auido.mp3', 'wb') as f:
        f.write(result)
```        

## 使用类来实现百度语音

- per 发音人选择  
0为女声，1为男声，3为情感合成-度逍遥，4为情感合成-度丫丫，默认为普通女

In [None]:
from aip import AipSpeech


class BaiduAiVoice():
    """百度语音"""
    def __init__(self, aue=6, speed=5, vol=5, per='0'):
        APP_ID = 'xxx'
        API_KEY = 'xxxx'
        SECRET_KEY = 'xxxx'
        self.options = {'aue': aue, 'vol': vol, 'spd': speed, 'per': per}
        self.wavfile = 'baidu_audio.wav'
        self.client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)    
        
    def speak(self, text):
        """文本播放"""
        wavfile = self.__synthesis(text, self.wavfile)
        if wavfile is not None:
            playwavfile(wavfile)
            
    def print(self, *args, sep=' ', end='\n'):
        """显示并播放文本"""
        print(*args, sep=sep, end=end)
        text = sep.join([str(arg) for arg in args])
        self.speak(text)
            
    def input(self, text):
        """输入并播放"""
        self.speak(text)
        return input(text)
        
    def __synthesis(self, text, voicefile, lang='zh'):
        """语音合成"""
        result = self.client.synthesis(text, lang=lang, options=self.options)
        if not isinstance(result, dict):
            with open(voicefile, 'wb') as fh:
                fh.write(result)
            return voicefile
        else:
            return None    

In [None]:
xiaobai = BaiduAiVoice()
xiaobai.speak('欢迎来到猜数字游戏')    