# 短语音识别组件

## 目标
使用短语音识别组件对输入的语音文件进行识别，返回识别的文字。

## 准备工作
### 平台注册
1.先在appbuilder平台注册，获取token

2.安装appbuilder-sdk

In [None]:
!pip install appbuilder-sdk

## 基本用法

### 快速开始

下面是短语音识别的代码示例：

In [None]:
import os
import requests
import appbuilder
# 设置环境变量和初始化
# 请前往千帆AppBuilder官网创建密钥，流程详见：https://cloud.baidu.com/doc/AppBuilder/s/Olq6grrt6#1%E3%80%81%E5%88%9B%E5%BB%BA%E5%AF%86%E9%92%A5
os.environ["APPBUILDER_TOKEN"] = "..."

asr = appbuilder.ASR()

audio_file_url = "https://bj.bcebos.com/v1/appbuilder/asr_test.pcm?authorization=bce-auth-v1" \
                   "%2FALTAKGa8m4qCUasgoljdEDAzLm%2F2024-01-11T10%3A56%3A41Z%2F-1%2Fhost" \
                   "%2Fa6c4d2ca8a3f0259f4cae8ae3fa98a9f75afde1a063eaec04847c99ab7d1e411"
audio_data = requests.get(audio_file_url).content
content_data = {"audio_format": "pcm", "raw_audio": audio_data, "rate": 16000}
msg = appbuilder.Message(content_data)
out = asr.run(msg)
print(out.content)

## 参数说明

### 鉴权配置
使用组件之前，请首先申请并设置鉴权参数，可参考[组件使用流程](https://cloud.baidu.com/doc/AppBuilder/s/Olq6grrt6#1%E3%80%81%E5%88%9B%E5%BB%BA%E5%AF%86%E9%92%A5)。
```python
# 设置环境中的TOKEN，以下示例略
os.environ["APPBUILDER_TOKEN"] = "bce-YOURTOKEN"
```

### 初始化参数

无

### 调用参数

|参数名称 |参数类型 |是否必须 |描述 | 示例值    |
|--------|--------|--------|----|--------|
|message |String  |是 |输入的消息，用于模型的主要输入内容。这是一个必需的参数| Message(content={"raw_audio": b"..."}) |
|audio_format|String|是 |定义语言文件的格式，包括"pcm"、"wav"、"amr"、"m4a"，默认值为"pcm"| pcm    |
|rate|Integer|是 |定义录音采样率，固定值16000| 16000  |
|timeout| Float   | 否    | HTTP超时时间,单位：秒               |1|
|retry|Integer|是 |HTTP重试次数| 3      |

### 响应参数
|参数名称 | 参数类型         |描述 |示例值|
|--------|--------------|----|------|
|result  | List[String] |返回结果|["北京科技馆。"]|

### 响应示例
```json
{"result": ["北京科技馆。"]}
```
### 错误码
| 错误码 |描述|
|---|---|
| 0 |success|
| 2000  |data empty|