-
初始化接口变更,增加dsn参数,初始化必传
-
支持切灰度环境
-
增加OneShot接口,支持唤醒和语音指令连续输入
-
支持两种音频输入方式,单通道输入(OneShot接口)和双通道输入(Wakeup接口和VoiceOnline接口)
-
优化微信账号刷票逻辑,手机端重新登录后SDK自动刷票
-
支持独立的vad检查(只检查vad不识别结果)
-
语义结果中增加语义识别返回码
-
支持初始化时重置语义上下文
-
优化push通道逻辑
-
修复已知问题
-
支持本地VAD,使用需额外提供动态库和模型
-
支持媒体播放状态和进度上报
-
扩展语义实体,支持UNIT、CONFIRM实体
-
支持媒体播放状态和进度上报
-
修复进程退出时线程资源释放异常
-
修复一些已知问题
-
支持语音识别、语义识别、语音合成单接口全流程的能力
-
支持音量上报和云端音量控制
-
精简语义数据的JSON数据大小
-
增加请求丢包重试
-
增加接入AppKey和AccessToken非空验证
-
增加终端状态上报接口,例如终端可上报闹钟状态
-
增加票据失效回调,接入方可据此提醒用户重新授权
-
增加接口给接入方设置productID和DSN
-
支持本地DNS缓存
-
增加设备手机通信模块,支持设备扫描、手机绑定功能
-
增加上报关系接口
-
增加获取ClientId形式的账户信息,修复账户模块bug
-
支持明确意图携带CMD信息
-
修复已知bug
-
支持TTS设置音量大小
-
语义服务返回数据增加后台语义JSON字段
-
数据返回增加debug字段,用于返回耗时信息
-
支持语音、语义服务、TTS分别设置环境
-
增加账号相关接口
- 支持设置TTS角色类型
-
兼容后台配置TTS类型
-
减少日志打印
-
唤醒库更新
- 修复iOS编译问题
-
修复已知bug
-
优化语音识别速度
- 修复已知bug
- 增加候选语义返回
- 自动模式下,调用aisdkStopOnlineVoice2Text(),返回结果
- 支持毫秒级日志打印、支持保存语音录音(可选项)
- 增加设备扫描功能,账号绑定功能
- 增加push系统
-
语义识别增加speak_tips字段
-
解决弱网络下的crash问题
-
返回数据增加end字段,提醒底层已经不再持有userdata
-
在线TTS支持多请求
-
修复若干bug
- 优化语音识别速度
- 修复TTS分词bug
-
初始版本发布,提供Linux平台语音交互的基础能力
-
功能列表
- 在线语音识别
- 自动检测说话结束模式
- 手动结束说话模式
- 在线语义理解
- 在线语音合成
- 流式返回
- 离线唤醒
- 包括默认
叮当叮当
唤醒词模型文件
- 包括默认
- 离线语音识别
- 离线语义理解
- 在线语音识别
-
Docs:
- 接入说明文档
- API说明文档
- 语义返回结构说明文档
- 领域服务数据示例文档
-
Sample
- 提供所有接口的接入示例代码