开发原型时间: maixpy3 0.4.0 以上
预计开发时间: 已完成,等待 release 合并。
开发目标:可以学习的语音识别,比较适合实际的固定场景。
https://github.com/junhuanchen/speech-recognition
linux 通用的简易 VAD + MFCC 关键词识别,使用方法如下:
- 输入 n 等待人说话,输入序号保存录音。
- 输入 l 查看 waves words 目录下保存的语音段。
- 输入 d 后说话,给出识别的保存的语音段可能的结果。
- 输入 e 退出。
<iframe src="//player.bilibili.com/player.html?aid=585184775&bvid=BV1oz4y1C7yE&cid=251878910&page=1" scrolling="no" border="0" frameborder="no" framespacing="0" allowfullscreen="true"> </iframe>
<iframe src="//player.bilibili.com/player.html?aid=500528923&bvid=BV1xK41137Rv&cid=263534446&page=1" scrolling="no" border="0" frameborder="no" framespacing="0" allowfullscreen="true"> </iframe>