如题,想用这个vad做语音助手,语音是来自麦克风的PCM流式音频,20ms一帧一发,我看fireredvad的样例,都是基于.wav的音频文件。 还有,麦克风不一样,收音效果也不一样,音频增益不一样,分贝也不一样,那fireredvad是否能自适应支持所有情况啊?
如题,想用这个vad做语音助手,语音是来自麦克风的PCM流式音频,20ms一帧一发,我看fireredvad的样例,都是基于.wav的音频文件。
还有,麦克风不一样,收音效果也不一样,音频增益不一样,分贝也不一样,那fireredvad是否能自适应支持所有情况啊?