We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
https://github.com/snakers4/silero-vad
The text was updated successfully, but these errors were encountered:
voice activity detection。webrtc vadよりも高性能らしい。 openai/whisper#29
Sorry, something went wrong.
リポジトリにONNXファイルが含まれている。
SileroVADの処理フロー
入力された音声をモノラルの16kHzに変換 PCMのレンジは+-1.0
waveを1536サンプルごとのチャンクに分割 onnxのinputにpcm、hとcにステート、srにサンプリングレートを入力 推論結果はspeech_prob, h, c
speech_probはchunkの無音でない確率が入る hとcはステートとして次のチャンクに供給する
hとcのステートは初期値0、(2, batch, 64)次元
get_speech_timestampsでは、threshold = 0.5以上で無音でないと判定している。 250ms以上、有音区間が続いた場合は有音としている。 100ms以上、無音区間が続いた場合は無音としている。
kyakuno
No branches or pull requests
https://github.com/snakers4/silero-vad
The text was updated successfully, but these errors were encountered: