このライブラリは、ESP32およびESP32-S3を対象として音声認識に関連する機能を提供します。以下の主な機能が含まれています:
- Voice Activity Detection (VAD) 音声信号内の音声が存在する区間を検出します。
- MFCC (Mel-frequency cepstral coefficients) の計算 音声信号からMFCCを抽出します。
- DTW (Dynamic Time Warping) を使用した距離計算 2つのMFCCの系列間の距離を計算します。
このライブラリを使用することで、音声データの前処理や音声特徴の抽出、音声データの比較などを行うことができます。
このライブラリはMITライセンスの下で公開されています。詳細については、LICENSEファイルを参照してください。