使用 MLP, Polynomial Regression Model 等多種模型進行 DOA (音源方位角度) 的預測,並且使用 Lasso Regression Model 進行距離的預測。
- 雙聲道定位模式,取代以往使用多麥克風陣列定位方式
- 更容易應用於貼身裝置(耳機、助聽器等)
- 預測角度的準確率高
- 協助失聰人士注意潛在的突發威脅
- 在自動化產線中輔助偵測機械故障
- 仿生機器人/機器動物的聽覺系統
- 應用於保全系統中提供更完善的監控能力
- 總共使用六種音源所生成的 dataset: sin wave of 130.81, 261.63, 1046.5, ambulance noice, gunshot, fart
- 每個 dataset 的形式
-
$R=1\sim 30$ , 公差$0.5$ -
$degree=0,5,10,15,\cdots,175,180$
-
- Feature: ITD, ILD
- Ouput: DOA
- 選用模型:MLP, Polynomial Regression, GMM(用於檢驗)
- Feature: DOA, ITD, ILD, 方均根能量
- Output: R (距離)
- 選用模型:lasso
Polynomial Regression 預測 DOA 結果展現