Soundar - Map the World with Sound

使用 MLP, Polynomial Regression Model 等多種模型進行 DOA (音源方位角度) 的預測，並且使用 Lasso Regression Model 進行距離的預測。

專題特色

雙聲道定位模式，取代以往使用多麥克風陣列定位方式
更容易應用於貼身裝置(耳機、助聽器等)
預測角度的準確率高

Application

協助失聰人士注意潛在的突發威脅
在自動化產線中輔助偵測機械故障
仿生機器人/機器動物的聽覺系統
應用於保全系統中提供更完善的監控能力

Dataset

總共使用六種音源所生成的 dataset: sin wave of 130.81, 261.63, 1046.5, ambulance noice, gunshot, fart
每個 dataset 的形式
- $R=1\sim 30$, 公差 $0.5$
- $degree=0,5,10,15,\cdots,175,180$

機器學習模型

DOA 預測

Feature: ITD, ILD
Ouput: DOA
選用模型：MLP, Polynomial Regression, GMM(用於檢驗)

距離預測

Feature: DOA, ITD, ILD, 方均根能量
Output: R (距離)
選用模型：lasso

ITD, ILD 數據分佈圖，不同顏色為不同角度

Result

MLP 預測 DOA 結果展現

Polynomial Regression 預測 DOA 結果展現

直角坐標預測結果

Name		Name	Last commit message	Last commit date
Latest commit History 47 Commits
data		data
dataset		dataset
slide/icons		slide/icons
sound generator		sound generator
src.old		src.old
src		src
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Soundar - Map the World with Sound

專題特色

Application

Dataset

機器學習模型

DOA 預測

距離預測

Result

About

Contributors 2

Languages

ooyang0325/soundar

Folders and files

Latest commit

History

Repository files navigation

Soundar - Map the World with Sound

專題特色

Application

Dataset

機器學習模型

DOA 預測

距離預測

Result

About

Topics

Resources

Stars

Watchers

Forks

Contributors 2

Languages