setk/doc/adaptive_beamformer at master · funcwj/setk

History

Name		Name	Last commit message	Last commit date
parent directory ..
asset		asset
README.md		README.md

README.md

Adaptive Beamformer

Implementation of the mask-based adaptive beamformer (MVDR, GEVD, MCWF).

Cmd options

See ./scripts/sptk/apply_adaptive_beamformer.py -h.

Usage

echo "egs asset/egs.wav" > wav.scp
# estimate TF-masks
../../scripts/sptk/estimate_cgmm_masks.py \
    --frame-len 512 \
    --frame-hop 256 \
    --num-iters 20 \
    wav.scp mask
# visualize and check
../../scripts/sptk/visualize_tf_matrix.py \
    --input dir \
    --cmap binary \
    --frame-hop 256 \
    mask
echo "egs mask/egs.npy" > mask.scp
# mvdr
../../scripts/sptk/apply_adaptive_beamformer.py \
    --frame-len 512 \
    --frame-hop 256 \
    --mask-format numpy \
    --beamformer mvdr \
    wav.scp mask.scp mvdr
# gevd
../../scripts/sptk/apply_adaptive_beamformer.py \
    --frame-len 512 \
    --frame-hop 256 \
    --mask-format numpy \
    --beamformer gevd \
    wav.scp mask.scp gevd
# gevd-ban
../../scripts/sptk/apply_adaptive_beamformer.py \
    --frame-len 512 \
    --frame-hop 256 \
    --mask-format numpy \
    --beamformer gevd \
    --ban true
    wav.scp mask.scp gevd-ban
# pmwf-0
../../scripts/sptk/apply_adaptive_beamformer.py \
    --frame-len 512 \
    --frame-hop 256 \
    --mask-format numpy \
    --beamformer pmwf-0 \
    wav.scp mask.scp pmwf-0
# pmwf-0-eig
../../scripts/sptk/apply_adaptive_beamformer.py \
    --frame-len 512 \
    --frame-hop 256 \
    --mask-format numpy \
    --beamformer pmwf-0 \
    --rank1-appro eig \
    wav.scp mask.scp pmwf-0
# pmwf-0-gev
../../scripts/sptk/apply_adaptive_beamformer.py \
    --frame-len 512 \
    --frame-hop 256 \
    --mask-format numpy \
    --beamformer pmwf-0 \
    --rank1-appro gev \
    wav.scp mask.scp pmwf-0-gev

Reference

J. Heymann, L. Drude, R. Haeb-Umbach. Neural Network Based Spectral Mask Estimation for Acoustic Beamforming[C]. 2016 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2016:196–200.
Erdogan H, Hershey J R, Watanabe S, et al. Improved MVDR Beamforming Using Single-Channel Mask Prediction Networks[C]//Interspeech. 2016: 1981-1985.
Souden M, Benesty J, Affes S. On optimal frequency-domain multichannel linear filtering for noise reduction[J]. IEEE Transactions on audio, speech, and language processing, 2010, 18(2): 260-276.
E. Warsitz, R. Haeb-Umbach. Blind Acoustic Beamforming Based on Generalized Eigenvalue Decomposition[J]. IEEE Transactions on audio, speech, and language processing, 2007, 15(5):1529–1539.
Ziteng Wang, Emmanuel Vincent, Romain Serizel, and Yonghong Yan, “Rank-1 Constrained Multichannel Wiener Filter for Speech Recognition in Noisy Environments,” Jul 2017.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

adaptive_beamformer

adaptive_beamformer

README.md

Adaptive Beamformer

Cmd options

Usage

Reference

Files

adaptive_beamformer

Directory actions

More options

Directory actions

More options

Latest commit

History

adaptive_beamformer

Folders and files

parent directory

README.md

Adaptive Beamformer

Cmd options

Usage

Reference