Speaker Recognition from Raw Waveform with SincNet #929

icoxfog417 · 2018-09-14T01:29:04Z

一言でいうと

音声を処理するCNNで、生の音声を処理する1層目を意図的にバンドパスフィルタを模すことで(フィルタする周波数領域は学習させるようにする)話者特定の精度と速度を上げた研究。具体的にはHamming windowをかけてFFT=>フィルタ適用=>逆FFTで元に戻す(窓関数は他のでもあまり大差ないらしい)。

論文リンク

https://arxiv.org/abs/1808.00158

著者/所属機関

Mirco Ravanelli, Yoshua Bengio

Mila, Universite de Montreal
CIFAR Fellow

投稿日付(yyyy/MM/dd)

2018/7/29

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Speaker Recognition from Raw Waveform with SincNet #929

Speaker Recognition from Raw Waveform with SincNet #929

icoxfog417 commented Sep 14, 2018

Speaker Recognition from Raw Waveform with SincNet #929

Speaker Recognition from Raw Waveform with SincNet #929

Comments

icoxfog417 commented Sep 14, 2018

一言でいうと

論文リンク

著者/所属機関

投稿日付(yyyy/MM/dd)

概要

新規性・差分

手法

結果

コメント