每间隔10°进行一次语音信号采集,阵列采用线性阵列,阵列间隔为5cm,阵元个数为6,其中声源为AISHELL语料库混合语句,选取其中的600条语句作为实验响应声源,噪音采用高斯白噪声,利用RIR工具进行环境仿真。RIR是较为理想的关于阵列信号处理且常用的仿真工具。 房间大小345。由于数据并不统一整齐,需要对数据进行批处理,进行拼接裁切。
裁剪拼接策略为:
- 将600条语音数据进行两两随机拼接,形成新的语音数据500个。
- 将新的500条数据进行对齐裁剪,统一裁剪为6s的数据。
- 选取其中的100条作为RIR响应数据。
代码说明 data_yu.m 是数据预处理代码。